华为云GPU加速云服务器 GACS 介绍

华为云GPU加速云服务器(GPU Accelerated Cloud Server, GACS)能够提供优秀的浮点计算能力,从容应对高实时、高并发的海量计算场景。该服务主要分为P系列和G系列两个大类。P系列适合于深度学习,科学计算,CAE等;G系列适合于3D动画渲染,CAD等。

华为云GPU加速云服务器 GACS产品优势

  • 灵活多样:G系列G3/G1提供多种显存,满足图形图像场景。P系列提供P2v/P1/Pi1实例,满足科学计算、深度学习训练、推理等计算场景
  • 生态优秀:完善的生态环境,全面支持多种GPU应用程序、深度学习框架。G系列支持OpenGL、DirectX;P系列支持CUDA、OpenCL
  • 简单易用:一键式获取各类图形工作站、超算应用和深度学习框架、计算集群,让您真正聚焦于核心业务
  • 高性价比:同步业界最新GPU技术,无缝切换最新GPU硬件;支持按需和包周期计费模式,即租即用、弹性扩展

华为云GPU加速云服务器 GACS典型应用场景

(一)人工智能应用

GPU包含上千个计算单元,在并行计算方面展示出强大的优势,P1、P2v实例针对深度学习特殊优化,可在短时间内完成海量计算;Pi1实例整型计算时延低,可支持35路高清视频解码与实时AI推理。

  • GPU Direct:完美支撑大数据在神经网络间传输
  • 100GB IB网络:支持GPU Direct over RDMA,100G超高带宽, 2us超低时延
  • 内置加速框架:一键式部署,分钟级实例发放,聚焦核心业务

(二)科学计算

在科学计算领域,要求极强的双精度计算能力。在模拟仿真过程中,消耗大量计算资源的同时,会产生大量临时数据,对存储带宽与时延也有极高的要求。

  • NVMe SSD:最高68万IOPS,消除存储瓶颈,提升整体性能
  • 双精度计算:提供较CPU上百倍的双精度计算能力
  • 无缝迁移:支持多种科学计算软件

(三)图形工作站

提供专业级CAD、视频渲染、图形处理所需的强大计算能力

  • 高性能:性能较普通GPU能够提升数十倍以上
  • 专业硬件:采用数据中心级M60 GPU,完整支持图形工作站接口
附表:华为云GPU加速云服务器实例清单

类别

实例

GPU显卡

单卡Cuda Core数量

单卡GPU性能

使用场景

备注

图形加速型

G6v

NVIDIA T4(vGPU虚拟化)

2560

  • 8.1TFLOPS 单精度浮点计算
  • 130INT8 TOPS
  • 260INT4 TOPS

云桌面、图像渲染、3D可视化、重载图形设计。

无法通过云服务器控制台“远程登录”,请使用VNC或第三方VDI协议

图形加速型

G6

NVIDIA T4(GPU直通)

2560

  • 8.1TFLOPS 单精度浮点计算
  • 130INT8 TOPS
  • 260INT4 TOPS

云桌面、图像渲染、3D可视化、重载图形设计。

无法通过云服务器控制台“远程登录”,请使用VNC或第三方VDI协议

图形加速型

G5

NVIDIA V100(GPU直通)

5120

  • 14TFLOPS 单精度浮点计算
  • 7TFLOPS 双精度浮点计算
  • 112TFLOPS Tensor Core 深度学习加速

云桌面、图像渲染、3D可视化、重载图形设计。

无法通过云服务器控制台“远程登录”,请使用VNC或第三方VDI协议

图形加速型

G3

NVIDIA M60(GPU直通)

2048

4.8TFLOPS单精度浮点计算

云桌面、图像渲染、3D可视化、重载图形设计。

无法通过云服务器控制台“远程登录”,请使用VNC或第三方VDI协议

图形加速型

G1

NVIDIA M60(GPU虚拟化)

2048

4.8TFLOPS单精度浮点计算

云桌面、图像渲染、3D可视化、重载图形设计。

G1实例中g1.2xlarge.8规格使用的是GPU直通,无法通过云服务器控制台“远程登录”,请使用VNC或第三方VDI协议

计算加速型

P2vs

NVIDIA V100 NVLink 32G显存(GPU直通)

5120

  • 15.7TFLOPS 单精度浮点计算
  • 7.8TFLOPS 双精度浮点计算
  • 125TFLOPS Tensor Core 深度学习加速
  • 300GiB/s NVLINK

机器学习、深度学习、训练推理、科学计算、地震分析、计算金融学、渲染、多媒体编解码。

计算加速型

P2v

NVIDIA V100 NVLink(GPU直通)

5120

  • 15.7TFLOPS 单精度浮点计算
  • 7.8TFLOPS 双精度浮点计算
  • 125TFLOPS Tensor Core 深度学习加速
  • 300GiB/s NVLINK

机器学习、深度学习、训练推理、科学计算、地震分析、计算金融学、渲染、多媒体编解码。

计算加速型

P1

NVIDIA P100(GPU直通)

2584

9.3 TFLOPS 单精度浮点计算

机器学习、深度学习、训练推理、科学计算、地震分析、计算金融学、渲染、多媒体编解码。

配备本地NVMe SSD磁盘,按需购买关机收费

推理加速型

Pi2

NVIDIA T4(GPU直通)

2560

  • 8.1TFLOPS 单精度浮点计算
  • 130INT8 TOPS
  • 260INT4 TOPS

机器学习、深度学习、训练推理、科学计算、地震分析、计算金融学、渲染、多媒体编解码。

推理加速型

Pi1

NVIDIA P4(GPU直通)

2560

5.5TFLOPS 单精度浮点计算

机器学习、深度学习、训练推理、科学计算、地震分析、计算金融学、渲染、多媒体编解码。

数据来源:华为云-GPU加速服务器

给个意见吧(:

您的电子邮箱地址不会被公开。