Azure上带GPU的虚拟机的性能
想做深度学习一定会遇到的问题就是 GPU 的性能和选择问题。 在 Azure 上面N系列的虚拟机是带 GPU 的。2016年12月1日正式发布的是 NC 系列的虚拟机。新的 NCv2 和 ND 系列虚拟机即将发布。NCv3 系列在测试阶段,可以在网页上申请测试 New NVIDIA GPUs coming to Azure accelerate HPC and AI workloads。 在 Azure 中国,NCv2 系列的虚拟机也会在不远的将来发布。这里我就简单记录和对比下几块显卡的性能,给大家一个直观性能的参考吧。
Azure 虚拟机 | GPU 型号 | FLOPS |
---|---|---|
NONE | Geforce GTX 1080 Ti | 10T |
NC | K80 | 5T |
ND | P40 | 10T |
NCv2 | P100 | 10T |
NCv3 | V100 | 15T |
DSv2 | Intel Xeon® E5-2673 v3 (Haswell) | 500G |
注意:
- 上表列的是一个近似值,用于简单估算的。
- 一般可以用 单精度的 FLOPS (Floating-point operations per second,是每秒所执行的浮点运算次数) 来简单评估计算性能。这里没有考虑其它因素的影响,比如显存。显存对深度计算也很重要,影响到能加载的模型大小和 mini-batch 大小等。
- 数据的来源详见参考[4],[5]。同时参考[6]也验证了 P100 和 1080 的性能在一个数量级上。
- 由于 V100 采用新一代的 GPU 架构 (NVIDIA Volta),实际性能是 P100 的 2.5 倍左右。(详见参考7)
参考
- 每秒浮点运算次数
- Azure N-Series: General availability on December 1
- New NVIDIA GPUs coming to Azure accelerate HPC and AI workloads
- Intel Xeon E5-2600 v3 “Haswell” Processor Review
- List of Nvidia graphics processing units
- A Comparison between NVIDIA’s GeForce GTX 1080 and Tesla P100 for Deep Learning
- Tesla V100