由于V100云主机采用了NVIDIA的Volta架构,提供了高达5120个CUDA核心和640个Tensor核心,这些核心能够并行处理大量的计算任务,极大提高了性能。
V100显卡拥有640个Tensor核心,专为深度学习而设计,能够提供高达125 TeraFLOPS的深度学习性能,与前代Pascal GPU相比,深度学习训练性能提升了12倍。
V100服务器支持的NVLink高速互连总线提供了更高的带宽和更好的多GPU及多GPU/CPU系统配置的可扩展性,最高支持300 GB/秒的总带宽。
V100显卡配备了16GB或32GB的HBM2显存,提供了900 GB/秒的显存带宽,相比前代Pascal GPU提高了1.5倍,同时具有高内存带宽利用率。
V100显卡Volta架构中的新特性,提高了多个计算应用共享GPU时的性能、隔离度和服务质量(QoS),最大MPS客户端数量从Pascal的16个增加到48个。
V100 GPU 在最大性能模式下运行时,可提供高达80%的性能而只需一半的功耗,提供了优秀的性能每瓦特性,有助于数据中心在现有功耗预算内提升计算能力。