Volta架构相较于前一代Pascal架构,在双精度浮点数计算效能上提升了 1.5倍,在人工智能计算效能上提升了 12倍。此外,Volta架构的每个SM(Streaming Multiprocessor)中新增了8个Tensor Core,使得在训练和决策加速方面分别提升了12倍和6倍。
具体到产品,采用Volta架构的首款产品是NVIDIA Xavier SOC,与P100相比,在TDP同为300W的情况下,单精度浮点运算性能提升了41.5%,实际HPC应用性能提升了40-70%,而深度学习方面的性能更是可以达到P100的12倍。
综合来看,Volta架构在性能和能效比方面都有显著提升,特别是在深度学习和人工智能领域,其性能提升非常显著。
文章评论