互联网

·

渲云GPU渲染全面升级!Tesla P40上线专享非凡体验

锌媒体报道

在人工智能和智能机器新时代,随着模型的准确性和复杂性越来越高,CPU已经无法再提供互动用户体验,GPU作为人工智能新时代的计算引擎,可加快大规模深度学习应用程序的速度,提供卓越的用户体验。

 一个值得三维设计师击掌同乐的消息:渲云GPU渲染服务(http://www.xrender.com)将全面配备NVIDIA Tesla P40,可部署提供更大的吞吐量。每个GPU可带来47TOPS(万亿次运算/秒)的推理性能和INT8运算能力,使得一台配备8个Tesla P40的服务器可提供相当于超过140台CPU服务器的性能。Tesla P40 可在极其复杂的模型中实现实时响应,能够降低延迟,将性能提升为CPU的30倍以上。

TESLA P40加速器产品特点

 140倍吞吐量应对爆炸性数据

 Tesla P40配备新的Pascal架构,可带来超过47 TOPS的深度学习推理性能。在处理深度学习工作负载方面,一台使用8个Tesla P40服务器可替代140台只使用CPU的服务器,因而可以大幅提升吞吐量并降低购买成本。

单一训练和推理平台简化了操作

目前,深度学习模型在 GPU 服务器上接受训练,但在 CPU 服务器上部署,以便进行推理。Tesla P40 提供极简工作流程,因此组织可以使用相同的服务器进行迭代和部署。

强悍的实时推理能力

 Tesla P40具备INT8运算能力,可在极其复杂的深度学习模型中实现实时响应,能将推理性能速度提升高达30倍。

超高显存配备及性能

 密集型计算应用需要高性能计算单元,同时高速访问数据也非常重要。在很多HPC应用中,简单的提升HPC计算性能实际计算效率并不明显,除非显存性能也同时提升。基于这个原因,Tesla P40提供了更好的性能及显存规格,24GB,带宽346 GB/s,无论是在显存容量,还是显存频率上,都是远超同类产品。

对于消费级用户来说,GPU就是玩游戏。对于专业人员来说,GPU是计算工具。NVIDIA 针对消费级用户设计GeForce系列产品,针对专业领域企业级用户设计Tesla系列产品。与同类型产品相较,Tesla P40有哪些优势?

Tesla P40 与同类型产品比较

Tesla P40 VS GeForce 1080Ti

1、错误检测和纠正,术业有专攻

 在计算领域,非常依赖于GPU返回数据的准确性,即使内存出现单比特错误也可能导致计算结果的极大误差。Tesla P40不仅能检测并纠正单比特错误也可以发现并警告双比特错误,这对保证计算结果的精准性来说非常重要。

2、显存性能及配备高人一等

 系统内存越多,运行速度越快。尤其对于某些HPC应用程序来说,内存不够甚至不能执行单次运行。GeForce显卡只能提供12GB显存,而Tesla P40 GPU可提供2倍显存——24GB,这对GPU执行深度学习运算时使用更大的框架提供了支持。

3、双DMA引擎,赢在起跑线

 GeForce产品一般只有单个DMA引擎,Tesla GPU产品采用双DMA引擎,数据可以在CPU和GPU之间同时输入和输出,无需等待,效率更高。

4、64-bit双精度浮点运算

 P40拥有双精度浮点运算能力,对于专业领域来说,准确性是计算结果的重要指标,Tesla与GeForce的双精度浮点运算能力相差十几倍之多。 




向作者提问

  • 最新评论

游客
验证码: 点击我更换图片
全部评论