1、V-Ray
2、RedShift
3、Octane Render
4、Maxwell Renderer
5、Iray
读图:
1、Nvidia的官方网站提供了上述渲染器的性能柱状图,可以看出在单路显卡的情况下,无论是台式工作站还是笔记本工作站,随着Quadro显卡的规格提升,性能的提升大都比较接近线性。
2、Quadro GV100比Quadro GP100的表现显著更好、Quadro GP100也比Quadro P6000的表现明显更好。
3、两路Quadro GP100/GV100相对单路带来的提升并没有达到接近两倍的水平。
可能的猜测(欢迎补充):
1、GP100的sp性能也高于GP102/104/106/107/108不少。
2、由以上结果及猜测1可以推出说法“GV100与GV102/104/106/107/108的架构存在较多不一致”并非不可能,也就是说我们可以期待TITAN V的游戏性能不是Volta架构能达到的上限。
展望:
1、在多卡互联的效率上,NVLink并不尽如人意。这点仍然有改进空间。
在DGX-2中,NVIDIA使用了12块NVSwitch芯片,尝试将DGX-2的16块Tesla V100(32GB)的多卡效率逼近100%。但是单个NVSwitch芯片的功耗可以达到100W,12块就有整整1200W,DGX-2的整机功耗也跃升到了标称10kW。
随着时代的发展,智慧城市、自动驾驶、机器学习、科学计算等等需要使用越来越大规模的计算机集群。我们希望更多的能源被用于执行计算任务和图形任务,而不是被互连消耗。因此Nvidia仍然需要下功夫令多卡互连的过程损耗尽可能少的电力。
2、这是GTX 1080的CUDA-Z评测结果:
GV100/GP100 SM结构对比:
GV100已经引入了专门的Int单元,规模与FP32单元相当。相信整数性能一定会有惊人的提高。后续架构也有望更进一步使整数性能增强。GV102/104/106/107会不会也引入整数单元呢?
2、RedShift
3、Octane Render
4、Maxwell Renderer
5、Iray
读图:
1、Nvidia的官方网站提供了上述渲染器的性能柱状图,可以看出在单路显卡的情况下,无论是台式工作站还是笔记本工作站,随着Quadro显卡的规格提升,性能的提升大都比较接近线性。
2、Quadro GV100比Quadro GP100的表现显著更好、Quadro GP100也比Quadro P6000的表现明显更好。
3、两路Quadro GP100/GV100相对单路带来的提升并没有达到接近两倍的水平。
可能的猜测(欢迎补充):
1、GP100的sp性能也高于GP102/104/106/107/108不少。
2、由以上结果及猜测1可以推出说法“GV100与GV102/104/106/107/108的架构存在较多不一致”并非不可能,也就是说我们可以期待TITAN V的游戏性能不是Volta架构能达到的上限。
展望:
1、在多卡互联的效率上,NVLink并不尽如人意。这点仍然有改进空间。
在DGX-2中,NVIDIA使用了12块NVSwitch芯片,尝试将DGX-2的16块Tesla V100(32GB)的多卡效率逼近100%。但是单个NVSwitch芯片的功耗可以达到100W,12块就有整整1200W,DGX-2的整机功耗也跃升到了标称10kW。
随着时代的发展,智慧城市、自动驾驶、机器学习、科学计算等等需要使用越来越大规模的计算机集群。我们希望更多的能源被用于执行计算任务和图形任务,而不是被互连消耗。因此Nvidia仍然需要下功夫令多卡互连的过程损耗尽可能少的电力。
2、这是GTX 1080的CUDA-Z评测结果:
GV100/GP100 SM结构对比:
GV100已经引入了专门的Int单元,规模与FP32单元相当。相信整数性能一定会有惊人的提高。后续架构也有望更进一步使整数性能增强。GV102/104/106/107会不会也引入整数单元呢?