(2)、RTX+Tensor Core:图灵的左臂右膀之前我们就已经说到过,和以往的核心相比,图灵的die面积可以说呈火箭般上升的趋势,TU102的面积更是达到了754平方毫米,如此庞大的面积按照以往的惯例应该是狂堆CUDA,来获得更加强大的FP32性能,不过NV在图灵架构上并不是采用样子,而是将更大的面积以及更多的晶体管用于RTX和Tensor Core,它们也将成为图灵架构的左臂右膀。
先来说下Tensor Core。目前深度学习已经成为了整个行业最大的发展方向,例如手机厂商已经例如处理器提出了各种的AI概念,自然作为尖端科学的GPU领域不会放弃AI以及深度学习,对于老黄更是如此。在如今NV的显卡基本处于独步天下的情况下,NV想要做点其他的事情,来改变整个行业的发展和进步。
于是在图灵架构中,我们看到了Tensor Core,一种专门为深度学习打造的处理单元。
Tensor的意思就是张量,在数学中拥有多种维度,包括标量(0维)、矢量(1维)、矩阵(2维),而张量则是更高的维度,它代表着一个容器,能够盛放更多的数据,而深度学习的意思就是通过大数据进行计算,在这些数据中找到最好的数据进行使用,从而提升处理单元的效率,间接地提升显卡性能。
NV表示全新的Tensor可以支持FP16以及FP32的混合运算,通过数学上的乘积获得完整的精度,而和FP32相比,FP16的运算速度更高,因此处理器的运行速率也就更加出色。
得益于Tensor Core的存在,如今图灵显卡也可以支持深度学习,将支持被NV寄予厚望的DLSS功能。
DLSS被称之为深度学习超级采样,通俗地讲,它能够让显卡以较小的资源消耗获取更加出色的显示效果。例如在DLSS模式下,显卡实际渲染所需的性能并不是很苛刻,同时经过深度学习以及NV独有的算法,输出给用户的图像和采用TAA等抗锯齿的图像相差不大,当然由于开销更低,因此游戏表现更加出色。这也就是为什么在DLSS的加成下,RTX 2080的实际性能表现要比GTX 1080提升近一倍,而依靠CUDA等传统FP32的游戏,性能表现提升在50%左右。不过经过我们的测试,实际上并不是这样。
在和NV的工作人员进行谈论之后,他们表示NV会提前数周拿到尚未发售的游戏,同时针对这些游戏来不断地运行,同时建立相应的训练神经网络,收集数千个以64×超级采样生成参考画面,其中选择最为出色的配置比来提供给玩家使用。同时NV也明确表示玩家手上的显卡也可以实现部分的学习,但是实际上DLSS训练网络是基于NV的超级计算机进行,同时NV也绝对不会将玩家手上的显卡的训练结果上传至服务器,这是用户的隐私。
随着支持DLSS游戏的增多,NV将会通过GFE不断地推送基于神经训练网络的DLSS设置提供给搭载20系显卡的用户,让他们在DLSS环境下更加流畅地游玩游戏,当然之前的10系显卡是不能享受DLSS带来的出色的游戏环境。
关于DLSS的测试,我们将会在最后为你揭晓答案。
除了这个DLSS之外,NV为Tensor推出了AI InPainting、AI Super Rez和AI Slow-Mo,不过后三者更多的适用于图形工作者或者视频工作站,普通玩家关系并不是很大,当然对于提升生产力还是相当有帮助。
(3)、实时光线追踪:未来游戏发展的方向
如果是DLSS能够让用户以更小的花销获得接近于原生的画质表现,那么实时光线追踪自然将成为未来3A大作发展的方向。
目前的绝大部分游戏都是基于光栅化来渲染游戏画面,尤其是光线画面,因此有时候光线看起来十分地不真实,这就是光栅化带来的局限性。而实时光线追踪则模拟真实世界的光线,来获取更加接近于真实世界的画面,同时也将严格遵守物理准则,当然和光栅化相比,实时光线追踪所需要的机能更加恐怖,所以一直以来没有业界没有太好的手段来支持实时光线追踪。
▲实时光线追踪演示:《星球大战》Demo
而现在NV在20系显卡之中加入了独立的RT单元,这些独立单元将为实时光线追踪而特别打造,通过智能学习,将自主判断渲染光线的方式,包括传统的光栅化渲染以及最新的实时光线追踪渲染,将RT处理单元使用在最具有效果的地方,例如水面、镜面反射等地方,这样子既可以最大程度地展示画面效果,还可以实现显卡资源的合理利用。
然而需要泼一盆冷水,目前的显卡即使是RTX 2080 Ti也不能实现全实时光线追踪,因为显卡的性能还不能达到这个水平,按照EPIC的说法,想要实现这样的效果,传统的单精度就必须要超过25T,几乎是目前显卡的两倍性能。
▲《战地5》RTX打开前后
于是NV采用了新的算法,通过低光线跟踪单元获取相对真实的光照,然后通过自家的降噪算法让原本充满噪点的图像变得清晰,这是目前的硬件性能下较为合理的选择。
NV同样给我们星球大战的DEMO,在星球大战的DEMO之中,在4K分辨率下,基于DLSS技术,使用RTX 2080 Ti可以达到35帧左右的速度,而GTX 1080 Ti则只有可怜的7-8帧,这就是实时光线追踪带来的巨大硬件消耗能力,当然NV在发布会上说的6倍光效追踪性能值得就是这个,大家不要混淆了!
随着实时光线追踪的加入,NV也在发布会上定义了未来显卡的新性能标准:RTX-OPS,NV认为全新的RTX-OPS包括20%的Tensor性能,80%的FP32性能,40%的Ray OPS性能以及28%的INT32性能。因此我们可以看到20系显卡在RTX-OPS上的性能远远超过目前的10系显卡。
不过即使是增加了Ray计算单元,实时光照跟踪所需的显卡性能仍然十分苛刻,从目前游戏厂商给出的消息来看,RTX 2080 Ti在1080P分辨率下才能以60帧的速率流畅运行支持实时光线追踪的游戏。