首页 > 游戏资讯 > 硬件科技 > 英伟达40系显卡大量细节公开 DLSS3为何仅限新GPU?
近日英伟达举行了线上Editor's Day活动,性能技术副总裁John Spitzer、GPU工程研发高级副总裁Jonah Alben、深度学习应用研究副总裁Bryan Catanzaro、以及产品管理高级总监Justin Walker为我们详细介绍了最新的Ada Lovelace架构、NVIDIA GeForce RTX 40系列GPU、英伟达在AI方面的进展与DLSS 3技术。期间他们也解释了为何DLSS 3只能在40系显卡中使用。
John Spitzer表示,提高同等水平的画质保真度,所需要的运算复杂度越来越高。第一款加入RTX光追的游戏是《战地5》,该游戏画面中每个像素点仅需处理39次光追运算;而在《赛博朋克2077》新的“overdrive”模式中,光追运算量已经提高了16倍左右,每个像素点需要约635次光追运算。利用英伟达新的技术,《赛博朋克2077》的帧数可以从20多提高至接近100fps。
而Jonah Alben表示,虽然光追算力在大幅提升,显卡中晶体管数量并没有提升那么多,这得益于新一代Ada Lovelace架构,它可以大大提升显卡性能,在GPC、TPC、SM、CUDA核心数、RT核心数、Tensor核心数等各方面都比上一代安培核心有显著提升。
图中下方灰色虚线为晶体管数量逐年变化
同时Ada架构的在同样功耗下的效率也比安培架构提高了2倍。所以如果玩家使用同样规格的电源,显卡性能仍然可以得到增强。
接下来Jonah Alben谈到Ada架构中包含6大创新技术,其中SER(着色器执行重排序),可以重新安排着色器负载、提高执行效率。
DMM(Displace Micro-Meshes),可以更快地处理模型网格与光线交互的效果,无需读取存储数据或在别处处理。该技术可提高处理速度,还能节省显存占用。
OMM(Opacity Micro-Masks),可以更快地处理树叶/植被/烟雾等效果。
以及FP8 Inferencing、OFA(Optical Flow Accelerator)、DLSS 3。
然后Bryan Catanzaro重点谈了谈AI部分的进展,也就是DLSS 3,它利用人工智能、深度学习技术大大减少了画面计算量。之前的DLSS 2是把低分辨率画面通过AI渲染成高分辨率画面,而DLSS 3则可以直接在上一帧与下一帧画面中间生成一整个全新帧,而不仅仅是生成像素提高画面分辨率。
这一全新帧的生成不涉及图形管线处理,而是利用神经网络人工智能实现的,因此可以大幅提升游戏性能,最高可提升4倍。即便受CPU限制的游戏(比如拥有很多细节的大型开放世界游戏)也能从中受益。
由于帧生成技术必须要新的光流加速器引擎配合第4代Tensor Core才能完成,二者专门为此做了优化,因此DLSS 3只能在新一代40系显卡上实现。之后他们补充说,之前的旧显卡需要进一步优化和更多工艺才可能实现帧生成,而目前的DLSS 3是专门为Ada架构打造的。
另外,之前DLSS 2里就包含的AI超采样技术,在20/30/40系显卡上均可使用;至于另一项Nvidia Reflex技术,它在GeForce 900系列之后的显卡中都可使用(Nvidia Reflex的作用是降低输入延迟,让CPU直接向GPU传输数据,中间无需等待)。
AI超采样,AI帧生成器,Nvidia Reflex,三项技术共同构成了DLSS 3,这其中AI帧生成器无疑是最具有突破性的。
英伟达表示,目前已经有越来越多游戏开始支持DLSS 3技术,从今年10月开始,已经确认会有超过35款游戏/应用程序陆续加入DLSS 3。
另外,目前已发售的游戏还无法完全发挥DLSS 3的作用,将来新开发的游戏可以更好地适配DLSS 3,从而实现更多性能表现提升。
最后Justin Walker也再次给出了RTX 4090 24GB、4080 16GB、4080 12GB三张新显卡与目前3090Ti显卡的对比图,包括各项参数对比,以及游戏运行效果对比。
可以看到在本世代的游戏中,40系显卡的性能提升还不是那么明显,4090与3090Ti相比,最高也就提升2倍左右;不过等到下一代新游戏推出后,40系显卡的强大之处就会完全彰显,甚至可以比3090Ti提升4倍以上。图中给出的“下一代游戏”包括刚刚公布的《传送门》光追版本、《Racer》光追版本、以及《赛博朋克2077》光追Overdrive模式。
另外在职业电竞游戏方面,DLSS 3也可以带来更低的输入延迟和更好的游戏效果。以往的电竞选手普遍使用1080p分辨率,未来则可以在1440p下打电竞,效果比之前1080p还能提升3%。
在会后的问答环节中,英伟达解释说,这些新的DLSS特性需要游戏开发者进行适配才能完全发挥作用,不过英伟达专门提供了许多非常方便的开发工具,让开发者能在游戏中利用好帧生成等技术。
至于为什么要推出4080 12GB、而不是把它作为4070推出,英伟达解释说,这张卡的性能是很高的,比3080 12GB版快3倍左右,甚至比3090Ti还快,因此他们认为这张卡值得作为“4080”推出。至于4080 16GB,则主要是面向需求更高的玩家推出的。