几个小时前,NVIDIA在GitHub上发布了新的DLSSSuperResolutionSDK(3.1.10版本)。根据变更日志,DLSSSuperResolution3.1.10带来了性能、优化和稳定性改进,更不用说未指定的错误修复。
自DLSSSuperResolutionSDK3.1发布以来,游戏开发者可以选择自动更新其游戏的.dll文件。以前,用户被迫手动执行此操作,尽管modder发布了一个名为DLSSSwapper的工具来简化该过程。
正如上周承诺的那样,NVIDIA也将其StreamlineSDK更新到了2.0版本,并公开共享了FrameGeneration插件。这可能会开放给模组制作者进行用户集成;我们可能很快就会有这方面的消息,敬请期待。
随着2023年游戏开发者大会正式召开,NVIDIA也开始在其专门面向游戏开发者的YouTube频道上分享内容丰富的视频。例如,有一段视频展示了如何使用NsightGraphics软件分析赛博朋克2077即将推出的RTOverdrive模式更新,从而引导CDProjektRED使用着色器执行重新排序(SER)优化路径追踪。
这是在NvidiaRTX4090显卡上捕获的赛博朋克2077的NSight图形配置文件。GPUTrace可让您分析每帧的吞吐量,让您鸟瞰渲染游戏时涉及的性能标记的GPU时间。
此Trace使用AdaRT指标集。请注意,路径跟踪DispatchRays调用运行缓慢。我们可以点击Traceanalysis来深入了解一下。
在这里,我们看到照明消耗了大量的帧渲染时间,并且进一步检查,DispatchRays是我们怀疑的最重要的罪魁祸首。DispatchRays启动光线生成着色器的线程,我们发现它的运行成本比应有的高。
跟踪分析可以发现这种低效率并建议如何解决它。在这种情况下,它通过优化活动线程来确定帧加速的潜力很大。我们已经确定了问题的根源和解决方法。我们的路径跟踪照明可能会更有效率。我们可以通过优化着色器线程来实现这一点。
Nvidia已为此目的开发了着色器执行重新排序或SER。SER是Nvidia的AdaLovelace一代GPU引入的调度技术。它通过对完成类似任务的线程进行分组来优化GPU的工作负载。
这种一致的顺序允许流式多处理器或SM更有效地执行着色器。NSightGraphics建议我们通过在赛博朋克2077中实现SERAPI来使用SER来优化我们的DispatchRays调用。好处很明显:DispatchRays在我们的整体GPU时间中运行速度加快了大约42%。
正如NVIDIA不久前向Wccftech确认的那样,ShaderExecutionReordering需要通过其专用API明确地实现到游戏中。最近,SumoDigital在Sackboy:ABigAdventure中实施了该功能,它也将在即将推出的Cyberpunk2077RTOverdrive模式中使用。在这一点上,NVIDIA/CDProjektREDGDC2023联合会议定于太平洋时间明天10:30-11:00在旧金山的莫斯康中心(GDC合作伙伴舞台,世博楼层,北厅)举行,展示超速模式。
该会话不会被记录下来,因此其内容可能会在相当长的一段时间内保密。然而,将RTOverdrive模式发布到赛博朋克2077中可能并不遥远。同时,游戏已经支持NVIDIADLSS3并获得了HalkHogan的HDReworkedProject纹理模组。