例如顶级单卡10Gigarays/s的追踪性能为基准。
10 gigarays/s = 10mrays/ms。
全屏1920*1080光栅化像素全分辨率屏幕空间路径数就是 1920*1080 ≈2mrays。
1/4分辨率下就是 960*540 ≈ 0.5mrays。
因为是3D空间下,所以用6面体做暂时粗略替代,6个全分辨率1080P下就是12mrays,1/4分辨率下就是2mrays
追踪1次深度反弹至屏幕,对于反射实际从光源点出发就是3次路径跟踪,那就是全分辨率下36mrays。1/4分辨率下就是6mrays。
那么全分辨率下,路径追踪就耗费掉了3.6ms延迟,光栅化呈现在屏幕上需要额外的咱就说1ms,总共4.6ms。那1/4分辨率下路径追踪计算耗费0.6ms,加上光栅化计算总共1.6ms吧。
17ms满足60fps吧,那么1/4分辨率下,可以不影响性能的情况下代替主流SSR成为反射计算方式,全分辨率4.6ms太昂贵,不过还是可以跑的吧(大概假如也许)。。
当然优化手段就是双向跟踪(屏幕空间和离屏空间计算向交点),差值。
但请注意,只是使用了6面体来十分粗略的代替3D空间表达。。而且只是单光源下1次深度下镜面的反弹,自己脑补想象一下多光源+IBL+粗糙表面下的情况。
对比一些幕后小道消息,战地5演示,1/4分辨率, 目标跑过30fps,也就是34ms per frame,优化不太理想的情况下。 说明30fps下, 顶级卡基本满足需求,数值肯定比我上面的娱乐内容要耗能更多的多(ms世界下,1ms都很宝贵啊)。
纯粹娱乐向解释。欢迎大佬拍砖。
10 gigarays/s = 10mrays/ms。
全屏1920*1080光栅化像素全分辨率屏幕空间路径数就是 1920*1080 ≈2mrays。
1/4分辨率下就是 960*540 ≈ 0.5mrays。
因为是3D空间下,所以用6面体做暂时粗略替代,6个全分辨率1080P下就是12mrays,1/4分辨率下就是2mrays
追踪1次深度反弹至屏幕,对于反射实际从光源点出发就是3次路径跟踪,那就是全分辨率下36mrays。1/4分辨率下就是6mrays。
那么全分辨率下,路径追踪就耗费掉了3.6ms延迟,光栅化呈现在屏幕上需要额外的咱就说1ms,总共4.6ms。那1/4分辨率下路径追踪计算耗费0.6ms,加上光栅化计算总共1.6ms吧。
17ms满足60fps吧,那么1/4分辨率下,可以不影响性能的情况下代替主流SSR成为反射计算方式,全分辨率4.6ms太昂贵,不过还是可以跑的吧(大概假如也许)。。
当然优化手段就是双向跟踪(屏幕空间和离屏空间计算向交点),差值。
但请注意,只是使用了6面体来十分粗略的代替3D空间表达。。而且只是单光源下1次深度下镜面的反弹,自己脑补想象一下多光源+IBL+粗糙表面下的情况。
对比一些幕后小道消息,战地5演示,1/4分辨率, 目标跑过30fps,也就是34ms per frame,优化不太理想的情况下。 说明30fps下, 顶级卡基本满足需求,数值肯定比我上面的娱乐内容要耗能更多的多(ms世界下,1ms都很宝贵啊)。
纯粹娱乐向解释。欢迎大佬拍砖。