高馬爾
一個信息發佈的網站

《半條命2》RTX體驗,RTX 50系獨有神經網絡渲染!演繹全新光影藝術

今天小編(繁綺文)要和大家分享的是《半條命2》RTX體驗,RTX 50系獨有神經網絡渲染!演繹全新光影藝術,歡迎閱讀~

開始的地方

如今越來越多的遊戲都将支持光線追蹤作為基本的賣點,而支持光線追蹤的顯卡其實早在RTX 20系時就發布了。作為第一代光追顯卡,當時的性能表現确實是有些捉襟見肘,一度不少玩家直呼"光追根本沒必要"。不過随着RTX 30系、RTX 40系乃至最新的RTX 50系顯卡發布後,顯卡性能可以說是有了質的飛躍,迎戰光追可以說是輕輕松松。

當然,顯卡的代際提升帶來的不僅僅是遊戲性能的增幅,在光追層面NVIDIA也有了長足的進步,特别是從最開始的光線追蹤,到後來的全景光線追蹤,再到現在引入神經網絡渲染,每一次的更新都帶來了光追畫面的極致體驗。就在前段時間,NVIDIA帶來了《半條命2》RTX版,這款遊戲早在2004年就已經發售了,一發售就橫掃各大獎項,成為一代傳奇。

《半條命2》RTX實機演示

全新的《半條命2》RTX版與舊版還是有明顯的不同的,新版借助NVIDIA RTX Remix技術,讓這款經典遊戲也支持了光線追蹤技術,同時還對遊戲資源進行全面高清化處理,并且還支持RTX 50系顯卡獨有的DLSS 4以及NVIDIA Reflex等技術,在細節表現上更加出色。

在開始實機展示前,還是應該給各位玩家科普一下上面提到的NVIDIA RTX Remix技術,它是NVIDIA推出的遊戲模組工具,它可以利用現代光線追蹤和 AI 技術,讓經典遊戲在現代技術的加持下煥發出新的光彩,可以說RTX Remix 不僅是一項技術突破,更像是一座橋梁,連接了過去的遊戲與未來的創新。

遊戲開發者在重制經典遊戲時,遊戲内的紋理、模型、光照、效果等都可以被捕捉、分類并重新組裝成可編輯的場景。利用RTX Remix工具即可快速将更新的遊戲資產替換過去的舊的遊戲資產,同時還可以将燈光轉換為完全光線追蹤,并利用AI增強紋理以及添加DLSS超分技術用于提升遊戲運行體驗等。

不過說到RTX Remin就不得不提最新的RTX 50系顯卡了,其引入了神經網絡着色器的概念,利用這一概念,RTX Remix還可以憑借RTX神經網絡輻射緩存,進一步改善間接光照和性能,帶來更逼真的畫質與更流暢的遊戲體驗。

全景光線追蹤(Full Ray Tracing)

下面給大家看看《半條命2》RTX版本究竟帶來了哪些變化,首先最明顯的一點就是其引入了高質量的實時光線追蹤效果,并且采用了完整的路徑追蹤技術。全景光追可以說是顯卡殺手級别的技術了,它可以将陰影、反射、全局照明、折射等所有光照效果統一納入單一的光線追蹤算法中,确保每束光線都被精确追蹤。

因此,當你玩過經典版本的《半條命2》,再玩一次《半條命2》RTX版,你會發現整個畫面都不一樣了,過去破舊不堪的世界,現在煥然一新,仿佛換了一款遊戲一樣。逼真的光照、陰影和反射效果,極大地提升了遊戲的沉浸感。

透過全景光線追蹤技術,燈光照射在人物也好,還是地面也好,都會有逼真的陰影效果或反光效果,非常符合現實環境。豐富的細節能夠呈現出無與倫比的深度和真實感,為玩家帶來更加震撼的視覺體驗。

RTX神經輻射緩存

說完了全景光線追蹤技術,下面就該聊聊RTX 50系顯卡帶來的獨門秘笈——RTX神經網絡渲染,NVIDIA在RTX 50系中進一步拓展了神經網絡渲染的範疇,引入了諸多創新元素,包括神經網絡紋理壓縮(Neural Textures)、神經網絡材質(Neural Materials)、神經網絡體積(Neural Volumes)、神經網絡輻射場(Neural Radiance Fields)以及神經網絡輻射緩存(Neural Radiance Cache)等,這些元素共同構成了神經網絡渲染中神經網絡着色的重要呈現方式。

其中《半條命2》RTX版中已經有RTX神經網絡輻射緩存的相關設定,RTX神經輻射緩存能夠顯著提升了光線追蹤間接照明和反射光照的質量,同時大幅提高了整體遊戲性能。

RTX神經網絡輻射緩存能夠依托玩家實時的遊戲數據,通過AI神經網絡進行自我訓練,從而計算出場景的間接光照。這樣得出的間接光照結果不僅更準确,響應速度也更快。根據NVIDIA官方的數據,在《半條命2》RTX版中開啟RTX神經網絡輻射緩存後,能使運行速度提升高達15%。

不僅如此,啟用RTX神經網絡輻射緩存以後,還能夠帶來更多的細節呈現。例如上圖中的地板,在開啟該功能後,很明顯可以看到地板的影像更加清晰,同時地面的紋理也能夠很好的得到保留。

NVIDIA RTX Volumetrics

RTX Volumetrics技術則是一項體積算法技術,它采用ReSTIR算法來計算體積,并精确追蹤光線在空氣、霧、煙霧及大氣中的散射情況。傳統的光栅化體積效果需要為場景中的每個光源創建多個性能密集型的高質量陰影貼圖,以防止明顯的走樣、閃爍和偽影。完整的光線追蹤消除了對光栅化技術(如陰影貼圖)的依賴,從而實現了無論場景中光源數量多少都可以高質量的實現。

例如上圖中視窗人物在大霧中開啟手電筒照射,光線經過霧氣的時候會有一道明顯的路徑,并且光線在霧氣中會出現折射現象,現場的光線場景復雜。在沒有NVIDIA RTX Volumetrics加持時,霧氣中的光線幾乎沒有區别,而有NVIDIA RTX Volumetrics加持下,不同的光影變得更加立體。

NVIDIA RTX Skin & Subsurface Scattering

在人物細節表現上,新一代光追技術也有黑科技——RTX皮膚&次表面散射功能,根據NVIDIA介紹,次表面散射功能可以應用于蠟燭蠟、大理石和翡翠等厚實、半不透明的材料,它可以模拟光線穿透皮膚或一些半透明材質時的散射效果,見過翡翠的玩家應該都知道,光線在穿透這些半透明材質時還會產生一定的微弱光線,能夠進一步折射或者散射光線到其他地方,從而讓材質更加透亮,提升整體的逼真程度。

反映在《半條命2》RTX版中就是光線照射到人體皮膚時,能夠逼真地再現了真實皮膚的柔軟、半透明質感;另一個畫面是光線穿過獵頭蟹時,微弱的光芒會将整個獵頭蟹的皮膚照亮,在視覺效果上對比經典版本顯得更加自然,而沒有這項技術時,無論是獵頭蟹還是人體皮膚都顯得幹巴巴,不夠立體的感覺,觀感不佳。

增強材質組件

當然,《半條命2》RTX版中除了有逼真的全景光追技術、優秀的神經網絡渲染能力外,還引入了一項黑科技——增強材質組件。從名字就能看出來,這個功能能夠顯著提升遊戲畫質,在遊戲的設定界面可以看到,這項功能可以實現材質的增強、網格着色的增強以及光線的增強。應用該功能,可以在遊戲中實現近乎于現實生活的材質與光照體驗,極大的增強遊戲沉浸感。

例如可以看下面兩個場景,在開啟材質增強功能後,整個畫面的細節變得異常豐富,無論是第一個場景中的綠葉,還是第二個場景中的草地,在材質增強功能的加持下,變得更加立體,細節更加豐富,同時他們還可以與周圍的光線進行互動,對視覺效果的提升非常大,基本可以說對遊戲畫質是一個質的飛躍,甚至說換了一個遊戲玩也不為過。

硬體介紹

看完了上面出彩的畫質,想必你也迫不及待想要體驗一下最新的《半條命2》RTX版了吧,不過想要感受這般頂級的遊戲體驗,你還缺一張RTX 50系顯卡。要問哪款最合适,那必是技嘉GeForce RTX 5080 XTREME WATERFORCE 16G,既有旗艦級的性能釋放,又有水冷散熱加持,随時能夠保持冷靜。

這款顯卡的包裝盒相當吸睛,正面是經典的雕型Logo,不過其用上了金屬加機械的風格設計,既彰顯了這款顯卡為電競而生,同時也表明了它隸屬于大名鼎鼎的水雕系列。包裝盒左下角印的則是這款顯卡的相關配置,例如配備了技嘉引以為傲的水之力散熱系統,顯卡還搭載了16GB的GDDR7顯存,同時技嘉顯卡還能享受領先業内的超長4年質保服務。

包裝盒的背面就比較簡單了,主要為顯卡内部用料的詳細介紹。比如這款顯卡搭載的水之力散熱系統,主動散熱設計+被動散熱模組為GPU、顯存和MOSFET等關鍵元器件提供高效的散熱解決方案,以确保系統在高頻下的穩定性。

再來看看技嘉GeForce RTX 5080 XTREME WATERFORCE 16G本體,整張顯卡可以分為兩部分,分别是顯卡本體以及360水冷散熱器。

技嘉 GeForce RTX 5080 XTREME WATERFORCE 16G 的外觀設計堪稱藝術品。顯卡整體采用了黑色為主色調,搭配金邊視覺分層設計,展現出一種冷峻而高貴的氣質。右側的透明件上刻有AORUS 的标志,給人一種強烈的科技感,斜切的紋理則加強了顯卡的層次感。

值得一提的是,顯卡的正面與邊緣藏有LOGO燈以及燈光線條,利用亞克力的導光特性,正面AORUS LOGO能夠展現光與影交錯的層次變化,打造出極具科技感的奢華視覺效果。

顯卡背面的設計與正面頗有異曲同工之妙,采用了一體成型的金屬背板設計,做工考究,質感十足。整體還是以黑色作為基底,但引入了拼接的靈感,讓整張顯卡的顏值躍升一步,妥妥的工藝美學設計品。

背面中央這是顯卡的大腦——GB203-400-A1核心,擁有10752組CUDA核心,稍多于前代的RTX 4080 SUPER,通用的圖形性能自然更強。而在工藝制程方面,新的GB203核心沿用了TSMC 4nm 4N NVIDIA Custom Process工藝。核心面積為378mm2,内部晶體管數量則有456億,在這麼小的空間内堆下如此之多的晶體管,可以說是絕對工業藝術品的集大成之作了!

視線轉移至顯卡的頂部,這裡也沿用了拼接的設計風格,左側是NVIDIA顯卡經典的GEFORCE RTX字樣,右側則是镂空的AORUS LOGO标識,并且下面還藏有RGB燈條,當顯卡通電時,能夠亮起RGB燈效,進一步提升顯卡辨識度。

頂部還有顯卡的供電接口,被安排在顯卡頂部最靠右的位置,目的是裝機時盡量不讓電源線擋住這款顯卡的顏值,接口為12V-2×6接口,單口可提供600W供電能力。

底部則是顯卡的金手指,這一代顯卡的PCIe接口更新成為了5.0速率,這也是首次在RTX 50系顯卡上應用,能夠帶來更高的傳輸速率,另外仔細看金手指的形狀,它和上一代的顯卡也有些微的變化。

視頻輸出接口部分,還是經典的3個DP加1個HDMI的配置,不過規格上有了更新,技嘉GeForce RTX 5080 XTREME WATERFORCE 16G采用的是DP 2.1b與HDMI 2.1b規格,理論上,這一代顯卡的視頻輸出接口可以輕松實現4K 480Hz和8K 240Hz超高分辨率與超高刷新率的需求。

再來看技嘉GeForce RTX 5080 XTREME WATERFORCE 16G的另一部分,其配備了巨大的360水冷,官方稱之為水之力散熱系統。其内部分為主動散熱以及被動散熱兩部分,出色的散熱效能為這款顯卡帶來了極致的性能釋放潛力與絕佳的噪音控制能力。

讓我們先看主動散熱的設計,風扇部分,冷排上安裝了3個配備雙滾珠軸承的120mm ARGB風扇,不但高效低噪,還擁有出色的使用壽命,喜歡RGB的玩家還可以通過技嘉控制中心(GCC)來自定義燈效實現整套主機的燈效同步。

冷排部分,顯卡使用了優化設計的360mm鋁質冷排,通過巨大的散熱體積提供了極高的熱容,從而讓風扇在低轉速下也能保證足夠的散熱效果,有效降低了顯卡滿載工作的風扇噪聲。

而被動散熱部分則仰賴于内部的全銅底板散熱設計,銅質底板直接與GPU與顯存接觸,同時冷頭的水路還延伸到了MOSFET區網域,能夠進一步提升整卡的散熱效果。

除此之外,顯卡内部還配備了高端的液态金屬復合矽脂,配合伺服器級導熱凝膠,讓整個水之力的散熱系統能夠實現吸熱最大化,技嘉GeForce RTX 5080 XTREME WATERFORCE 16G時刻都能冷靜輸出。

技嘉GeForce RTX 5080 XTREME WATERFORCE 16G的冷頭端與360mm冷排端則是用編織網的鐵氟龍管進行連接,不僅可以有效提高水管抗物理損壞的能力,同時還增加了顯卡整體的顏值。

總的來說,技嘉GeForce RTX 5080 XTREME WATERFORCE 16G絕對稱得上旗艦中的旗艦,不僅搭載了高端的GB203核心,在用料和規格上都遠超其他RTX 5080,搭配一體式水冷散熱設計,可以讓玩家進一步挖掘RTX 5080顯卡的性能潛力,獲得更加極致的遊戲體驗,完全就是發燒級玩家裝機的首選裝備。

實際遊戲性能

下面是遊戲性能實測部分,測試前介紹一下本次的測試平台, CPU使用的是目前毫無争議的遊戲神U——AMD Ryzen R7-9800X3D,主機板則是來自技嘉的X870 AORUS ELITE WIFI 7主機板,,刷新到最新版本BIOS的同時,在BIOS中開啟X3D模式,以便獲得更好的性能表現。

内存為G.Skill的幻鋒戟Z5 RGB DDR5,在這塊主機板上能輕松達成DDR5-8000 C38的成績,并且我們這次選用的是24G×2的套條,确保這張顯卡能夠釋放全部性能。完整測試平台如下所示:

再來看看遊戲内部的設定,其标配了最新的DLSS 4技術,這也就意味着玩家換裝最新的技嘉RTX 50系顯卡能夠獲得更極致的遊戲幀數體驗。測試過程中我們會将各種畫質、材質技術都開至最高級位。

首先看2K分辨率的表現,原生分辨率下,無論是技嘉GeForce RTX 5080 XTREME WATERFORCE 16G還是前代RTX 4080都能流暢運行,不過整體性能表現上,前者更好一些,比RTX 4080強約13%。二者在開啟DLSS 3以後,遊戲體驗都有了進一步的提升,其中技嘉GeForce RTX 5080 XTREME WATERFORCE 16G能夠做到186 FPS,已經能夠滿足2K@160Hz的高刷遊戲需求,如果你接着打開DLSS 4,你會發現RTX 50系顯卡的魅力之處,技嘉GeForce RTX 5080 XTREME WATERFORCE 16G的幀數進一步暴漲至302 FPS,對比原生分辨率,提升了4-5倍之多,這已經不能用高刷來形容了!

在特效和增強全開的情況下,4K分辨率對技嘉GeForce RTX 5080 XTREME WATERFORCE 16G的壓力可不小,在不開啟任何超分技術的情況下,遊戲幀數僅有37 FPS,基本不能正常遊戲。而上一代RTX 4080則更是只剩28 FPS,也是卡成PPT。僅開啟DLSS 3後,遊戲幀數就有了好轉,兩款顯卡都能絲滑流暢的遊玩了,不過技嘉GeForce RTX 5080 XTREME WATERFORCE 16G的性能表現還是比RTX 4080高約12%。4K分辨率解鎖DLSS 4後,遊戲幀數則相比原生分辨率提升了6-7倍以上,同時對比DLSS 3,DLSS 4仰仗多幀生成的強悍性能,在遊戲幀率表現上也領先前者近100%。

DLSS 4帶來的性能提升是有目共睹的,不過也有玩家擔心DLSS 4的畫質表現如何,這裡我們也在遊戲中截取了部分畫面,基本上可以說DLSS對畫質的影響沒有玩家想象中那麼大,甚至于在紋理細節上能夠不輸或超越原生分辨率。

另外,遊戲設定中還可以切換DLSS 4的另一個特性——Transfomer Mode,據說能夠讓畫質更清晰,同時還能改善此前的拖影問題,對玩家可以說是一大利好。這裡我們也截圖了相同的場景進行對比,從下圖可以看出Transformer模型能夠帶來更多的細節。例如左側圖片中的牆壁,這部分表現是比較清晰的,細節也更多,而CNN模型中則幾乎不可見。圖片中主體的木屋紋理也是Transformer模型下會更清晰,線條更銳利。

總結

通過簡單的測試,我們可以清晰地看到RTX Remix技術和全景光線追蹤技術為《半條命2》RTX版帶來的巨大性能提升和卓越遊戲表現。遊戲的沉浸感與畫面效果指數級上升,各種黑科技的加持下讓一款經典遊戲《半條命2》煥發了第二春。

不過大家看上面的測試也知道了,畢竟是最頂級的光追表現,其對GPU算力的開銷相當大,如果玩家要體驗"全景光線追蹤",硬體性能不可少,這時候你就需要一張GeForce RTX 50系列顯卡,憑借其出色的光線追蹤性能和DLSS 4技術,就能讓遊戲在現代3A大作的畫質下以更高的幀率流暢運行。

技嘉GeForce RTX 5080 XTREME WATERFORCE 16G作為旗艦級的存在,自然是極客玩家的最佳選擇,不論是從外觀設計、硬體堆料、散熱效能還是做工水準來說,都全方位展示了技嘉的實力。技術層面,全新的Blackwell架構、DLSS 4、RTX神經網絡渲染等技術将它推向了新的高度。

性能上更是不遑多讓,就拿實測的《半條命2》RTX版來說,在最高畫質預設下,憑借DLSS 4技術,能夠做到原生畫質的6-7倍提升,可以說是非常誇張了,随着支持DLSS 4的遊戲越來越多,屆時RTX 5080的性能又将迎來一次飛躍。如果你還在糾結選配什麼裝備好,不妨考慮下本次測試的技嘉GeForce RTX 5080 XTREME WATERFORCE 16G顯卡,無論是對于追求極致遊戲體驗的玩家,還是對于需要強大圖形處理能力的創作者來說,它都是一個非常值得考慮的選擇!

NVIDIA光線追蹤技術發展

最後再給大家聊點硬核的,也算是給大家科普一下光線追蹤技術。光線追蹤對大部分玩家來說,是一項既熟悉又陌生的技術。說熟悉,是因為可能大家其實都見過;說陌生,是因為除了計算機圖形領網域的專家,真正了解該技術的人可能為數不多。

什麼是光線追蹤?

光線追蹤這一技術本身并沒有多少的新鮮花樣,光線追蹤說白了就是一種在2D螢幕上呈現3D影像的方法,如果你想了解光線追蹤,你可以環顧四周,找到被光線照亮的物體,沿着到達視點的光線反方向進行追蹤,就是光線追蹤。

其實光線追蹤在很久之前就已經出現了,但是一般都被應用于動畫電影中,直到現在才在遊戲中廣泛應用。究其原因還是計算量過于龐大,以之前的硬體水平難以勝任這項重活,即使能夠完成光追實時渲染,但所需時間也是不可估量的。因此在遊戲實現光線追蹤之前,絕大多數遊戲廠商都以來另一項技術來處理光線的問題,即光栅化。

什麼是光栅化?

按照字面意思就是把影像栅格化、像素化,将電腦生成的矢量轉換成螢幕像素點的過程。比方說,遊戲中物體建模的時候都是三維,由點線面構成,但要顯示在二維的顯示器上,就需要一個"降維打擊"——光栅化,成為能夠被顯示的像素點,其實就是三維向二維的轉化過程。

目前大部分遊戲還是使用光栅化技術,因為光栅化需要的計算量不大,所以在實時渲染上光栅化技術仍然是大部分遊戲的高效方案。而光栅化最大的問題就是需要提前預設大量的渲染效果,比如遊戲場景中的光影、反射等效果都是要提前預置好,然後進行"貼圖",這也是為什麼你在玩遊戲時光影效果明明看起來很真實,但是還是有虛拟的感覺。

如何實現光線追蹤?

老黃之前在接受媒體訪問時曾說過"RTX是一場豪賭,是非常非常冒險的,但它有兩項偉大的發明。一是硬體加速光線追蹤,也就是模拟光線。" 甚至一度認為10年、20年甚至30年都無法實現實時的光線追蹤,不過好在最後這項艱巨的任務完成了。

那計算量極大的光追NVIDIA又是怎麼實現的?這裡就要提到NVIDIA突破性的技術了,在2018年時,NVIDIA就宣布了可加速硬體中光線追蹤速度的新架構Turing(圖靈架構),以及第一款搭載實時光線追蹤技術的RTX 20系列顯卡。

在Turing架構中,每一個SM單元裡都擁有一個RT Core,其是專門為光線追蹤技術服務的。而要了解RT Core的工作原理,我們首先要了解光線追蹤所運用到的算法:BVH,全稱Bounding volume hierarchy

其中BVH算法就是一種用來管理3D場景中物體的方法。比如渲染對象是一只兔子,要計算一條光線和兔子本身的互動,就把兔子所在空間劃抽成N個包圍盒,如果光線沒有碰到兔子所在的包圍盒,表明該直線一定不會和兔子相交,如果該光線碰到兔子的包圍盒,再把這個包圍盒繼續劃抽成N個更小的包圍盒,再次計算光線是否與兔子所在的包圍盒相交,如此反復,一直找到和光線相交的三角形所在的包圍盒,再對這個三角形進行最終的渲染。

而在光線追蹤裡,很多相鄰的光線通常會有相同的光路,講人話就是經過一樣的包圍盒,因此計算就是相同的,采用BVH算法可以大大減少計算每一條光線最近相交點所需要遍歷的三角形數量,而且只需要進行一次就能給大部分光線使用,大大提高了執行效率。因此顯卡也能勝任這項工作,玩家也能玩上畫質更精美更真實的遊戲了。

RT Core工作原理

而RT Core的工作原理就是,着色器發出光線追蹤的請求後,交給RT Core就開始"接單"處理了,由于上面我們講到BVH算法檢測到光線與物體相交會有一個三角形,因此RT Core會進行兩種測試,分别為邊界交叉測試Box Intersection Evaluators和三角形交叉測試Triangle Intersection Evaluators。基于BVH算法來判斷,如果是方形,那麼就返回縮小範圍繼續測試,如果是三角形,則反饋結果。最後RT Core還要配合GameWorks SDK的光線追蹤降噪模塊、RTX API等軟體層面的協同工作,才能實現實時光線追蹤。

第一代RT Core

其中第一代RT Core就是Turing架構顯卡上首次引入的開創了實時光線追蹤的先河,實裝在了當時的RTX 20系顯卡之上。第一代RT Core可提供34T的RT性能,而Tensor Core可提供DLSS處理能力,能提供89T的性能。

第二代RT Core

而第二代RT Core則是出現在Ampere架構的RTX 30系顯卡之上,在Ampere架構中,單元的性能都獲得了大幅度提升,RT Core的RT性能提升至58T,幅度是1.7倍;Tensor Core的Tensor性能提升至238T,幅度2.67倍。

而光線追蹤最耗時的正是求交計算,因此,要提升光線追蹤性能,主要是對兩種求交(BVH/三角形求交)進行加速。所以老黃在第二代RT Core裡增加了一個新的三角形位置插值模塊以及一個的額外的三角形求交模塊,這樣做的目的是為了提升諸如運動模糊特效時候的光線追蹤性能。

并且第二代RT Core可以讓光線追蹤與着色同時進行,進行的光線追蹤越多,加速就越快。它将光線相交的處理性能提升了一倍,在渲染有動态模糊的影像時,按照NVIDIA自己的實測,比Turing快8倍。

第三代RT Core

RTX 40系顯卡則引入了革命性的Ada Lovelace架構,其最大的提升還是在第三代 RT Core與第四代 Tensor Core身上。其中第三代 RT Cores 的有效光線追蹤計算能力達到 191 TFLOPS,是上一代產品 2.8 倍。

在Ampere架構中,第二代RT Core支持邊界交叉測試(Box Intersection testing)和三角形交叉測試(Triangle Intersection testing),用于加速BVH遍歷和執行射線三角交叉測試計算,雖然光線追蹤處理能力已經比初代的Turing架構核心更高效,但是随着環境和物體的幾何復雜性持續增加,傳統的處理方式很難再以更高效率及正确反應出的現實世界中的光線,尤其是光的運動準确性。

所以在第三代 RT Cores增加了兩個重要硬體單元:Opacity Micromap Engine與Displaced Micro-Meshes Engine引擎。Opacity Micromap Engine,主要是用于alpha通道的加速,可以将 alpha 測試幾何體的光線追蹤速度提高2倍。

在傳統光栅渲染中,開發人員使用一些 Alpha 通道的素材來實現更高效的畫面渲染,例如 Alpha 通道的葉子或火焰等復雜形狀的物體。但在光線追蹤時代,這傳統的做法會為光線追蹤帶為不少無效的計算,例如運動性的光線多次通過一塊葉子,光線每擊中一次葉子,都會調用一次着色器來确定如何處理相交,這時就會做成嚴重的執行成本與時間等待成本。

而Opacity Micromap Engine用于直接解析具有非不透明度光線交集的不透明度狀态三角形。根據Alpha 通道的不透明,透明與未知等三個不同的塊狀态進行處理:透明則直接忽略繼續找下一個,不透明塊則記錄并告之命中,而未知的則交給着色器來确定如何處理,這樣GPU很大部分都不需要進行着色器的調試處理,能夠實現更為高效的性能。

如果說Opacity Micromap Engine加速的是面處理,那麼Displaced Micro-Meshes Engine就是幾何曲面細節的加速器。如上圖所示,在Ada Lovelace架構中,通過1個基底三角形+位移地圖,就可以創建出一個高度詳細的幾何網格,所需要資源占用比二代RT Cores更低,效率也更高。

通過NVIDIA給出的創建14:1珊瑚蟹例子來說事,這裡我們需要1.7萬個微網格、160萬個微三角形,在Ada Lovelace架構中BVH創建速度可加快7.6倍,存儲空間縮小8.1倍。Displaced Micro-Meshes Engine起到了關鍵性的作用,其将一個幾何物體根據不同細節抽成密度不一的微網絡處理,紅色密度超高,細節處理越為復雜 。相應的低密度微網絡區網域則可以釋放更多的資源與存儲空間,這樣Displaced Micro-Meshes Engine就可以幫助BVH加速過程,減少構建時間和存儲成本。

同時Ada Lovelace架構SM中新增了着色器執行重排序(Shader Execution Reordering,SER),這是由于光線追蹤不再只有強光或者陰影渲染處理,未來将會更多的是在光線的運動性,這樣光線就會變得越來越復雜,着色器執行重排序(SER)的加入就是為了能夠即時重新安排着色器負載來提高執行效率,為光線追蹤提供2倍的加速,也能更好地利用GPU資源。

第四代RT Core

最最矚目的還要屬RTX 50系,這一代顯卡換裝了伺服器級别的Blackwell架構,同時RT Core也更新至了第四代。相較于第三代RT核心來說,Blackwell架構的第四代RT核心主要提升了檢測光線、路徑與三角形相交的效能,過往在檢測時往往只能檢測單個三角形,一旦場景復雜,檢測能力不足就容易導致渲染出錯等問題,而現在檢測能夠以簇集方式進行,檢測效率更高。同時還有三角形簇集解壓縮引擎加持,其新增了Linear-swept Spheres(LSS)功能,可以減少渲染毛發所需的幾何圖形數量,并使用球體代替三角形以獲得更準确的毛發形狀拟合,能夠讓顯卡發揮更好的性能但只消耗較小的顯存占用。

綜合來看,Blackwell架構的光線追蹤多邊形相交效率是上一代Ada架構的2倍,是Turing架構的8倍,同時還可以節省25%的顯存使用率。

第四代RT核心的改進主要是為實現更好的光追效果。其中有兩項新技術能夠受益,第一項是RTX Mega Geometry技術。随着光線追蹤遊戲場景的幾何復雜性不斷增加,遊戲畫面中幾何圖形的計算量也呈現出快速增長的趨勢。而RTX Mega Geometry技術能夠加速構建邊界體積層次結構(BVH),使得在實時渲染中可以處理多達100倍的三角形數量。

該技術的出現,也使得開發者能夠在遊戲場景中使用更復雜的幾何圖形,而不會影響遊戲幀率。過去需要一個個算BVH,現在RTX Mega Geometry能夠智能地在GPU上批量更新三角形簇,減少了CPU的負擔,既保證了性能,也兼顧了影像質量。相信随着這些技術的不斷發展和應用,未來的遊戲将能夠呈現出更加逼真和細膩的視覺效果,同時保持高效的性能表現。

另外一個能夠受益的技術則是Curve Primitive,方便光追在曲面中的應用,例如一位男士的頭發可能需要多達400萬個三角形,再加上光線追蹤技術,畫面所需要的運算負載極大。NVIDIA則通過第四代RT核心中的Linear- Swept Spheres(線性掃描球體)技術有效減少了渲染頭發所需的幾何體數量,以球形代替多邊形,更貼合頭發的形狀,從而将内存占用量大幅縮減至三分之一,并進一步提升了實際幀數,讓頭發的渲染效果更加自然流暢。

關于《半條命2》RTX體驗,RTX 50系獨有神經網絡渲染!演繹全新光影藝術就分享完了,您有什麼想法可以聯系小編(繁綺文)。