0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

最新NVIDIA OptiX渲染光線跟蹤的速度增快

星星科技指導(dǎo)員 ? 來源:NVIDIA ? 作者:Tony Kanell ? 2022-04-15 15:17 ? 次閱讀

NVIDIA OptiX 射線跟蹤引擎是一個可擴(kuò)展的無縫框架,可在 GPU 上提供最佳的射線跟蹤性能。在今年秋季更新英偉達(dá) OpTIX SDK ,開發(fā)人員將能夠利用新的編譯技術(shù),和優(yōu)越的分層和時間去噪處理更多的射線跟蹤工作負(fù)荷,更快。

更快的編譯時間

NVIDIA OptiX 7. 4 附帶了一項(xiàng)新功能,支持包含多個函數(shù)的 OptixModule 對象的并行編譯。工作被表示為從 API 返回的任務(wù)對象,可以并發(fā)執(zhí)行以實(shí)現(xiàn)并行性。當(dāng)發(fā)現(xiàn)并行機(jī)會時,將返回其他任務(wù)。線程在 NVIDIA OptiX 之外通過從應(yīng)用程序管理的線程執(zhí)行任務(wù)來處理。該應(yīng)用程序可以更容易地將并行工作集成到現(xiàn)有的作業(yè)調(diào)度器中。

改進(jìn)的定制和性能

NVIDIA OptiX 7.4 已將光線有效載荷的大小從 8 個寄存器增加到 32 個寄存器。有效負(fù)載寄存器是 NVIDIA OptiX 提供的機(jī)制,用于從跟蹤光線的調(diào)用方傳遞任意數(shù)據(jù)以及光線。這種有效負(fù)載機(jī)制非常輕量級,類似于向函數(shù)傳遞參數(shù)。有效負(fù)載的有限大小迫使許多人使用本地甚至全局內(nèi)存緩沖區(qū)來傳遞光線數(shù)據(jù),這可能會對性能產(chǎn)生負(fù)面影響。

新的有效負(fù)載大小提供了更多種類的應(yīng)用程序,以便能夠利用僅使用寄存器傳遞數(shù)據(jù)的優(yōu)勢。使用更多寄存器會增加寄存器壓力,并可能導(dǎo)致內(nèi)存溢出,因此新的 NVIDIA OptiX 7 . 4 有效負(fù)載增加還附帶了新的 API 函數(shù)。這將幫助開發(fā)人員優(yōu)化有效負(fù)載的使用。新的 API 允許您聲明如何使用有效負(fù)載值,以便編譯器有機(jī)會盡可能重用寄存器。

曲線添加和優(yōu)化

我們還引入了一個新的曲線原語: Catmull-Rom 三次曲線。這種類型的曲線是直接通過其控制點(diǎn)的插值曲線的一種流行樣式,用于在需要精度控制時微調(diào)曲線的放置。 Catmull Rom 曲線是電影和游戲行業(yè)頭發(fā)、毛皮和其他曲線用途的流行選擇。 NVIDIA OptiX 已經(jīng)支持的其他曲線類型是三次和二次 B 樣條曲線以及線性曲線。 B 樣條曲線是一種近似曲線,比 Catmull Rom 曲線稍微平滑,但通常也不會直接通過其控制點(diǎn)。

除了新的曲線原語外, NVIDIA OptiX 還添加了一個選項(xiàng),用于控制三次曲線和二次曲線的端點(diǎn)是開放的還是封閉的。為了避免著色器發(fā)散(與 endcap 法線的特殊情況處理有關(guān)),需要使用開放式曲線。 NVIDIA OptiX 曲線當(dāng)前是背面消隱的,因此通過曲線開口端進(jìn)入的光線將完全錯過曲線。開放式曲線是常見的和可取的,而且性能更好。 NVIDIA OptiX 7.4 將三次曲線和二次曲線的默認(rèn)端蓋行為更改為開放式。

以前,這些曲線具有扁平閉合的圓盤形端蓋,這對于需要仔細(xì)控制光線曲線行為或防止光線通過曲線的應(yīng)用程序有時非常有用。為了節(jié)省內(nèi)存, B 樣條曲線和 Catmull Rom 曲線沿連接的線束段共享控制點(diǎn)。

說到節(jié)省內(nèi)存, NVIDIA OptiX 7 . 4 啟用了曲線自適應(yīng)采樣,這在默認(rèn)情況下既減少了內(nèi)存又提高了性能。對于擁有數(shù)百萬條曲線的毛茸茸的生物來說,內(nèi)存使用是至關(guān)重要的。對于最注重性能且內(nèi)存可用的生物來說,使用構(gòu)建標(biāo)志 OPTIX \ u build \ u flag \ u prefere \ u FAST \ u TRACE 可以更快地渲染曲線。自適應(yīng)采樣使用的內(nèi)存比以前稍微多一些(大約 10% ),以換取渲染性能平均提高 25%-50% ,甚至在我們的一些測試中提高 70% 。

兩個主要的去噪功能結(jié)合在一起

NVIDIA OptiX 7.4 中的去噪器在質(zhì)量和速度上不斷提高。有了這個版本的 NVIDIA OptiX ,開發(fā)人員可以結(jié)合前面兩個主要的去噪功能升級: AOV (或分層)去噪和時間去噪。 AOV 去噪是同時對多個任意渲染層進(jìn)行去噪的功能,與單獨(dú)對每個層進(jìn)行去噪相比, AOV 去噪具有更好的效率。此外,同時對多個層進(jìn)行去噪可以顯著提高質(zhì)量,因?yàn)樗袑拥娜ピ?a href="http://srfitnesspt.com/tags/濾波器/" target="_blank">濾波器選擇保持一致。這意味著,一旦將層重新組合在一起,可以看到較少的去噪偽影。

對單獨(dú)的層進(jìn)行去噪會導(dǎo)致為每個層獨(dú)立選擇不同的過濾器,并且會使某些層更容易出現(xiàn)可見的瑕疵。這對于非常稀疏的層尤其如此,例如大部分為空的鏡面反射過程。時間去噪是 NVIDIA OptiX 7.3 的一項(xiàng)新功能,它可以在動畫幀序列中保持幀間去噪的一致性。如果單獨(dú)對幀進(jìn)行去噪,它們可能看起來很不錯,但是當(dāng)您對它們進(jìn)行動畫播放時,通常會出現(xiàn)閃爍的瑕疵,因?yàn)槿ピ肫鲿γ總€幀進(jìn)行獨(dú)立的選擇。時間 AOV 去噪在一個包中為您提供了兩個功能—在不同層和動畫序列中的去噪一致性。

隨著需求量的增加,規(guī)模不斷擴(kuò)大

NVIDIA OptiX 中的 demand loading library 具有緩存逐出功能,用于動態(tài)替換緩存的磁貼,以節(jié)省更多內(nèi)存。團(tuán)隊(duì)正在尋求需求加載庫中的這個新功能的反饋,所以如果你使用它,請通過我們的英偉達(dá)論壇here或通過電子郵件來訪問,讓 Nvidia OpTIX 團(tuán)隊(duì)知道它對你的工作有多好。將按需加載庫逐出功能帶到生產(chǎn)就緒狀態(tài),并計(jì)劃在未來版本的 NVIDIA OptiX 中進(jìn)行其他改進(jìn)。

關(guān)于作者

Tony Kanell 是 NVIDIA OptiX 團(tuán)隊(duì)的項(xiàng)目經(jīng)理。托尼的職業(yè)生涯始于電子藝術(shù)公司的軟件工程師,致力于模擬人生等 AAA 級游戲。在與一家由 WME 支持的創(chuàng)意機(jī)構(gòu)合作創(chuàng)辦新游戲工作室之前,他在該公司擔(dān)任管理職務(wù),并領(lǐng)導(dǎo)了幾個項(xiàng)目。在與 Nickelodeon 、孩之寶、 Universal 、 Laika 和多個原創(chuàng) IP 成功發(fā)布和合作發(fā)布后,他加入了 NVIDIA 的 OptiX 團(tuán)隊(duì),在那里他幫助團(tuán)隊(duì)完成了多個發(fā)布。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    4817

    瀏覽量

    102644
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    27

    文章

    4635

    瀏覽量

    128460
收藏 人收藏

    評論

    相關(guān)推薦

    光線追蹤的工作原理

    本文翻譯自Scratchapixel3.0[1],是一個關(guān)于計(jì)算機(jī)圖形學(xué)的系統(tǒng)性的學(xué)習(xí)教程。如果有誤,歡迎在評論區(qū)討論。注:本課程更多地是關(guān)于3D渲染的一般介紹。如果您有興趣了解射線跟蹤技術(shù),請查看
    的頭像 發(fā)表于 09-30 08:05 ?128次閱讀
    <b class='flag-5'>光線</b>追蹤的工作原理

    羅克韋爾自動化FactoryTalk Optix可視化平臺概述

    羅克韋爾自動化FactoryTalk Optix可視化平臺概述
    的頭像 發(fā)表于 09-05 15:19 ?435次閱讀

    NVIDIA 究竟做了什么?《The First Descendant》幀率躍升 44%

    ABSTRACT摘要NVIDIA為甫上市的免費(fèi)第三人稱合作RPG射擊游戲《第一繼承者》(TheFirstDescendant)提供支援具備光線重建的NVIDIADLSS3.5、光線追蹤
    的頭像 發(fā)表于 07-05 08:26 ?554次閱讀
    <b class='flag-5'>NVIDIA</b> 究竟做了什么?《The First Descendant》幀率躍升 44%

    CPU渲染和GPU渲染優(yōu)劣分析

    使用計(jì)算機(jī)進(jìn)行渲染時,有兩種流行的系統(tǒng):基于中央處理單元(CPU)或基于圖形處理單元(GPU)。CPU渲染利用計(jì)算機(jī)的CPU來執(zhí)行場景并將其渲染到接近完美。這也是執(zhí)行渲染的更傳統(tǒng)方式。
    的頭像 發(fā)表于 05-23 08:27 ?483次閱讀
    CPU<b class='flag-5'>渲染</b>和GPU<b class='flag-5'>渲染</b>優(yōu)劣分析

    NVIDIA Omniverse USD Composer能用來做什么?如何獲取呢?

    NVIDIA Omniverse? USD Composer(以前稱為 Create)是 NVIDIA Omniverse? 中用于構(gòu)建虛擬世界的參考應(yīng)用程序,允許用戶進(jìn)行組裝、模擬和渲染大型場景。
    的頭像 發(fā)表于 05-20 10:07 ?638次閱讀
    <b class='flag-5'>NVIDIA</b> Omniverse USD Composer能用來做什么?如何獲取呢?

    解碼AI驅(qū)動的DLSS 3.5光線重建功能

    神經(jīng)網(wǎng)絡(luò)渲染器提高了光線追蹤圖像質(zhì)量,使用可在采樣光線之間生成更高質(zhì)量像素的 AI 網(wǎng)絡(luò)取代需要人工設(shè)計(jì)的降噪器。
    的頭像 發(fā)表于 05-11 11:06 ?466次閱讀
    解碼AI驅(qū)動的DLSS 3.5<b class='flag-5'>光線</b>重建功能

    HarmonyOS實(shí)戰(zhàn)開發(fā)-合理選擇條件渲染和顯隱控制

    減少渲染時間,加快啟動速度。 如果組件不會較頻繁地在顯示和隱藏間切換,或者大部分時間不需要顯示,建議使用條件渲染替代顯隱控制,以減少界面復(fù)雜度、減少嵌套層次,提升性能。 如果被控制的組件所占內(nèi)存龐大
    發(fā)表于 05-10 15:16

    OPTIX極溯光學(xué)再獲Pre-A輪融資

    近日,XR光學(xué)技術(shù)領(lǐng)域的佼佼者OPTIX極溯光學(xué)再度獲得資本市場的青睞,成功完成了Pre-A輪融資。本輪融資由春華創(chuàng)投領(lǐng)投,而公司原有的重要股東藍(lán)馳創(chuàng)投也持續(xù)為其加碼。這是OPTIX極溯光學(xué)自成立不到兩年以來,獲得的第三筆融資。
    的頭像 發(fā)表于 05-10 09:51 ?403次閱讀

    NVIDIA推出兩款基于NVIDIA Ampere架構(gòu)的全新臺式機(jī)GPU

    兩款 NVIDIA Ampere 架構(gòu) GPU 為工作站帶來實(shí)時光線追蹤功能和生成式 AI 工具支持。
    的頭像 發(fā)表于 04-26 11:25 ?524次閱讀

    NVIDIA全面加快Meta Llama 3的推理速度

    Meta 最新開源大語言模型采用 NVIDIA 技術(shù)構(gòu)建,其經(jīng)過優(yōu)化后可在云、數(shù)據(jù)中心、邊緣和 PC 的 NVIDIA GPU 上運(yùn)行。
    的頭像 發(fā)表于 04-23 09:52 ?391次閱讀

    OpenHarmony Sheet 表格渲染引擎

    基于 Canvas 實(shí)現(xiàn)的高性能 Excel 表格引擎組件 [OpenHarmonySheet]。 由于大部分前端項(xiàng)目渲染層是使用框架根據(jù)排版模型樹結(jié)構(gòu)逐層渲染的,整棵渲染樹也是與排版模型樹一一對應(yīng)
    發(fā)表于 01-05 16:32

    揭秘:實(shí)時渲染、離線渲染、云渲染和混合渲染的區(qū)別

    渲染,就是將3D模型轉(zhuǎn)換成2D圖像,并最終呈現(xiàn)在屏幕上的過程。常見的渲染類型有以下幾種:實(shí)時渲染離線渲染渲染混合
    的頭像 發(fā)表于 12-26 08:27 ?677次閱讀
    揭秘:實(shí)時<b class='flag-5'>渲染</b>、離線<b class='flag-5'>渲染</b>、云<b class='flag-5'>渲染</b>和混合<b class='flag-5'>渲染</b>的區(qū)別

    圖形渲染的技術(shù)和原理:探索視覺效果的奇妙世界

    圖形渲染是計(jì)算機(jī)圖形學(xué)領(lǐng)域的核心技術(shù)之一,它通過將三維模型轉(zhuǎn)化為二維圖像,實(shí)現(xiàn)了各種視覺效果的呈現(xiàn)。無論是電影特效、視頻游戲還是虛擬現(xiàn)實(shí),都離不開圖形渲染的應(yīng)用。在圖形渲染中,光柵化、光線
    的頭像 發(fā)表于 12-13 08:28 ?788次閱讀
    圖形<b class='flag-5'>渲染</b>的技術(shù)和原理:探索視覺效果的奇妙世界

    NVIDIA GPU的核心架構(gòu)及架構(gòu)演進(jìn)

    在探討 NVIDIA GPU 架構(gòu)之前,我們先來了解一些相關(guān)的基本知識。GPU 的概念,是由 NVIDIA 公司在 1999 年發(fā)布 Geforce256 圖形處理芯片時首先提出,從此 NVIDIA
    發(fā)表于 11-21 09:40 ?1320次閱讀
    <b class='flag-5'>NVIDIA</b> GPU的核心架構(gòu)及架構(gòu)演進(jìn)

    NVIDIA 校招 | 芯片架構(gòu)團(tuán)隊(duì)正在熱招!

    。他們與 Compute Arch 團(tuán)隊(duì)合作,追尋更高的?GPU AI 計(jì)算性能,與 Graphics 團(tuán)隊(duì)合作,探究新一代光線追蹤的渲染加速。 在這里,你可以 在這里,你會和總部團(tuán)隊(duì)共同合作,研究
    的頭像 發(fā)表于 11-01 20:25 ?352次閱讀