0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

新版本CUDA 11.6工具包的功能

星星科技指導員 ? 來源:NVIDIA ? 作者:NVIDIA ? 2022-04-02 16:43 ? 次閱讀

NVIDIA 發(fā)布的 CUDA 開發(fā)環(huán)境 CUDA 11.6 的最新版本。本版本的重點是增強 CUDA 應用程序的編程模型和性能。 CUDA 繼續(xù)推動 GPU 加速度的邊界,并為 HPC 、可視化、 AI 、 ML 和 DL 和數(shù)據(jù)科學中的新應用奠定基礎。

CUDA 11.6 有幾個重要特性。這篇文章概述了關(guān)鍵功能:

GSP 驅(qū)動程序架構(gòu)現(xiàn)在默認為圖靈和安培 GPU

新 API 允許禁用實例化圖中的節(jié)點

完全支持 128 位整數(shù)類型

協(xié)作組命名空間更新

CUDA 編譯器更新

Nsight Compute 2022.1 版本

CUDA 11.6 附帶 R510 驅(qū)動程序,這是一個更新分支。 CUDA 11.6 工具包可供下載 。

GSP 驅(qū)動程序體系結(jié)構(gòu)

GSP 驅(qū)動程序體系結(jié)構(gòu)現(xiàn)在是所有列出的圖靈和安培 GPU 的默認驅(qū)動程序模式。較舊的驅(qū)動程序體系結(jié)構(gòu)作為后備支持。有關(guān)更多信息,請參閱 R510 驅(qū)動程序自述 。

實例化的圖形節(jié)點 API 添加

我們添加了一個新的 API cudaGraphNodeSetEnabled,以允許禁用實例化圖中的節(jié)點。在此版本中,支持僅限于內(nèi)核節(jié)點。相應的 API cudaGraphNodeGetEnabled允許查詢節(jié)點的啟用狀態(tài)。我們還添加了禁用空內(nèi)核圖節(jié)點啟動的功能。

128 位整數(shù)支持

CUDA 11.6 包括 128 位整數(shù)(__int128)數(shù)據(jù)類型的完整版本,包括編譯器和開發(fā)工具支持。主機端編譯器必須支持__int128類型才能使用此功能。

協(xié)作組名稱空間

協(xié)作組名稱空間已更新為新函數(shù),以提高命名、函數(shù)范圍以及單元維度和大小的一致性。

CUDA 編譯器

在編譯過程中向目標安裝的 GPU 添加了-arch=native編譯選項。這擴展了現(xiàn)有的-gencode=arch=compute_xx,code=sm_xx體系結(jié)構(gòu)規(guī)范

添加從nvlink創(chuàng)建 PTX 文件的功能

推薦的功能

不推薦使用用于設備上 fork 和 join 并行的cudaDeviceSynchronize(),以便為具有更高性能的替換編程模型做準備。這些函數(shù)在本版本中繼續(xù)工作,但這些工具會發(fā)出有關(guān)即將發(fā)生的更改的警告。

CentOS Linux 8 已經(jīng)到了生命的盡頭 在 2021 年 12 月 31 日,對這個操作系統(tǒng)的支持現(xiàn)在在 CUDA 工具包中被棄用。 CentOS Linux 8 支持將在未來版本中完全取消。

關(guān)于作者

Rob Armstrong 是 CUDA 工具包的主要技術(shù)產(chǎn)品經(jīng)理。 20 多年來,他一直專注于使用異構(gòu)硬件平臺加速軟件,并對計算機體系結(jié)構(gòu)和硬件/軟件交互特別感興趣。

Arthy Sundaram 是 CUDA 平臺的技術(shù)產(chǎn)品經(jīng)理。她擁有哥倫比亞大學計算機科學碩士學位。她感興趣的領域是操作系統(tǒng)、編譯器和計算機體系結(jié)構(gòu)。

Fred Oh 是 CUDA 、 CUDA on WSL 和 CUDA Python 的高級產(chǎn)品營銷經(jīng)理。弗雷德?lián)碛屑又荽髮W戴維斯分校計算機科學和數(shù)學學士學位。他的職業(yè)生涯開始于一名 UNIX 軟件工程師,負責將內(nèi)核服務和設備驅(qū)動程序移植到 x86 體系結(jié)構(gòu)。他喜歡《星球大戰(zhàn)》、《星際迷航》和 NBA 勇士隊。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    4823

    瀏覽量

    102666
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    27

    文章

    4652

    瀏覽量

    128499
收藏 人收藏

    評論

    相關(guān)推薦

    品英Pickering最新版本的微波開關(guān)設計工具, 增強了仿真能力和原理圖設計功能

    這 款免 費 在 線 工具的最新版本將在 EuMW 2024(9 月 24 日至 26 日,法國巴黎)上首次亮相,該版本的開關(guān)配置功能尤為突出。 ? 2024年9月25日,英國
    發(fā)表于 09-25 09:05 ?103次閱讀
    品英Pickering最<b class='flag-5'>新版本</b>的微波開關(guān)設計<b class='flag-5'>工具</b>,  增強了仿真能力和原理圖設計<b class='flag-5'>功能</b>

    經(jīng)緯恒潤INTEWORK-TPA 新版本正式發(fā)布

    正式推出INTEWORK-TPA5.2.0新版本,以科技的力量,為用戶帶來更智能的體驗升級!▎AI助力,高效測試新版本的AI小助理上線了!借助她的AI大模型能力,測試
    的頭像 發(fā)表于 08-30 11:46 ?384次閱讀
    經(jīng)緯恒潤INTEWORK-TPA <b class='flag-5'>新版本</b>正式發(fā)布

    GUI Guider V1.8.0全新版本正式上線

    在這個充滿創(chuàng)新與挑戰(zhàn)的時代,我們深知高效、靈活的GUI設計工具對人機交互應用的重要性。經(jīng)過幾個月的精心打磨與測試,GUI Guider V1.8.0全新版本正式上線了!本次更新不僅帶來了前所未有的設計自由度,更在功能優(yōu)化與用戶體
    的頭像 發(fā)表于 08-02 09:26 ?534次閱讀

    使用freeRTOS開發(fā)工具包時,在哪里可以找到freeRTOS的版本?

    作為主題,當我使用 freeRTOS 開發(fā)工具包時,在哪里可以找到 freeRTOS 的版本
    發(fā)表于 07-09 07:17

    單元測試工具TESSY 新版本亮點速覽:提供測試駕駛艙視圖、超級覆蓋率、代碼訪問分析、增強覆蓋率審查

    TESSY最新版本v5.1現(xiàn)已發(fā)布! 該版本可用于Windows和Linux,并提供各種有趣的新功能。一個突出的新功能是新的“測試駕駛艙視圖”,它可用于從整個軟件中確定要測試的源代碼文
    的頭像 發(fā)表于 07-08 16:20 ?362次閱讀
    單元測試<b class='flag-5'>工具</b>TESSY <b class='flag-5'>新版本</b>亮點速覽:提供測試駕駛艙視圖、超級覆蓋率、代碼訪問分析、增強覆蓋率審查

    新增6個實用功能!華秋DFM新版本來了

    市場反饋,致力于為廣大工程師用戶帶來更穩(wěn)定、更高效的功能體驗。在此次4.2新版本中,我們不僅優(yōu)化了一系列核心功能,大幅提升了軟件性能,還根據(jù)大家的反饋新增了幾項實用工具
    的頭像 發(fā)表于 07-05 08:07 ?775次閱讀
    新增6個實用<b class='flag-5'>功能</b>!華秋DFM<b class='flag-5'>新版本</b>來了

    谷歌DeepMind發(fā)布人工智能模型AlphaFold最新版本

    谷歌DeepMind近日發(fā)布了人工智能模型AlphaFold的最新版本——AlphaFold 3,這一革命性的工具將在藥物發(fā)現(xiàn)和疾病治療領域發(fā)揮巨大作用。
    的頭像 發(fā)表于 05-10 11:26 ?519次閱讀

    CANoe新版本18正式發(fā)布

    新版本持續(xù)為電動智能軟件開發(fā)測試帶來系列化的新功能新版本CANoe產(chǎn)品體系包括具有GUI交互的桌面版本、可部署在服務器后云端的服務器版本、
    的頭像 發(fā)表于 05-09 08:25 ?2704次閱讀
    CANoe<b class='flag-5'>新版本</b>18正式發(fā)布

    華為云 GeminiDB 發(fā)布新版本,全面支持 Redis 6.2

    月上線的新版本,GeminiDB 已全面支持 Redis 6.2,用戶可在華為云 GeminiDB 產(chǎn)品官網(wǎng)購買使用。新版本的 GeminiDB 發(fā)布了一系列增強功能,為用戶帶來云原生、高性能和易
    的頭像 發(fā)表于 04-08 18:22 ?1077次閱讀
    華為云 GeminiDB 發(fā)布<b class='flag-5'>新版本</b>,全面支持 Redis 6.2

    關(guān)于博達透傳工具新版本升級公告

    感謝您一直以來對博達智聯(lián)自主研發(fā)的遠程透傳工具的支持與信任!為提升廣大用戶的操作體驗,博達智聯(lián)團隊經(jīng)過不懈努力,不斷優(yōu)化產(chǎn)品功能,將透傳工具進行了全面的升級,即刻發(fā)出全新版本。相比于之
    的頭像 發(fā)表于 03-19 08:33 ?395次閱讀
    關(guān)于博達透傳<b class='flag-5'>工具</b><b class='flag-5'>新版本</b>升級公告

    TSMaster 2024年1月最新版本,新功能太實用

    、新增TTS機箱模塊、新增地圖顯示模塊等。一大波超實用的新功能,一起來看看吧!體驗新功能建議您將軟件更新至最新版本TSMaster下載鏈接01工具箱相關(guān)更新
    的頭像 發(fā)表于 02-19 12:12 ?1351次閱讀
    TSMaster 2024年1月最<b class='flag-5'>新版本</b>,新<b class='flag-5'>功能</b>太實用

    QE for Motor V1.3.0:汽車開發(fā)輔助工具解決方案工具包

    電子發(fā)燒友網(wǎng)站提供《QE for Motor V1.3.0:汽車開發(fā)輔助工具解決方案工具包.pdf》資料免費下載
    發(fā)表于 02-19 10:44 ?0次下載
    QE for Motor V1.3.0:汽車開發(fā)輔助<b class='flag-5'>工具</b>解決方案<b class='flag-5'>工具包</b>

    最新發(fā)布GSDK軟件開發(fā)工具包4.4.0版本,提高IoT無線設計效率

    SiliconLabs (亦稱 “ 芯科科技 ” )日前發(fā)布了 Gecko 軟件開發(fā)工具包( GSDK )的最新版本 4.4.0 。新釋出的 GSDK 是全球物聯(lián)網(wǎng)開發(fā)人員最關(guān)注物聯(lián)網(wǎng)的軟件開發(fā)平臺
    的頭像 發(fā)表于 12-18 16:40 ?532次閱讀
    最新發(fā)布GSDK軟件開發(fā)<b class='flag-5'>工具包</b>4.4.0<b class='flag-5'>版本</b>,提高IoT無線設計效率

    NPOI WEG報表工具包簡介

    很久以前就知道有NPOI這個報表工具包,因為有NI自帶的工具包就沒有詳細研究過。當前工作中幾臺電腦因為安裝OFFICE版本問題,或其它原因?qū)е伦詭蟊頍o法使用,就找來了一個群友共享的的NPOI
    的頭像 發(fā)表于 11-06 10:05 ?909次閱讀
    NPOI WEG報表<b class='flag-5'>工具包</b>簡介

    實戰(zhàn)經(jīng)驗 | TouchGFX從舊版本更新到新版本的方法

    TouchGFX 不斷進行軟件版本更新,其提供的功能也越來越豐富,有些新的功能只有更新的版本才有,所以很多時候會面臨將舊版本的 Touch
    的頭像 發(fā)表于 11-01 17:15 ?961次閱讀