0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

PyTorch 1.8發(fā)布,支持AMD ROCm

深度學(xué)習(xí)自然語言處理 ? 來源:量子位 ? 作者:夢(mèng)晨 ? 2021-03-08 10:50 ? 次閱讀

1.8版本中,官方終于加入了對(duì)AMD ROCm的支持,可以方便的在原生環(huán)境下運(yùn)行,不用去配置Docker了。

△AMD ROCm只支持Linux操作系統(tǒng)

1.8版本集合了自2020年10月1.7發(fā)布以來的超過3000次GitHub提交。 此外,本次更新還有諸多亮點(diǎn):

優(yōu)化代碼,更新編譯器

Python內(nèi)函數(shù)轉(zhuǎn)換

增強(qiáng)分布式訓(xùn)練

新的移動(dòng)端教程與演示

新的性能檢測(cè)工具

相關(guān)的庫TorchCSPRNG, TorchVision, TorchText和TorchAudio也會(huì)隨之更新。 要注意的是,自1.6起,Pytorch新特性將分為Stable、Beta、Prototype三種版本。其中Prototype不會(huì)包含到穩(wěn)定發(fā)行版中,需要從Nightly版本自行編譯。

Python to Python函數(shù)轉(zhuǎn)換

新增的Beta特性torch.fx可以實(shí)現(xiàn)Python到Python的函數(shù)轉(zhuǎn)換,可以方便的加入任何工作流程。

新的API,向NumPy學(xué)習(xí)!

1.7版本中增加的Beta特性torch.fft已成為正式特性。實(shí)現(xiàn)了與Numpy中的np.fft類似的快速傅立葉變換,還增加了硬件加速支持與自動(dòng)求導(dǎo),以更好的支持科學(xué)計(jì)算。 還增加了Beta版NumPy風(fēng)格的線性代數(shù)模塊torch.linalg,支持Cholesky分解、行列式、特征值等功能。

增強(qiáng)分布式訓(xùn)練

增加了穩(wěn)定的異步錯(cuò)誤與超時(shí)處理,增加NCCL的可靠性。 增加了Beta版的流水線并行功能*(Pipeline Parallelism)*,可將數(shù)據(jù)拆解成更小的塊以提高并行計(jì)算效率。

△Pipeline Parallelism使用4個(gè)GPU時(shí)的工作示意圖

增加Beta版的DDP通訊鉤子,用于控制如何在workers之間同步梯度。 另外還有一些Prototype版的分布式訓(xùn)練新特性。ZeroRedundancyOptimizer:用于減少所有參與進(jìn)程的內(nèi)存占用。Process Group NCCL Send/Recv:讓用戶可在Python而不是C++上進(jìn)行集合運(yùn)算。CUDA-support in RPC using TensorPipe:增加對(duì)N卡多卡運(yùn)算的效率。Remote Module:讓用戶像操作本地模塊一樣操作遠(yuǎn)程模塊。

移動(dòng)端新教程

隨本次更新發(fā)布了圖像分割模型DeepLabV3在安卓和IOS上的詳細(xì)教程。 以及圖像分割、目標(biāo)檢測(cè)、神經(jīng)機(jī)器翻譯等在安卓和IOS上的演示程序,方便大家更快上手。

另外還有PyTorch Mobile Lite Interpreter解釋器,可以減少運(yùn)行時(shí)文件的大小。

原文標(biāo)題:PyTorch 1.8來了!正式支持AMD GPU,煉丹不必NVIDIA

文章出處:【微信公眾號(hào):深度學(xué)習(xí)自然語言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

責(zé)任編輯:haq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • amd
    amd
    +關(guān)注

    關(guān)注

    25

    文章

    5407

    瀏覽量

    133748
  • python
    +關(guān)注

    關(guān)注

    54

    文章

    4760

    瀏覽量

    84313
  • pytorch
    +關(guān)注

    關(guān)注

    2

    文章

    795

    瀏覽量

    13091

原文標(biāo)題:PyTorch 1.8來了!正式支持AMD GPU,煉丹不必NVIDIA

文章出處:【微信號(hào):zenRRan,微信公眾號(hào):深度學(xué)習(xí)自然語言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    AMD的銳龍9000系列處理器將延后至8月發(fā)布

    國際媒體傳來消息,AMD公司已正式向其全球合作伙伴宣布,原計(jì)劃于7月31日面世的銳龍9000系列處理器將延后至8月發(fā)布。這一調(diào)整源自于AMD在最終品質(zhì)檢驗(yàn)階段發(fā)現(xiàn)的首批生產(chǎn)批次未能全面符合其嚴(yán)苛的質(zhì)量標(biāo)準(zhǔn)。
    的頭像 發(fā)表于 07-25 14:24 ?615次閱讀

    HPMicro Arduino支持包v0.1.0發(fā)布,適配功能揭曉!

    HPMicro Arduino支持包v0.1.0發(fā)布,適配功能揭曉!
    的頭像 發(fā)表于 07-11 08:18 ?379次閱讀
    HPMicro Arduino<b class='flag-5'>支持</b>包v0.1.0<b class='flag-5'>發(fā)布</b>,適配功能揭曉!

    tensorflow和pytorch哪個(gè)更簡單?

    PyTorch更簡單。選擇TensorFlow還是PyTorch取決于您的具體需求和偏好。如果您需要一個(gè)易于使用、靈活且具有強(qiáng)大社區(qū)支持的框架,PyTorch可能是一個(gè)更好的選擇。如果
    的頭像 發(fā)表于 07-05 09:45 ?621次閱讀

    Fedora 40發(fā)布,全方位升級(jí)并新增PyTorch支持

    在人工智能領(lǐng)域,F(xiàn)edora 40首次引入了PyTorch軟件包。盡管PyTorch是一款廣受歡迎的深度學(xué)習(xí)框架,但其驅(qū)動(dòng)程序及庫的正確安裝往往較為困難。
    的頭像 發(fā)表于 04-24 10:45 ?905次閱讀

    AMD ROCm 6.1升級(jí)MIPOpen 3.1,引入AI參數(shù)預(yù)測(cè)模型

    在此期間,AMD 頻繁向GitHub公共倉庫推送有關(guān) ROCm 6.1 的最新開發(fā)進(jìn)展,透露出不久后有可能正式上線新版本的意圖。
    的頭像 發(fā)表于 02-29 14:33 ?637次閱讀

    RZ/G柔性軟件包v2.0.1發(fā)布說明

    電子發(fā)燒友網(wǎng)站提供《RZ/G柔性軟件包v2.0.1發(fā)布說明.pdf》資料免費(fèi)下載
    發(fā)表于 02-21 10:48 ?0次下載
    RZ/G柔性軟件包v2.0.1<b class='flag-5'>發(fā)布</b>說明

    16位單片機(jī)RL78系列Rev.1.20發(fā)布說明

    電子發(fā)燒友網(wǎng)站提供《16位單片機(jī)RL78系列Rev.1.20發(fā)布說明.pdf》資料免費(fèi)下載
    發(fā)表于 02-19 10:15 ?0次下載
    16位單片機(jī)RL78系列Rev.1.20<b class='flag-5'>發(fā)布</b>說明

    QE for Motor V1.3.0發(fā)布說明

    電子發(fā)燒友網(wǎng)站提供《QE for Motor V1.3.0發(fā)布說明.pdf》資料免費(fèi)下載
    發(fā)表于 02-19 09:35 ?0次下載
    QE for Motor V1.3.0<b class='flag-5'>發(fā)布</b>說明

    RZ/V2L DRP-AI支持包版本.7.41發(fā)布說明

    電子發(fā)燒友網(wǎng)站提供《RZ/V2L DRP-AI支持包版本.7.41發(fā)布說明.pdf》資料免費(fèi)下載
    發(fā)表于 02-01 10:07 ?0次下載
    RZ/V2L DRP-AI<b class='flag-5'>支持</b>包版本.7.41<b class='flag-5'>發(fā)布</b>說明

    RZ/V多操作系統(tǒng)包V1.12發(fā)布說明

    電子發(fā)燒友網(wǎng)站提供《RZ/V多操作系統(tǒng)包V1.12發(fā)布說明.pdf》資料免費(fèi)下載
    發(fā)表于 02-01 09:47 ?0次下載
    RZ/V多操作系統(tǒng)包V1.12<b class='flag-5'>發(fā)布</b>說明

    嵌入式目標(biāo)V6.06.00發(fā)布說明

    電子發(fā)燒友網(wǎng)站提供《嵌入式目標(biāo)V6.06.00發(fā)布說明.pdf》資料免費(fèi)下載
    發(fā)表于 02-01 09:26 ?0次下載
    嵌入式目標(biāo)V6.06.00<b class='flag-5'>發(fā)布</b>說明

    e2 studio 2024-01發(fā)布說明

    電子發(fā)燒友網(wǎng)站提供《e2 studio 2024-01發(fā)布說明.pdf》資料免費(fèi)下載
    發(fā)表于 01-30 09:47 ?1次下載
    e2 studio 2024-01<b class='flag-5'>發(fā)布</b>說明

    CS+適用于CC V8.11.00發(fā)布說明

    電子發(fā)燒友網(wǎng)站提供《CS+適用于CC V8.11.00發(fā)布說明.pdf》資料免費(fèi)下載
    發(fā)表于 01-29 11:46 ?0次下載
    CS+適用于CC V8.11.00<b class='flag-5'>發(fā)布</b>說明

    電容式觸摸的QE V3.3.0發(fā)布說明

    電子發(fā)燒友網(wǎng)站提供《電容式觸摸的QE V3.3.0發(fā)布說明.pdf》資料免費(fèi)下載
    發(fā)表于 01-29 10:58 ?0次下載
    電容式觸摸的QE V3.3.0<b class='flag-5'>發(fā)布</b>說明

    AMD CES 2024發(fā)布會(huì)時(shí)間定檔1月8日

    據(jù)外媒報(bào)道,全球領(lǐng)先的芯片制造商AMD正式宣布,將于美國東部標(biāo)準(zhǔn)時(shí)間1月8日上午10點(diǎn)(北京時(shí)間1月8日23:00)舉行CES 2024發(fā)布會(huì)。這一消息引起了業(yè)界和消費(fèi)者的廣泛關(guān)注。
    的頭像 發(fā)表于 01-08 15:05 ?1674次閱讀