AMD在本周的SC20虛擬會(huì)議上,推出了基于他們CDNA架構(gòu)的AMD Instinct MI100加速器。另外值得注意的是,與MI100發(fā)布同時(shí)進(jìn)行的還有Radeon Open eCosystem 4.0(ROCm 4.0)Linux版本。AMD認(rèn)為MI100是世界上最快的HPC GPU加速器,提供超過10TFLOPS的FP64計(jì)算能力。MI100額定峰值FP64性能為11.5 TFLOPS,F(xiàn)P32矩陣性能高達(dá)46.1 TFLOPS。與上一代AMD加速器相比,搭配AMD矩陣核心技術(shù)的MI100在人工智能訓(xùn)練方面的FP16峰值性能提升近7倍。
AMD Instinct MI100內(nèi)建32GB HBM2內(nèi)存,工作頻率1.2GHz,內(nèi)存帶寬為1.23TB/s。MI100支持PCI Express 4.0連接,內(nèi)建120個(gè)計(jì)算單元和7680個(gè)流處理器。CDNA是Vega架構(gòu)演化版本,而不是針對(duì)游戲優(yōu)化的RDNA/Navi架構(gòu),考慮到HPC的重點(diǎn)和我們看到Arcturus Linux補(bǔ)丁成熟的時(shí)間,AMD Instinct MI100支持的Linux支持應(yīng)該是很好的推出狀態(tài),盡管我們還沒能測試加速器以確認(rèn)其Linux支持狀態(tài)。
AMD Instinct MI100使用32GB HBM2內(nèi)存,時(shí)鐘速率為1.2GHz,內(nèi)存帶寬為1.23TB/s。MI100支持PCI Express 4.0連接,可打包120個(gè)計(jì)算單元和7680個(gè)流處理器。CDNA是織女星結(jié)構(gòu)的進(jìn)化,而不是游戲優(yōu)化而不是計(jì)算的RDNA/Navi??紤]到AMD對(duì)HPC的關(guān)注以及Arcturus Linux補(bǔ)丁準(zhǔn)備在即,AMD Instinct MI100應(yīng)該很好的支持到Linux。
這次推出的ROCm 4.0讓它比以往更容易更高效地將NVIDIA CUDA代碼庫移植到它上面。ROCm 4.0被宣傳為 “Exascale時(shí)代 ”的開源平臺(tái),同時(shí)支持OpenMP 5.0行業(yè)標(biāo)準(zhǔn)及其HIP接口,以及PyTorch和Tensorflow框架等。ROCm進(jìn)化目的是讓開發(fā)者更容易部署和移植他們的軟件,使其運(yùn)行在這個(gè)開源計(jì)算棧上,而不是NVIDIA專有的 CUDA平臺(tái)。
AMD還在SC20虛擬會(huì)議上表示,EPYC “Zen 3 ”處理器本季度將批量提供給部分HPC和云計(jì)算客戶。AMD EPYC Zen 3 CPU將在2021年第一季度正式發(fā)布和上市。
責(zé)任編輯:haq
-
amd
+關(guān)注
關(guān)注
25文章
5402瀏覽量
133706 -
加速器
+關(guān)注
關(guān)注
2文章
788瀏覽量
37562 -
內(nèi)存
+關(guān)注
關(guān)注
8文章
2942瀏覽量
73728
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論