一区二区免费中文字幕在线观看,97无码人妻,成人av手机在线观看

在目前廣泛應(yīng)用于AI的內(nèi)存方案中，包括片上存儲(chǔ)、HBM和GDDR。

作者 | 吳優(yōu)

人工智能經(jīng)過(guò)幾十年的發(fā)展，在數(shù)據(jù)爆炸時(shí)代正處于良性循環(huán)，大量的數(shù)據(jù)用于制造和訓(xùn)練神經(jīng)網(wǎng)絡(luò)，而后利用神經(jīng)網(wǎng)絡(luò)篩選并理解這些數(shù)據(jù)。

不過(guò)，我們?nèi)匀粚?duì)于更好的人工智能有巨大需求，據(jù)Open AI的一份報(bào)告顯示，從2012到2019年，人工智能訓(xùn)練集增長(zhǎng)將近30萬(wàn)倍，每3.43個(gè)月翻一番，比摩爾定律快25000倍，在摩爾定律將近失效的今天，那么怎么樣才能讓人工智能提供更好的性能？

內(nèi)存帶寬限制人工智能模型本身

早在兩年前，業(yè)內(nèi)就有人提出，在計(jì)算能力和數(shù)據(jù)量足夠的年代里，內(nèi)存帶寬才是人工智能發(fā)展的瓶頸。

德克薩斯高級(jí)計(jì)算中心（TACC）研究科學(xué)家曾在其2016年的報(bào)告《HPC系統(tǒng)中的內(nèi)存帶寬和系統(tǒng)平衡》中比較過(guò)去25年某些HPC服務(wù)器的浮點(diǎn)計(jì)算情況，結(jié)果顯示內(nèi)存、網(wǎng)絡(luò)延遲和帶寬大幅度落后于處理器性能，其中內(nèi)存帶寬大約每十年落后浮點(diǎn)計(jì)算4.5倍。

“一個(gè)非常有趣的現(xiàn)象是，內(nèi)存對(duì)人工智能的限制一部分體現(xiàn)在人工智能模型本身，以及用來(lái)訓(xùn)練這些模型的數(shù)據(jù)量規(guī)模急劇增長(zhǎng)。”Rambus 大中華區(qū)總經(jīng)理蘇雷在Rambus 2020中國(guó)設(shè)計(jì)峰會(huì)上說(shuō)到。

根據(jù)蘇雷的介紹，這種限制在人工智能傳統(tǒng)訓(xùn)練模型和并行訓(xùn)練模型上均有體現(xiàn)。

傳統(tǒng)神經(jīng)網(wǎng)絡(luò)訓(xùn)練通常只使用一個(gè)AI/ML引擎，即將神經(jīng)網(wǎng)絡(luò)模型和訓(xùn)練數(shù)據(jù)全都嵌入一顆芯片中，訓(xùn)練的數(shù)據(jù)在芯片中迭代循環(huán)，通過(guò)不斷更新模型實(shí)現(xiàn)對(duì)數(shù)據(jù)的分類、識(shí)別和處理，這一場(chǎng)景下其性能直接取決于計(jì)算引擎和緩存速度、內(nèi)存帶寬。

為提高數(shù)據(jù)訓(xùn)練時(shí)間，具體多個(gè)AI/ML引擎的神經(jīng)網(wǎng)絡(luò)得以出現(xiàn)，這種方法是神經(jīng)網(wǎng)絡(luò)模型的完整副本同時(shí)嵌入多個(gè)芯片中，神經(jīng)網(wǎng)絡(luò)模型所需的訓(xùn)練工作量被均分到每一顆芯片中，多個(gè)芯片引擎并行處理訓(xùn)練集，進(jìn)而提高訓(xùn)練時(shí)間。

并行方案的每一個(gè)訓(xùn)練步驟可分為兩個(gè)階段，每個(gè)階段受到的帶寬限制不盡相同。

在第一階段，每個(gè)訓(xùn)練的并行引擎將通過(guò)它們的訓(xùn)練結(jié)果更新其模型副本，因此并行訓(xùn)練的每個(gè)芯片在運(yùn)行完每一次訓(xùn)練迭代后，都會(huì)有不同的訓(xùn)練更新，因此這一階段數(shù)據(jù)傳輸?shù)叫酒乃俣戎苯尤Q于內(nèi)存帶寬的大小。

在第二階段，即規(guī)約階段（Reduction），需要每個(gè)引擎與所有其它引擎交互更新信息，讓芯片彼此了解其它芯片的更新并接受來(lái)著其他芯片的更新，得以更新自己的模型，恢復(fù)模型間的同步，再次擁有相同的模型副本。顯然，這一階段的性能主要取決于芯片間鏈路帶寬的限制。

HBM 2和GDDR 6，更多的內(nèi)存選擇

“為縮小內(nèi)存帶寬和高性能浮點(diǎn)計(jì)算之間的差距等問(wèn)題，我們有新的系統(tǒng)架構(gòu)和面向特定領(lǐng)域的硅，或者將更多的數(shù)據(jù)直接放在芯片上，以獲得更高的帶寬，更好的功率和更低的延遲，但是數(shù)據(jù)總是越來(lái)越大，需要更多的內(nèi)存，所以依然需要在片外存儲(chǔ)器和鏈路性能上取得突破?！盧aymond Su表示。

在目前廣泛應(yīng)用于AI的內(nèi)存方案中，片上存儲(chǔ)（On-Chip Memory）就是Raymond Su所言的擁有最高帶寬和功率效率但容量有限的方案，其他兩種方案分別是HBM和GDDR，即DRAM解決方案。

HBM是一種基于3D堆棧工藝的高性能DRAM。第一代HBM誕生于2013年，最新一代HBM標(biāo)準(zhǔn)已經(jīng)演進(jìn)到HBM2E，能夠支持12個(gè)DRAM的堆棧，內(nèi)存容量高達(dá)每堆棧24GB，當(dāng)傳輸速率達(dá)到每管腳3.6Gbps時(shí)，HBM2E可以實(shí)現(xiàn)每堆棧461GB/s的內(nèi)存帶寬。

由于HBM2E堆棧需要通過(guò)高達(dá)1700多條數(shù)據(jù)“線”的接口連接到相關(guān)處理器，遠(yuǎn)遠(yuǎn)超過(guò)標(biāo)準(zhǔn)PCB能夠支持的范圍，因此使用硅中介層作為連接內(nèi)存堆棧和處理器的中介，在硅中介層中完成精細(xì)的數(shù)據(jù)走線，獲得HBM接口所需數(shù)量的數(shù)據(jù)線數(shù)。

HBM2E通過(guò)堆疊技術(shù)實(shí)現(xiàn)高帶寬和高容量，但由于硅中介層的使用，成本偏高。

GDDR是雙倍數(shù)據(jù)傳輸率存儲(chǔ)器，采用傳統(tǒng)的方法將標(biāo)準(zhǔn)PCB和測(cè)試的DRAMs與SoC連接在一起，具有較高的帶寬和較好的能耗效率，其缺點(diǎn)在于更難保證信號(hào)完整性和電源完整性。

比較256GB/s下HBM2和GDDR6，HBM2E的接口寬而慢，GDDR6的接口窄而快。HBM2占有面積優(yōu)勢(shì)和能耗優(yōu)勢(shì)，但GDDR6具有成本和方案工程上的實(shí)現(xiàn)優(yōu)勢(shì)。

HBM2與GDDR6內(nèi)存解決方案的高帶寬已經(jīng)顯而易見(jiàn)，不過(guò)想要真正落實(shí)到實(shí)現(xiàn)高性能人工智能的應(yīng)用上，還需要IP供應(yīng)商的支持，在HBM2和GDDR6內(nèi)存解決方案的IP供應(yīng)中，Rambus就扮演重要角色。

根據(jù)Rambus資深應(yīng)用工程師曹汪洋在Rambus 2020中國(guó)設(shè)計(jì)峰會(huì)上的介紹，Rambus的HMB2E接口解決方案（PHY和控制器）專為AI/ML、HPC的高性能和低延遲而設(shè)計(jì)。Rambus HBM Gen2 PHY 完全符合JEDEC HBM2E標(biāo)準(zhǔn)，支持每個(gè)數(shù)據(jù)引腳高達(dá)3.6Gbps 的數(shù)據(jù)速率，總帶寬因此達(dá)到461 GB/s。該接口具有8個(gè)獨(dú)立信道，每個(gè)信道包含128位，總數(shù)據(jù)寬度為 1024 位，支持2、4、8 或 12個(gè)DRAM的堆棧高度。

Rambus GDDR6 PHY每個(gè)引腳的速度高達(dá)16 Gbps，可用于TSMC 7nm工藝，GDDR6接口支持2個(gè)信道，每個(gè)信道有16位，總數(shù)據(jù)寬度為32位。另外，Rambus GDDR6 PHY 每個(gè)引腳的速度高達(dá)16 Gbps，最高可提供 64 GB/s 的帶寬。

在Rambus 2020中國(guó)設(shè)計(jì)峰會(huì)的交流環(huán)節(jié)，蘇雷向雷鋒網(wǎng)表示： “Rambus 是全球HBM IP技術(shù)的引領(lǐng)者，且在市場(chǎng)份額上排名第一，全球范圍內(nèi)擁有50多個(gè)成功案例，Rambus最新的Rambus HBM2E的方案可以實(shí)現(xiàn)全球最高的4Gpbs速率，GDDR6方案可以實(shí)現(xiàn)18Gbps速率，位于業(yè)界頂尖水平，這能夠幫助客戶的方案設(shè)計(jì)提供足夠裕量空間，保證整個(gè)系統(tǒng)的穩(wěn)定性，目前燧原已將選擇了Rambus作為其下一代AI訓(xùn)練芯片的合作伙伴?！?/p>

高帶寬之后，信號(hào)完整性也是挑戰(zhàn)

在上述文章中提到，HBM和GDDR是可以為AI/ML提供高帶寬，其中速率更高的GDDR6面臨著信號(hào)完整性和電源完整性的挑戰(zhàn)。

據(jù)雷鋒網(wǎng)了解，信道中不同類型的損耗是影響信號(hào)完整性的主要因素，具體又可以分為插入損耗、反射和串?dāng)_，插入損耗產(chǎn)于介電損耗或金屬電阻表面粗糙程度，主要通過(guò)較好的PCB和封裝設(shè)計(jì)來(lái)控制。信號(hào)反射源于阻抗，最終會(huì)導(dǎo)致眼圖閉合和信號(hào)丟失。串?dāng)_由于兩個(gè)信號(hào)之間的電容和電感耦合引起的，由于從信號(hào)中消除串?dāng)_的電路很復(fù)雜，因此串?dāng)_是GDDR6 DRAM信號(hào)完整性最具挑戰(zhàn)性的問(wèn)題。

針對(duì)信號(hào)完整性問(wèn)題，蘇雷表示：“ 要確保信號(hào)的完整性，就需要從發(fā)送端到接收端進(jìn)行的完整系統(tǒng)建模，需要采用協(xié)同設(shè)計(jì)的方案。Rambus 的GDDR6 PHY解決方案可以穩(wěn)定在18Gbps并確保傳輸眼圖清晰，走在業(yè)界最前列。在高速的傳輸下，還需要對(duì)電路板上的封裝設(shè)計(jì)進(jìn)行建模，使用比如DFE和反轉(zhuǎn)等技術(shù)，可以提高性能讓眼圖更好的打開(kāi) 。”

當(dāng)然除了信號(hào)完整性和電源完成性，DRAM數(shù)據(jù)速率的增長(zhǎng)還導(dǎo)致更多其他的問(wèn)題，“我們需要做的還是兼顧能耗的制約，不斷找尋和提升內(nèi)存帶寬的方法，為AI/ML更高的性能?！碧K雷說(shuō)道。

責(zé)任編輯：PSY

聲明：本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

帶寬

帶寬

+關(guān)注

關(guān)注
3

文章
890

瀏覽量
40759
AI

AI

+關(guān)注

關(guān)注
87

文章
29438

瀏覽量
267757
人工智能

人工智能

+關(guān)注

關(guān)注
1789

文章
46401

瀏覽量
236629

評(píng)論

相關(guān)推薦

RISC-V在AI領(lǐng)域的發(fā)展前景怎么樣？

隨著人工智能的不斷發(fā)展，現(xiàn)在的視覺(jué)機(jī)器人，無(wú)人駕駛等智能產(chǎn)品的不斷更新迭代，發(fā)現(xiàn)ARM占用很大的市場(chǎng)份額，推出的ARM Cortex M85性能也是杠杠的，不知道RISC-V在AI領(lǐng)域

發(fā)表于 10-25 19:13

《AI for Science：人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第6章人AI與能源科學(xué)讀后感

不僅提高了能源的生產(chǎn)效率和管理水平，還為未來(lái)的可持續(xù)發(fā)展提供了有力保障。隨著技術(shù)的不斷進(jìn)步和應(yīng)用場(chǎng)景的不斷拓展，人工智能將在能源科學(xué)領(lǐng)域發(fā)揮更加重要的作用。總結(jié) 《AI for Science：

發(fā)表于 10-14 09:27

AI for Science：人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第4章-AI與生命科學(xué)讀后感

很幸運(yùn)社區(qū)給我一個(gè)閱讀此書(shū)的機(jī)會(huì)，感謝平臺(tái)。《AI for Science：人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第4章關(guān)于AI與生命科學(xué)的部分，為我們揭示了人工智能技術(shù)在生命科學(xué)領(lǐng)域中的廣泛應(yīng)用和

發(fā)表于 10-14 09:21

《AI for Science：人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第二章AI for Science的技術(shù)支撐學(xué)習(xí)心得

非常高興本周末收到一本新書(shū)，也非常感謝平臺(tái)提供閱讀機(jī)會(huì)。這是一本挺好的書(shū)，包裝精美，內(nèi)容詳實(shí)，干活滿滿。關(guān)于《AI for Science：人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第二章“AI

發(fā)表于 10-14 09:16

《AI for Science：人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第一章人工智能驅(qū)動(dòng)的科學(xué)創(chuàng)新學(xué)習(xí)心得

周末收到一本新書(shū)，非常高興，也非常感謝平臺(tái)提供閱讀機(jī)會(huì)。這是一本挺好的書(shū)，包裝精美，內(nèi)容詳實(shí)，干活滿滿。《AI for Science：人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》這本書(shū)的第一章，作為整個(gè)著作的開(kāi)篇

發(fā)表于 10-14 09:12

risc-v在人工智能圖像處理應(yīng)用前景分析

、RISC-V在人工智能圖像處理中的應(yīng)用案例目前，已有多個(gè)案例展示了RISC-V在人工智能圖像處理中的應(yīng)用潛力。例如： Esperanto技術(shù)公司：該公司制造的首款高性能RISC-V AI

發(fā)表于 09-28 11:00

人工智能ai 數(shù)電模電模擬集成電路原理電路分析

人工智能ai 數(shù)電模電模擬集成電路原理電路分析想問(wèn)下哪些比較容易學(xué) 不過(guò)好像都是要學(xué)的

發(fā)表于 09-26 15:24

人工智能ai4s試讀申請(qǐng)

目前人工智能在繪畫(huà)對(duì)話等大模型領(lǐng)域應(yīng)用廣闊，ai4s也是方興未艾。但是如何有效利用ai4s工具助力科研是個(gè)需要研究的課題，本書(shū)對(duì)ai4s基本原理和原則，方法進(jìn)行描訴，有利于總結(jié)經(jīng)驗(yàn)，擬

發(fā)表于 09-09 15:36

名單公布！【書(shū)籍評(píng)測(cè)活動(dòng)NO.44】AI for Science：人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新

！《AI for Science：人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》這本書(shū)便將為讀者徐徐展開(kāi)AI for Science的美麗圖景，與大家一起去了解： 人工智能究竟幫科學(xué)家做了什么？

發(fā)表于 09-09 13:54

如何設(shè)計(jì)具有放大器帶寬限制的MFB濾波器

電子發(fā)燒友網(wǎng)站提供《如何設(shè)計(jì)具有放大器帶寬限制的MFB濾波器.pdf》資料免費(fèi)下載

發(fā)表于 08-28 11:09 ?0次下載

報(bào)名開(kāi)啟！深圳（國(guó)際）通用人工智能大會(huì)將啟幕，國(guó)內(nèi)外大咖齊聚話AI

8月28日至30日，2024深圳（國(guó)際）通用人工智能大會(huì)暨深圳（國(guó)際）通用人工智能產(chǎn)業(yè)博覽會(huì)將在深圳國(guó)際會(huì)展中心（寶安）舉辦。大會(huì)以“魅力AI·無(wú)限未來(lái)”為主題，致力于打造全球通用人工智能

發(fā)表于 08-22 15:00

FPGA在人工智能中的應(yīng)用有哪些？

定制化的硬件設(shè)計(jì)，提高了硬件的靈活性和適應(yīng)性。綜上所述，F(xiàn)PGA在人工智能領(lǐng)域的應(yīng)用前景廣闊，不僅可以用于深度學(xué)習(xí)的加速和云計(jì)算的加速，還可以針對(duì)特定應(yīng)用場(chǎng)景進(jìn)行定制化計(jì)算，為人工智能技術(shù)的發(fā)展提供有力支持。

發(fā)表于 07-29 17:05

示波器帶寬限制怎么設(shè)置

示波器作為電子工程師和科學(xué)領(lǐng)域?qū)I(yè)人士的重要工具，主要用于捕獲和顯示電信號(hào)波形。在示波器的設(shè)置中，帶寬限制是一個(gè)關(guān)鍵參數(shù)，它決定了示波器能夠準(zhǔn)確響應(yīng)和顯示的信號(hào)頻率范圍。正確設(shè)置帶寬限制對(duì)于確保測(cè)量結(jié)果的準(zhǔn)確性至關(guān)重要。本文將詳細(xì)介紹示波器

發(fā)表于 05-17 17:04 ?3066次閱讀

嵌入式人工智能的就業(yè)方向有哪些?

。國(guó)內(nèi)外科技巨頭紛紛爭(zhēng)先入局，在微軟、谷歌、蘋(píng)果、臉書(shū)等積極布局人工智能的同時(shí)，國(guó)內(nèi)的BAT、華為、小米等科技公司也相繼切入到嵌入式人工智能的賽道。那么嵌入式AI可就業(yè)的方向有哪些呢？嵌入式

發(fā)表于 02-26 10:17

人工智能服務(wù)器高性能計(jì)算需求

人工智能(AI)服務(wù)器是一種專門(mén)為了運(yùn)行人工智能應(yīng)用和提供大數(shù)據(jù)處理能力而設(shè)計(jì)的高性能計(jì)算機(jī)。它既可以支持本地應(yīng)用程序和網(wǎng)頁(yè)，也可以為云和本

發(fā)表于 12-08 09:44 ?448次閱讀

搜索歷史

被帶寬限制的AI性能，怎么樣才能讓人工智能提供更好的性能？

評(píng)論

RISC-V在AI領(lǐng)域的發(fā)展前景怎么樣？

《AI for Science：人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第6章人AI與能源科學(xué)讀后感

AI for Science：人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第4章-AI與生命科學(xué)讀后感

《AI for Science：人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第二章AI for Science的技術(shù)支撐學(xué)習(xí)心得

《AI for Science：人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第一章人工智能驅(qū)動(dòng)的科學(xué)創(chuàng)新學(xué)習(xí)心得

risc-v在人工智能圖像處理應(yīng)用前景分析

人工智能ai 數(shù)電模電模擬集成電路原理電路分析

人工智能ai4s試讀申請(qǐng)

名單公布！【書(shū)籍評(píng)測(cè)活動(dòng)NO.44】AI for Science：人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新

如何設(shè)計(jì)具有放大器帶寬限制的MFB濾波器

報(bào)名開(kāi)啟！深圳（國(guó)際）通用人工智能大會(huì)將啟幕，國(guó)內(nèi)外大咖齊聚話AI

FPGA在人工智能中的應(yīng)用有哪些？

示波器帶寬限制怎么設(shè)置

嵌入式人工智能的就業(yè)方向有哪些?

人工智能服務(wù)器高性能計(jì)算需求

搜索歷史

被帶寬限制的AI性能，怎么樣才能讓人工智能提供更好的性能？

評(píng)論

被帶寬限制的AI性能，怎么樣才能讓人工智能提供更好的性能？