0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

用模擬芯片取代數(shù)字芯片?

摩爾學堂 ? 來源:摩爾學堂 ? 2023-08-28 15:38 ? 次閱讀

盡管我們?nèi)蕴幱?a target="_blank">人工智能革命的邊緣,但人工智能已經(jīng)開始徹底改變我們的生活和工作方式。只有一個問題:人工智能技術(shù)非常耗電。據(jù)估計,運行大型人工智能模型在其生命周期內(nèi)產(chǎn)生的排放量比普通美國汽車還要多。

人工智能的未來需要能源效率方面的新創(chuàng)新,從模型的設計方式到運行模型的硬件。在一個日益受到氣候變化威脅的世界中,人工智能能源效率的任何進步對于跟上人工智能快速擴大的碳足跡都至關(guān)重要。

IBM 研究中心在人工智能效率方面的最新突破之一依賴于模擬芯片,即功耗低得多的芯片。在今天發(fā)表在《自然》雜志上的一篇論文中,來自世界各地 IBM 實驗室的研究人員展示了他們的原型模擬 AI 芯片,用于節(jié)能語音識別和轉(zhuǎn)錄。他們的設計被用于兩個人工智能推理實驗,在這兩種情況下,模擬芯片都像同類全數(shù)字設備一樣可靠地執(zhí)行這些任務,但完成任務的速度更快,消耗的能源更少。

為人工智能推理設計模擬芯片的概念并不新鮮——研究人員多年來一直在考慮這個想法。早在 2021 年,IBM 的一個團隊就開發(fā)了使用當電脈沖施加到材料上時,相變存儲器 (PCM) 就會工作,從而改變設備的電導率。該材料在非晶相和結(jié)晶相之間切換,較低的電脈沖將使器件更加結(jié)晶,提供較小的電阻,而足夠高的電脈沖使器件非晶態(tài),從而產(chǎn)生大電阻。PCM 設備不是記錄數(shù)字系統(tǒng)中常見的 0 或 1,而是將其狀態(tài)記錄為非晶態(tài)和晶態(tài)之間的連續(xù)值。該值稱為突觸權(quán)重,可以存儲在每個 PCM 設備的物理原子配置中。存儲器是非易失性的,因此當電源關(guān)閉時重量仍會保留。相變存儲器將神經(jīng)網(wǎng)絡的權(quán)重直接編碼到物理芯片上。但該領(lǐng)域之前的研究尚未表明如何將此類芯片用于我們所看到的當今人工智能領(lǐng)域主導的大規(guī)模模型。例如,GPT-3 是較大的流行模型之一,擁有 1750 億個參數(shù)或權(quán)重。

IBM 研究團隊創(chuàng)建的設計可以在每個芯片上編碼 3500 萬個相變存儲設備;換句話說,模型具有多達 1700 萬個參數(shù)。雖然其規(guī)模尚未與當今最先進的生成式人工智能模型相媲美,但將這些芯片組合在一起使其能夠像數(shù)字芯片一樣有效地處理真實人工智能用例的實驗。

團隊采取的方法是優(yōu)化在計算中,尤其是在數(shù)字信號處理中,MAC 運算是指計算兩個數(shù)字的乘積并將其添加到累加器(CPU 中處理算術(shù)運算的部分)。MAC 是一個基本的計算單元。乘法累加 (MAC) 運算主導深度學習計算。通過讀取電阻式非易失性存儲器 (NVM) 器件陣列的行,然后沿列收集電流,該團隊表明他們可以在存儲器內(nèi)執(zhí)行 MAC。這樣就無需在芯片的內(nèi)存和計算區(qū)域之間或跨芯片移動權(quán)重。模擬芯片還可以并行執(zhí)行許多MAC操作,從而節(jié)省時間和能源。

模擬概念具有巨大潛力,但芯片設計和制造也面臨重大挑戰(zhàn):模擬計算本質(zhì)上不精確,必須開發(fā)新工藝才能大規(guī)模生產(chǎn)高產(chǎn)量 NVM,并將模擬芯片連接到傳統(tǒng)數(shù)字芯片。系統(tǒng)。但 IBM 的研究人員所做的工作表明,這些芯片在未來可能會像數(shù)字芯片一樣有用。

測試模擬人工智能硬件

IBM 研究中心的團隊設計了兩個實驗來測試其設計的有效性。第一個圍繞關(guān)鍵字話語檢測。就像您希望智能揚聲器在您大聲說“嘿 Siri”或“嘿 Google”時做出響應一樣,該團隊希望看到他們可以使用他們的芯片設計來識別特定的口語單詞。他們構(gòu)建了一個可監(jiān)聽 12 個單詞的系統(tǒng),在每種情況下,模擬芯片都能以與當今基于軟件的系統(tǒng)相同的精度對每個單詞做出反應,但速度要快得多。如今等待和偵聽特定關(guān)鍵字的系統(tǒng)需要電源才能閑置等待,而團隊創(chuàng)建的設計可以在不需要時關(guān)閉電源,因為模型權(quán)重存儲在芯片上的非易失性存儲器中。

使用上傳到MLCommons(行業(yè)基準測試和協(xié)作網(wǎng)站)的模型,該團隊可以將演示系統(tǒng)的功效與在數(shù)字硬件上運行的系統(tǒng)進行比較。由 MLCommons 開發(fā)的MLPerf 存儲庫基準數(shù)據(jù)顯示,IBM 原型比同一網(wǎng)絡類別中最佳 MLPerf 提交快七倍,同時保持高精度。該模型使用硬件感知訓練在 GPU 上進行訓練,然后部署在團隊的模擬 AI 芯片上。

第二個實驗規(guī)模相當大,暗示未來可以使用基于模擬芯片的生成人工智能系統(tǒng)來代替數(shù)字芯片。它的目標是使用團隊的五個芯片縫合在一起來實現(xiàn)一個大型復雜的模型,并模擬片外數(shù)字計算,以展示模擬人工智能的可擴展性。研究人員運行了 MLPerf 上發(fā)現(xiàn)的循環(huán)神經(jīng)網(wǎng)絡轉(zhuǎn)換器(RNNT)語音到文本模型,以逐個字母地轉(zhuǎn)錄一個人所說的內(nèi)容。RNNT 在當今的許多現(xiàn)實應用中很受歡迎,包括虛擬助手、媒體內(nèi)容搜索和字幕系統(tǒng)以及臨床文檔和聽寫。

該系統(tǒng)包含 5 個芯片上 1.4 億個 PCM 設備的 4500 萬個權(quán)重。它能夠采集人們說話的音頻并以非常接近數(shù)字硬件設置的精度進行轉(zhuǎn)錄。與第一個演示不同,這個演示并不完全是端到端的,這意味著它確實需要一些片外數(shù)字計算。然而,這里涉及的額外計算很少,如果在芯片上實現(xiàn),最終的能源效率仍然高于當今市場上的產(chǎn)品

該團隊再次使用上傳到 MLCommons 的數(shù)據(jù),將其網(wǎng)絡的功效與在數(shù)字硬件上運行的 RNNT 進行比較。MLPerf 數(shù)據(jù)顯示,IBM 原型的每瓦性能(或效率)估計比同類系統(tǒng)高出大約 14 倍。這是 IBM 研究人員能夠使用 MLPerf 進行實際測試的第一個模擬系統(tǒng),因為過去的實驗規(guī)模太小,無法進行比較。

模擬人工智能的下一步是什么

自然語言任務并不是模擬人工智能可以解決的唯一人工智能問題——IBM 研究人員正在研究許多其他用途。在本月早些時候發(fā)表在《自然電子》雜志上的一篇論文中,該團隊展示了可以使用節(jié)能模擬芯片設計來實現(xiàn)可擴展的混合信號架構(gòu),該架構(gòu)可以在計算機視覺圖像識別的 CIFAR-10 圖像數(shù)據(jù)集中實現(xiàn)高精度。

這些芯片由位于東京、蘇黎世、紐約約克敦高地和加利福尼亞州阿爾馬登實驗室的 IBM 研究人員構(gòu)思和設計,并由外部制造公司制造。相變存儲器和金屬層在位于奧爾巴尼納米技術(shù)綜合體的 IBM 研究實驗室進行了處理和驗證。

如果您將今天在《自然》雜志上發(fā)表的工作的優(yōu)點(例如大型陣列和并行數(shù)據(jù)傳輸)與《自然電子》論文中展示的芯片的強大數(shù)字計算模塊相結(jié)合,您會看到許多構(gòu)建模塊實現(xiàn)快速、低功耗模擬 AI 推理加速器的愿景所需。并將這些設計與硬件彈性訓練算法相結(jié)合,該團隊預計這些人工智能設備將來能為各種人工智能模型提供相當于神經(jīng)網(wǎng)絡精度的軟件。

雖然這項工作對于模擬人工智能系統(tǒng)來說是向前邁出的一大步,但在我們在市場上看到包含此類設備的機器之前,還有很多工作要做。該團隊在不久的將來的目標是將上述兩個工作流整合到一個模擬混合信號芯片中。該團隊還在研究如何在他們的芯片上實現(xiàn)基礎(chǔ)模型。

模擬人工智能現(xiàn)在正在很大程度上解決當今數(shù)字系統(tǒng)正在解決的各種人工智能問題,并且具有功耗意識的模擬人工智能的愿景與我們今天使用的數(shù)字系統(tǒng)相結(jié)合,變得越來越清晰。

延伸閱讀:IBM 用于深度學習推理的模擬 AI 芯片

我們正處于人工智能革命的開端,這場革命將重新定義我們的生活和工作方式。特別是,深度神經(jīng)網(wǎng)絡 (DNN) 徹底改變了人工智能領(lǐng)域,并隨著基礎(chǔ)模型和生成式人工智能的出現(xiàn)而日益受到重視。。但在傳統(tǒng)數(shù)字計算架構(gòu)上運行這些模型限制了它們可實現(xiàn)的性能和能源效率。專門用于人工智能推理的硬件開發(fā)已經(jīng)取得了進展,但其中許多架構(gòu)在物理上分割了內(nèi)存和處理單元。這意味著人工智能模型通常存儲在離散的內(nèi)存位置,計算任務需要在內(nèi)存和處理單元之間不斷地整理數(shù)據(jù)。此過程會減慢計算速度并限制可實現(xiàn)的最大能源效率。

IBM 研究中心一直在研究重塑人工智能計算方式的方法。模擬內(nèi)存計算,或者簡稱模擬人工智能,是一種很有前途的方法,可以借用神經(jīng)網(wǎng)絡在生物大腦中運行的關(guān)鍵特征來應對這一挑戰(zhàn)。在我們的大腦以及許多其他動物的大腦中,突觸的強度(在本例中是“權(quán)重”)決定了神經(jīng)元之間的通信。對于模擬人工智能系統(tǒng),我們將這些突觸權(quán)重本地存儲在納米級電阻存儲設備的電導值中,例如相變存儲器(PCM) 并通過利用電路定律并減少在內(nèi)存和處理器之間不斷發(fā)送數(shù)據(jù)的需要來執(zhí)行乘法累加 (MAC) 操作,這是 DNN 中的主要計算操作。

為了將模擬人工智能的概念變成現(xiàn)實,需要克服兩個關(guān)鍵挑戰(zhàn):這些存儲器陣列需要能夠以與現(xiàn)有數(shù)字系統(tǒng)相當?shù)木冗M行計算,并且它們需要能夠與其他數(shù)字計算單元,以及模擬人工智能芯片上的數(shù)字通信結(jié)構(gòu)。

在早前發(fā)表在 Nature Electronics 上的一篇論文中,IBM Research 引入了最先進的混合信號模擬 AI 芯片來運行各種 DNN 推理任務,從而在應對這些挑戰(zhàn)方面邁出了重要一步。它是第一款經(jīng)過測試的模擬芯片,與數(shù)字芯片一樣擅長計算機視覺人工智能任務,同時能效顯著提高。

該芯片是在 IBM 的Albany NanoTech Complex中制造的,由 64 個模擬內(nèi)存計算核心(或塊)組成,每個核心包含 256×256 的突觸單位單元交叉陣列。每個模塊中都集成了緊湊的基于時間的模數(shù)轉(zhuǎn)換器,以在模擬世界和數(shù)字世界之間進行轉(zhuǎn)換。每個圖塊還集成了輕量級數(shù)字處理單元,執(zhí)行簡單的非線性神經(jīng)元激活功能和縮放操作。

每個圖塊可以執(zhí)行與 DNN 模型的一層相關(guān)的計算。突觸權(quán)重被編碼為 PCM 設備的模擬電導值。全局數(shù)字處理單元集成在芯片中間,可實現(xiàn)更復雜的操作,這些操作對于執(zhí)行某些類型的神經(jīng)網(wǎng)絡至關(guān)重要。該芯片還在所有塊和全局數(shù)字處理單元的芯片互連處具有數(shù)字通信路徑。

使用該芯片,我們對模擬內(nèi)存計算的計算精度進行了最全面的研究,并在CIFAR-10圖像數(shù)據(jù)集上證明了 92.81% 的準確率。我們相信這是目前報道的使用類似技術(shù)的芯片中精度最高的。在本文中,我們還展示了如何將模擬內(nèi)存計算與多個數(shù)字處理單元和數(shù)字通信結(jié)構(gòu)無縫結(jié)合。測得的每個區(qū)域的吞吐量為400 GOPS/mm2 的 8 位輸入輸出矩陣乘法該芯片的功耗比之前基于電阻式存儲器的多核內(nèi)存計算芯片高出 15 倍以上,同時實現(xiàn)了可比的能源效率。

通過將這種 64 塊芯片的面積和能源效率高的模數(shù)轉(zhuǎn)換器 (ADC)、高度線性乘法累加計算和強大的數(shù)字計算塊與我們展示的大規(guī)模并行數(shù)據(jù)傳輸相結(jié)合我們在 2021 年IEEE VLSI 研討會上推出的 34 塊芯片中,現(xiàn)在已經(jīng)展示了實現(xiàn)快速、低功耗模擬 AI 推理加速器芯片架構(gòu)愿景所需的許多構(gòu)建模塊。

利用我們的學習成果,我們設計了一個類似的加速器架構(gòu),該架構(gòu)于今年早些時候發(fā)布在IEEE Transactions on VLSI systems上。我們的愿景將許多模擬內(nèi)存計算塊與與大規(guī)模并行 2D 網(wǎng)格連接的專用數(shù)字計算核心相結(jié)合。結(jié)合我們近年來開發(fā)的復雜的硬件感知訓練,我們期望這些加速器在未來幾年能夠在各種模型中提供與軟件等效的神經(jīng)網(wǎng)絡精度。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 加速器
    +關(guān)注

    關(guān)注

    2

    文章

    788

    瀏覽量

    37562
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1197

    瀏覽量

    24590
  • 模擬芯片
    +關(guān)注

    關(guān)注

    8

    文章

    613

    瀏覽量

    51035

原文標題:用模擬芯片取代數(shù)字芯片?

文章出處:【微信號:moorexuetang,微信公眾號:摩爾學堂】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    soc是數(shù)字芯片還是模擬芯片

    SoC(System on Chip,系統(tǒng)級芯片)是 數(shù)字芯片 的一種。SoC芯片數(shù)字集成電路的一種,它通過將一個或多個
    的頭像 發(fā)表于 09-23 10:16 ?307次閱讀

    精密DAC取代數(shù)字電位器應用說明

    電子發(fā)燒友網(wǎng)站提供《精密DAC取代數(shù)字電位器應用說明.pdf》資料免費下載
    發(fā)表于 09-14 10:56 ?0次下載
    <b class='flag-5'>用</b>精密DAC<b class='flag-5'>取代數(shù)字</b>電位器應用說明

    技術(shù)巔峰!探秘國內(nèi)高性能模擬芯片的未來發(fā)展

    隨著科技的飛速發(fā)展和數(shù)字化轉(zhuǎn)型的深入推進,高性能模擬芯片作為連接現(xiàn)實世界與數(shù)字世界的橋梁,其重要性日益凸顯。國內(nèi)高性能模擬
    的頭像 發(fā)表于 06-22 09:47 ?360次閱讀
    技術(shù)巔峰!探秘國內(nèi)高性能<b class='flag-5'>模擬</b><b class='flag-5'>芯片</b>的未來發(fā)展

    數(shù)字芯片模擬芯片的區(qū)別

    在電子技術(shù)的世界中,數(shù)字芯片模擬芯片是兩種不可或缺的基石。它們各自在電子系統(tǒng)中扮演著獨特的角色,為電子設備的正常運行提供了強有力的支持。然而,盡管兩者都是電子系統(tǒng)的核心組成部分,但它
    的頭像 發(fā)表于 05-22 15:14 ?3607次閱讀

    數(shù)字集成芯片是什么

    數(shù)字集成芯片,即數(shù)字集成電路,是一種數(shù)字邏輯電路或系統(tǒng),它將元件和連接集成在同一半導體芯片上。這種芯片
    的頭像 發(fā)表于 03-20 15:41 ?573次閱讀

    模擬前端芯片的使用場景有哪些

    模擬前端芯片(AFE)作為電子系統(tǒng)中的關(guān)鍵組成部分,其使用場景廣泛且多樣化。這些芯片在信號處理的起始階段發(fā)揮著至關(guān)重要的作用,確保模擬信號能夠準確、高效地轉(zhuǎn)換為
    的頭像 發(fā)表于 03-16 15:49 ?2067次閱讀

    AFE模擬前端芯片是什么 AFE模擬前端芯片怎么

    AFE模擬前端芯片,是一種關(guān)鍵的電子元件,位于信號處理鏈的最前端,扮演著信號轉(zhuǎn)換與處理的重要角色。它主要負責接收來自各種傳感器或其他模擬信號源的模擬信號,并將這些信號轉(zhuǎn)換為
    的頭像 發(fā)表于 03-16 15:48 ?4187次閱讀

    電池模擬前端芯片有什么

    電池模擬前端芯片在電池管理系統(tǒng)中發(fā)揮著至關(guān)重要的作用。首先,它能夠?qū)崟r監(jiān)測電池的電壓、電流和溫度等關(guān)鍵參數(shù),這是確保電池安全穩(wěn)定運行的基礎(chǔ)。通過精確的數(shù)據(jù)采集,電池模擬前端芯片能夠為電
    的頭像 發(fā)表于 03-16 15:26 ?1840次閱讀

    電池模擬前端芯片是什么

    電池模擬前端芯片是一種關(guān)鍵的電子元件,主要用于電池管理系統(tǒng)中,負責接收并處理來自電池的模擬信號。這些模擬信號可能包括電池的電壓、電流和溫度等信息。電池
    的頭像 發(fā)表于 03-16 15:25 ?1817次閱讀

    模擬前端芯片的差異分析

    模擬前端芯片,作為電子設備中的關(guān)鍵組件,承擔著將模擬信號轉(zhuǎn)換為數(shù)字信號的重要任務。然而,由于應用場景、設計思路、工藝技術(shù)等因素的不同,市面上的模擬
    的頭像 發(fā)表于 03-16 15:22 ?730次閱讀

    什么是模擬前端芯片技術(shù) 數(shù)字前端和模擬前端的區(qū)別

    什么是模擬前端芯片技術(shù) 模擬前端芯片技術(shù)是一種涉及電子元件的技術(shù),其核心在于模擬前端芯片(AFE
    的頭像 發(fā)表于 03-15 17:58 ?1291次閱讀

    什么是模擬前端芯片?它有哪些作用?

    模擬前端芯片,簡稱AFE芯片,是一種關(guān)鍵的電子元件,位于信號處理鏈的最前端,負責接收并處理模擬信號。這些信號可能來自各種傳感器,如溫度傳感器、壓力傳感器等,或者來自其他
    的頭像 發(fā)表于 03-15 15:33 ?1631次閱讀

    ADC模擬轉(zhuǎn)數(shù)字芯片:以CS1237電子秤方案為例

    將深入解析CS1237芯片的原理、特點,以及電子秤方案為核心的應用領(lǐng)域。 CS1237芯片的出現(xiàn)為電子產(chǎn)品設備的高精度信號轉(zhuǎn)換提供了全新的解決方案。這個芯片采用了先進的模擬
    的頭像 發(fā)表于 01-10 16:41 ?1167次閱讀

    請問ad5220數(shù)字電位計為什么一數(shù)字表測量芯片就開始發(fā)燙?

    ad5220數(shù)字電位計模擬測溫電阻上升過程,使用時為什么一數(shù)字表測量阻值,芯片就開始發(fā)燙?重
    發(fā)表于 12-06 08:31

    什么是模擬芯片模擬芯片測試指標是什么?

    什么是模擬芯片?模擬芯片測試指標是什么? 模擬芯片是一類能夠
    的頭像 發(fā)表于 11-10 15:26 ?1666次閱讀