0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

Lightmatter公司推出用于通用AI加速的光子計算測試芯片

我快閉嘴 ? 來源:芯東西 ? 作者:芯東西 ? 2020-09-02 17:25 ? 次閱讀

AI芯片的下一個創(chuàng)新點在哪兒?光子計算或許能提供新的啟發(fā)。8月31日報道,在剛落幕不久的Hot Chips 32大會上,脫胎于麻省理工學院的初創(chuàng)公司Lightmatter展示了用于通用AI加速的光子計算測試芯片。該處理器利用硅光子和MEMS技術,以光速處理矩陣向量乘法,由毫瓦級激光光源供電。據(jù)悉,在相同芯片面積上,光子器件的速度比電子器件快1000倍,而功耗僅有電子器件的1/1000。

Lightmatter于2017年在馬薩諸塞州波士頓市成立,目前有46名員工,已從Google Ventures等投資方處融資3300萬美元,擁有30項專利。

作為最早面向AI推理定制光子芯片的公司之一,Lightmatter將于2021年秋季推出其首款商業(yè)產(chǎn)品——搭載光子計算芯片的PCIe卡,專為數(shù)據(jù)中心AI推理工作負載而設計。

一、能效提升20倍,吞吐量提高5倍

得益于硅光子技術的進步,硅芯片上的光傳輸成為可能。

光子芯片通過采用與傳統(tǒng)基于晶體管的電子器件完全不同的物理學原理,可實現(xiàn)更快的性能、更低的能耗。

Lightmatter首席執(zhí)行官尼克·哈里斯稱:“我們可以利用現(xiàn)有AI數(shù)據(jù)中心,將能耗降低為原來的1/20,將物理空間減少為原來的1/5。”

據(jù)他介紹,這只是Lightmatter正在打造的第一代產(chǎn)品,未來還有很長的路線圖。

哈里斯強調(diào),此次展示的測試芯片只是作為其技術的演示,并不是為了在基準測試中有出色表現(xiàn)。

但他堅持認為,在實際應用中,該演示芯片仍將擊敗AI加速領域的市場領導者——英偉達A100 GPU

據(jù)哈里斯介紹,與A100相比,其光子芯片在BERT和ResNet-50推理等工作負載上可提供20倍的能效和至少5倍的吞吐量。

二、格芯代工,采用3D封裝堆疊

Lightmatter的芯片由兩個垂直堆疊的芯片組成,整個芯片面積為150平方毫米,兩個裸片均由格芯標準CMOS工藝制造,包含超過十億個FinFET晶體管、數(shù)萬個光子算術單元和數(shù)百個記錄設置數(shù)據(jù)轉換器。

上方是一個12nm ASIC(Lightmatter副總工程師Carl Ramey在Hot Chips演講時介紹的是14nm ASIC),用于存儲內(nèi)存和控制下方作為計算引擎的90nm光子芯片裸片。

該光子處理器具有64 x 64光子矩陣向量乘積計算器,可在標準數(shù)據(jù)中心工作溫度下運行,總延遲時間不到200皮秒(1萬億皮秒=1秒),比晶體管計算要快幾個數(shù)量級,晶體管計算需要多個時鐘周期。計算引擎由50兆瓦的激光驅(qū)動。

哈里斯認為,這種低功耗光子計算芯片的優(yōu)勢之一,是可以與控制/內(nèi)存ASIC進行3D堆疊。

基于晶體管的計算芯片會散發(fā)過多的熱量。堆疊的芯片縮短了ASIC上的操作數(shù)存儲區(qū)與光子芯片上的計算元件之間的軌跡線——從數(shù)據(jù)轉換器到光子計算引擎的距離不到總路徑的1毫米。反過來,這降低了延遲和功耗。

哈里斯說:“這里有一個很好的正反饋循環(huán)”, “節(jié)省功耗使我們堆疊,而堆疊可以節(jié)省更多功耗。”

三、更高速度、更低功耗是如何實現(xiàn)的?

Lightmatter光學計算陣列由DACADC模塊封裝,作為與數(shù)字電路的其余部分的接口。

DAC接收數(shù)字輸入信號,將其轉換為模擬電壓,并使用該電壓來驅(qū)動激光器(該技術已在光纖發(fā)射器中廣泛使用)。

來自該激光器的光,在進入馬赫曾德爾干涉儀(MZI)后,相干光分為兩束,每半束光的相位調(diào)整不同,將具有不同相位的光束組合會導致相長或相消干涉,從而有效地調(diào)制通過MZI的光的亮度(該調(diào)制可被視為乘法運算)。

在波導(承載光的“電線”)相遇之處,信號被有效地加在一起,這是光MAC的基礎。

計算陣列輸出的光到達光電二極管,通過機械手段實現(xiàn)MZI中的關鍵操作,改變光的相位。

Lightmatter副總工程師Carl Ramey在Hot Chips演講解釋說,其光子芯片使用了納米光學機電系統(tǒng)(NOEMS)。

與MEMS器件類似,波導結構通過在下面蝕刻而懸浮,然后通過向其上方和下方的電容器板添加電荷來偏轉。這成功地改變了光的相位所需的數(shù)量,并且所需功率極低。

“NOEMS設備具有一些非常驚人的性能,” Ramey說?!八鼈兊膿p耗極低,靜態(tài)功耗幾乎為零。我們只是將一些電子傾倒到小電容器上,幾乎沒有泄漏——電容足夠小,致動所用的動態(tài)功率也很小。(結構)也能以相對較高的速度啟動,最高可達數(shù)百兆赫?!?/p>

Ramey說,Lightmatter的演示芯片具有64 x 64計算元素,但可以很容易地擴大規(guī)模。

據(jù)他介紹:“類似于基于晶體管的脈動陣列,計算量與面積成線性比例關系,“延遲也隨著陣列的尺寸而縮放。因此,在一個典型的流水線晶體管設計中,您需要64個時鐘周期來執(zhí)行這些操作,從左到右。我們的延遲也隨陣列尺寸而定,但是速度要快三個數(shù)量級。因此,即使是1000 x 1000的陣列,其延遲也會遠低于納秒。”

有趣的是,光子計算陣列消耗的功率與面積的平方根成比例。這是因為功耗主要歸因于數(shù)據(jù)轉換。

“當我們將每個新元素添加到陣列中時,我們將獲得更高的性能,但是我們只需要付出功率平方根的代價即可。” Ramey說,“因此,我們制造的芯片越大,實際上它們的效率就越高。這與電子系統(tǒng)有很大不同,電子系統(tǒng)只是線性擴展:性能越高,功耗越大。”

除了與計算相關的能量外,還有與在芯片周圍移動數(shù)據(jù)有關的能量(當今基于晶體管的大型AI芯片在硅片上移動數(shù)據(jù)可能要消耗50-100W功率)。

而通過光學計算,以光學方式移動數(shù)據(jù),意味著不需要電源,從而節(jié)省了很多錢。結果是,光子計算設備的運行功耗不到3W,僅是其他計算方法每次推理操作所消耗能量的一小部分。

四、支持同時執(zhí)行多個AI推理任務

光子計算的另一個有趣功能是并行處理能力。與光通信中使用的技術類似,可以將多個獨立的數(shù)據(jù)流編碼到不同波長的光上,并同時饋入計算引擎。這意味著光學計算芯片可以同時執(zhí)行多個AI推理任務。

“這是光子計算的一個非常獨特的特性,” Lightmatter首席執(zhí)行官Nick Harris說,“這意味著您有一個物理資源,一個處理器,但它的作用就像一排處理器?!?/p>

雖然指定的光譜(1310至1600nm)在理論上可以適合至少1000路,但哈里斯說,因激光技術還不成熟,目前僅支持8路。

落地將是艱巨的挑戰(zhàn)

據(jù)悉,Lightmatter的目標客戶是當今的數(shù)據(jù)中心,包括高性能計算等可擴展系統(tǒng)。自動駕駛技術是一個遙遠的未來發(fā)展方向,不過哈里斯承認,進入這一領域所需的可靠性工程將是“一項艱巨的任務”。

Lightmatter具有完整的軟件堆棧,支持TensorFlow、PyTorch、ONNX等機器學習框架。哈里斯說,他們的目標是在兩個機器學習框架之間實現(xiàn)即插即用。對于初創(chuàng)企業(yè)而言,首要挑戰(zhàn)之一可能是如何使持懷疑態(tài)度的客戶理解和接受光子計算的整個概念。

如何做到這一點呢?哈里斯回應稱:“這是一個艱巨的挑戰(zhàn)”。他介紹道,自1960年代以來的計算歷史上,從來沒有一種技術取代過電子晶體管做計算,人們已經(jīng)嘗試過,但從未成功?!拔艺J為這是您第一次看到它的實現(xiàn),而我們銷售它的方式就是通過展示它的運行?!惫锼拐f。
責任編輯:tzh

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 芯片
    +關注

    關注

    452

    文章

    49922

    瀏覽量

    419587
  • AI
    AI
    +關注

    關注

    87

    文章

    29343

    瀏覽量

    267627
  • 自動駕駛
    +關注

    關注

    782

    文章

    13519

    瀏覽量

    165721
收藏 人收藏

    評論

    相關推薦

    芯片公司Lightmatter完成4億美元D輪融資

    近日,光芯片初創(chuàng)公司Lightmatter宣布成功完成4億美元的D輪融資,公司估值也隨之飆升,達到44億美元,幾乎翻了兩番。
    的頭像 發(fā)表于 10-21 15:52 ?311次閱讀

    英偉達前高管加盟Lightmatter,共繪AI計算新篇章

    科技巨擘中的職務,轉而擔任新興芯片初創(chuàng)公司Lightmatter的首席財務官(CFO)。這一舉措不僅彰顯了揚科夫斯基對未來科技趨勢的敏銳洞察,也標志著Lightmatter正以前所未有
    的頭像 發(fā)表于 07-03 10:10 ?390次閱讀

    Arm發(fā)布全新終端計算子系統(tǒng),加速AI體驗與產(chǎn)品上市

    全球領先的半導體知識產(chǎn)權(IP)提供商Arm控股有限公司(納斯達克股票代碼:ARM)今日正式推出全新的Arm終端計算子系統(tǒng)(CSS),以推動人工智能(AI)體驗的前沿發(fā)展,并助力
    的頭像 發(fā)表于 05-30 14:23 ?498次閱讀

    PMP22165.1-適用于 Xilinx 通用自適應計算加速平臺 (ACAP) 的電源 PCB layout 設計

    電子發(fā)燒友網(wǎng)站提供《PMP22165.1-適用于 Xilinx 通用自適應計算加速平臺 (ACAP) 的電源 PCB layout 設計.pdf》資料免費下載
    發(fā)表于 05-19 10:45 ?0次下載
    PMP22165.1-適<b class='flag-5'>用于</b> Xilinx <b class='flag-5'>通用</b>自適應<b class='flag-5'>計算</b><b class='flag-5'>加速</b>平臺 (ACAP) 的電源 PCB layout 設計

    新思科技面向臺積公司先進工藝加速下一代芯片創(chuàng)新

    ?新思科技攜手臺積公司共同開發(fā)人工智能驅(qū)動的芯片設計流程以優(yōu)化并提高生產(chǎn)力,推動光子集成電路領域的發(fā)展,并針對臺積公司的2納米工藝開發(fā)廣泛的IP組合 ? 摘要: 由Synopsys.
    發(fā)表于 05-11 11:03 ?396次閱讀
    新思科技面向臺積<b class='flag-5'>公司</b>先進工藝<b class='flag-5'>加速</b>下一代<b class='flag-5'>芯片</b>創(chuàng)新

    Cadence與NVIDIA聯(lián)合推出利用加速計算和生成式AI重塑設計

    中國上海,2024 年 3 月 25 日——楷登電子(美國 Cadence 公司,NASDAQ:CDNS)近日宣布,公司將深化與 NVIDIA 在 EDA、系統(tǒng)設計與分析、數(shù)字生物學和人工智能領域的多年合作,推出兩款變革性解決方
    的頭像 發(fā)表于 03-25 14:36 ?514次閱讀

    NVIDIA 推出 Blackwell 架構 DGX SuperPOD,適用于萬億參數(shù)級的生成式 AI 超級計算

    ——? NVIDIA 于今日發(fā)布新一代 AI 超級計算機 —— 搭載 NVIDIA GB200 Grace Blackwell 超級芯片的 NVIDIA DGX SuperPOD?。這臺 A
    發(fā)表于 03-19 10:56 ?322次閱讀
    NVIDIA <b class='flag-5'>推出</b> Blackwell 架構 DGX SuperPOD,適<b class='flag-5'>用于</b>萬億參數(shù)級的生成式 <b class='flag-5'>AI</b> 超級<b class='flag-5'>計算</b>

    是德科技推出AI數(shù)據(jù)中心測試平臺

    是德科技近期宣布,針對蓬勃發(fā)展的AI和ML基礎設施生態(tài)系統(tǒng),隆重推出了全新的AI數(shù)據(jù)中心測試平臺。該平臺專為加速
    的頭像 發(fā)表于 03-08 10:17 ?622次閱讀

    是德科技推出AI數(shù)據(jù)中心測試平臺旨在加速AI/ML網(wǎng)絡驗證和優(yōu)化的創(chuàng)新

    2024年2月29日,是德科技(Keysight Technologies,Inc.)宣布,針對人工智能(AI)和機器學習(ML)基礎設施生態(tài)系統(tǒng),推出AI數(shù)據(jù)中心測試平臺,旨在
    的頭像 發(fā)表于 02-29 09:32 ?539次閱讀
    是德科技<b class='flag-5'>推出</b><b class='flag-5'>AI</b>數(shù)據(jù)中心<b class='flag-5'>測試</b>平臺旨在<b class='flag-5'>加速</b><b class='flag-5'>AI</b>/ML網(wǎng)絡驗證和優(yōu)化的創(chuàng)新

    新型光子芯片:以光子替換電子執(zhí)行AI數(shù)學運算

    這種新式芯片首次巧妙地融合了納米尺度物質(zhì)操作先驅(qū)納德·恩赫塔和硅光子(SiPh)平臺理念。其中,恩赫塔通過光的運用提高數(shù)學計算速率,而硅光子平臺則應用硅元素——廣泛
    的頭像 發(fā)表于 02-18 16:17 ?738次閱讀

    什么是光電量子計算芯片?

    什么是光電量子計算芯片? 光電量子計算芯片,也被稱為光子量子計算
    的頭像 發(fā)表于 01-09 14:42 ?782次閱讀

    加速計算卡與AI顯卡有什么區(qū)別?

    與原理 1. 加速計算卡:加速計算卡是一種用于高性能計算的硬件設備,主要
    的頭像 發(fā)表于 01-09 14:10 ?1091次閱讀

    Marvell硅光子光引擎,會加速AI的發(fā)展嗎?

    Marvell的硅光子平臺主要來源于對Inphi公司的收購,Inphi曾推出COLORZ 100,這是一款連接Microsoft數(shù)據(jù)中心園區(qū)的100G ZR光纖,已經(jīng)成功運行了7B小時。
    的頭像 發(fā)表于 12-10 15:13 ?1171次閱讀
    Marvell硅<b class='flag-5'>光子</b>光引擎,會<b class='flag-5'>加速</b><b class='flag-5'>AI</b>的發(fā)展嗎?

    可以計算光最佳形狀的光子芯片?

    就在最近,一個由多個大學的研究人員組成的國際團隊突破了這一難題,讓光學無線系統(tǒng)的數(shù)據(jù)傳輸不再有障礙,該研究團隊制造出的新型光子芯片計算出光的最佳形狀,從而讓光以最佳的效率穿過任何環(huán)境,相關研究成果發(fā)表在《自然-
    的頭像 發(fā)表于 12-06 16:03 ?593次閱讀

    光子芯片簡介

    光子芯片,這是一種依托光子學的集成電路,它將光子器件集成在芯片上 實現(xiàn) 光電子的集成。相較于傳統(tǒng)的電子
    的頭像 發(fā)表于 11-15 17:41 ?2530次閱讀