0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

光子張量處理器—迸發(fā)5G機(jī)器學(xué)習(xí)新活力

電子設(shè)計(jì) ? 來源:電子設(shè)計(jì) ? 作者:電子設(shè)計(jì) ? 2020-12-25 15:14 ? 次閱讀

翻譯自——EEtimes

近期,一種用光子張量處理器代替GPU來進(jìn)行機(jī)器學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)計(jì)算的新方法表明,在處理光學(xué)數(shù)據(jù)傳輸?shù)男阅苌峡梢蕴岣?-3階。這也表明光子處理器具有增強(qiáng)電子系統(tǒng)的潛力,并可能在5G網(wǎng)絡(luò)邊緣設(shè)備中表現(xiàn)強(qiáng)勁。

美國(guó)喬治華盛頓大學(xué)電子和計(jì)算機(jī)工程系的Mario Miscuglio和Volker Sorger在《應(yīng)用物理評(píng)論雜志》上發(fā)表了一篇論文,題為《基于光子的處理單元使更復(fù)雜的機(jī)器學(xué)習(xí)成為可能》。

在他們的方法中,光子張量核并行執(zhí)行矩陣乘法,這提高了深度學(xué)習(xí)的速度和效率。在機(jī)器學(xué)習(xí)中,神經(jīng)網(wǎng)絡(luò)被訓(xùn)練來學(xué)習(xí)如何在不可見的數(shù)據(jù)上執(zhí)行無監(jiān)督的決策和分類任務(wù)。一旦神經(jīng)網(wǎng)絡(luò)對(duì)數(shù)據(jù)進(jìn)行了訓(xùn)練,它就可以產(chǎn)生一種推斷,從而對(duì)對(duì)象和模式進(jìn)行識(shí)別和分類,并在數(shù)據(jù)中找到一個(gè)特征。

光子TPU并行存儲(chǔ)和處理數(shù)據(jù),具有電光互連的特點(diǎn),可以有效地讀寫光存儲(chǔ)器,并與其他架構(gòu)進(jìn)行接口。

作者之一Mario Miscuglio表示:“我們發(fā)現(xiàn)集成了高效光存儲(chǔ)的集成光子平臺(tái)可以獲得與張量處理單元相同的操作,但它們只消耗一小部分的功率,并具有更高的吞吐量,如果經(jīng)過適當(dāng)?shù)挠?xùn)練,可以用于以光速進(jìn)行推理?!?/p>

大多數(shù)神經(jīng)網(wǎng)絡(luò)旨在模仿人類大腦的多層相互連接的神經(jīng)元。表示這些網(wǎng)絡(luò)的一種有效方法是將矩陣和向量相乘的復(fù)合函數(shù)。這種表示方式允許通過專門用于向量化操作(如矩陣乘法)的架構(gòu)來執(zhí)行并行操作。

(a)光子張量核(PTC)由一個(gè)16點(diǎn)積引擎組成,內(nèi)在獨(dú)立地逐列逐行逐點(diǎn)乘法和累加。點(diǎn)積引擎執(zhí)行兩個(gè)向量之間的乘法。輸入矩陣的第i行由由高速(如馬赫-曾德爾)調(diào)制器調(diào)制的波分復(fù)用信號(hào)給出。通過適當(dāng)設(shè)置核矩陣的權(quán)值狀態(tài),將核矩陣的第j列加載到光子存儲(chǔ)器中。利用光-物質(zhì)與相變存儲(chǔ)器的相互作用,利用微環(huán)諧振器(MRR)對(duì)輸入信號(hào)進(jìn)行頻譜濾波,并采用看似量子化的電吸收方案進(jìn)行加權(quán)。(例如調(diào)幅),從而執(zhí)行按元素進(jìn)行的乘法。使用光檢測(cè)器將元素式乘法非相干求和,這相當(dāng)于MAC操作(Dij)。

任務(wù)越智能化,預(yù)測(cè)精度就越高,網(wǎng)絡(luò)就越復(fù)雜。這樣的網(wǎng)絡(luò)需要更大的計(jì)算量和更大的處理能力。當(dāng)前適合于深度學(xué)習(xí)的數(shù)字處理器,如圖形處理單元(GPU)或張量處理單元(TPU),由于所需的功率以及處理器和存儲(chǔ)器之間電子數(shù)據(jù)的緩慢傳輸,在執(zhí)行更復(fù)雜、更精確的操作方面受到了限制。

研究人員表明,他們的TPU性能可以比電子TPU高出2-3個(gè)數(shù)量級(jí)。對(duì)于計(jì)算節(jié)點(diǎn)分布式網(wǎng)絡(luò)和在網(wǎng)絡(luò)邊緣(如5G)執(zhí)行高吞吐量智能任務(wù)的引擎來說,光子可能是一個(gè)理想的匹配。在網(wǎng)絡(luò)邊緣,數(shù)據(jù)信號(hào)可能已經(jīng)以來自監(jiān)控?cái)z像機(jī)、光學(xué)傳感器和其他來源的光子的形式存在。

Miscuglio:“光子專用處理器可以節(jié)省大量的能源,提高響應(yīng)時(shí)間并減少數(shù)據(jù)中心的流量?!睂?duì)于終端用戶來說,這意味著處理數(shù)據(jù)的速度要快得多,因?yàn)閿?shù)據(jù)的很大一部分是預(yù)處理的,這意味著只需要將其余部分?jǐn)?shù)據(jù)發(fā)送到云或數(shù)據(jù)中心。

光與電的較量

本文給出了利用光路完成機(jī)器學(xué)習(xí)任務(wù)的實(shí)例。在大多數(shù)神經(jīng)網(wǎng)絡(luò)(NNs)中,每一個(gè)神經(jīng)元和每一層,以及網(wǎng)絡(luò)的互連,都是訓(xùn)練網(wǎng)絡(luò)的關(guān)鍵。根據(jù)訓(xùn)練,在其連通層中,神經(jīng)網(wǎng)絡(luò)強(qiáng)烈依賴于向量矩陣的數(shù)學(xué)運(yùn)算,其中輸入數(shù)據(jù)和權(quán)重的大矩陣根據(jù)訓(xùn)練相乘。復(fù)雜的、多層的深層神經(jīng)網(wǎng)絡(luò)需要大量的帶寬和低延遲,以滿足執(zhí)行大矩陣乘法所需的大量操作,而不犧牲效率和速度。

那么如何有效地將這些矩陣相乘呢?對(duì)于通用處理器,矩陣操作在需要連續(xù)訪問緩存內(nèi)存的情況下串行進(jìn)行,從而產(chǎn)生馮·諾依曼瓶頸[1]。而GPU和TPU等特殊的架構(gòu),有助于減少這些馮·諾依曼瓶頸的影響,使一些有效的機(jī)器學(xué)習(xí)模型成為可能。

CPU相比,GPU和TPU意義重大,但是當(dāng)用它們來實(shí)現(xiàn)深度神經(jīng)網(wǎng)絡(luò)對(duì)大型2維數(shù)據(jù)集(如圖像)執(zhí)行推斷時(shí),可能會(huì)耗電,并且需要更長(zhǎng)的計(jì)算運(yùn)行時(shí)間(大于幾十毫秒)。對(duì)于不那么復(fù)雜的推理任務(wù)來說,更小的矩陣乘法仍然受到不可忽略的延遲挑戰(zhàn),主要是由于各種內(nèi)存層次的訪問開銷和GPU中執(zhí)行每條指令的延遲。

作者建議,在這種情況下,有必要探索和重新研發(fā)當(dāng)前邏輯計(jì)算平臺(tái)的操作范式,在這種邏輯計(jì)算平臺(tái)中,矩陣代數(shù)依賴于對(duì)內(nèi)存的連續(xù)訪問。在這方面,光的波動(dòng)性質(zhì)和相關(guān)的固有操作,如干涉和衍射,可以在提高計(jì)算吞吐量和同時(shí)降低神經(jīng)形態(tài)平臺(tái)的功耗方面發(fā)揮重要作用。

他們建議未來的技術(shù)應(yīng)該在其隨時(shí)間變化的輸入信號(hào)所在的領(lǐng)域執(zhí)行計(jì)算任務(wù),并利用其內(nèi)在的物理操作。在這個(gè)觀點(diǎn)中,光子是計(jì)算節(jié)點(diǎn)分布式網(wǎng)絡(luò)和在網(wǎng)絡(luò)邊緣(如5G)對(duì)大數(shù)據(jù)執(zhí)行智能任務(wù)的引擎的理想匹配,其中數(shù)據(jù)信號(hào)可能已經(jīng)以光子的形式存在(如監(jiān)控?cái)z像頭、光學(xué)傳感器等),從而預(yù)先過濾和智能調(diào)節(jié)允許向下游流向數(shù)據(jù)中心和云系統(tǒng)的數(shù)據(jù)流量。

在這里,他們探索了利用光子張量核(PTC)的方法,該方法能夠與訓(xùn)練好的核進(jìn)行一次性的4乘4矩陣的(非迭代的)和完全被動(dòng)的乘法和積累。換句話說,一旦NN被訓(xùn)練,權(quán)重被存儲(chǔ)在一個(gè)4位的多層光子存儲(chǔ)器中,直接在芯片上實(shí)現(xiàn),而不需要額外的電光電路或芯片外DRAM。該光子存儲(chǔ)器具有低損耗、相變、納米光子電路的特點(diǎn),其基礎(chǔ)是將G2Sb2Se5的導(dǎo)線沉積在一個(gè)平面波導(dǎo)上,可以使用電熱開關(guān)進(jìn)行更新,并且可以完全通過光學(xué)讀取。電熱開關(guān)是由夾住相變存儲(chǔ)器(PCM)導(dǎo)線的鎢加熱電極實(shí)現(xiàn)。

作者表示,這項(xiàng)工作代表了實(shí)現(xiàn)并行存儲(chǔ)數(shù)據(jù)和處理的光子張量處理器的第一種方法,與提供實(shí)時(shí)分析的最先進(jìn)的硬件加速器相比,它可以將相乘累積(MAC)操作的數(shù)量提高幾個(gè)數(shù)量級(jí),同時(shí)顯著降低功耗和延遲。

與依賴邏輯門的數(shù)字電子學(xué)不同,在集成光子學(xué)中,乘法、積累和更一般的線性代數(shù)運(yùn)算可以固有地、非迭代地執(zhí)行,得益于信號(hào)的電磁特性和有效的光物質(zhì)相互作用所提供的內(nèi)在并行性。在這方面,集成光子學(xué)是一個(gè)理想的平臺(tái),映射特定的復(fù)雜操作一對(duì)一到硬件,在某些情況下算法,實(shí)現(xiàn)時(shí)間復(fù)雜度。


審核編輯:符乾江


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    29435

    瀏覽量

    267747
  • ML
    ML
    +關(guān)注

    關(guān)注

    0

    文章

    144

    瀏覽量

    34533
  • 5G
    5G
    +關(guān)注

    關(guān)注

    1352

    文章

    48265

    瀏覽量

    562581
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    5G邊緣計(jì)算網(wǎng)關(guān)的實(shí)際應(yīng)用及其優(yōu)勢(shì)

    隨著全球5G技術(shù)的蓬勃發(fā)展,邊緣計(jì)算網(wǎng)關(guān)技術(shù)逐漸成為行業(yè)熱門焦點(diǎn),為工業(yè)物聯(lián)網(wǎng)、智能交通及智慧城市建設(shè)等諸多領(lǐng)域注入了全新的活力與無限可能。憑借實(shí)時(shí)高效的數(shù)據(jù)處理與極低的連接延遲,5G
    的頭像 發(fā)表于 07-26 16:57 ?1470次閱讀

    嵌入式設(shè)備中的4G/5G模塊管理

    /5G模塊管理復(fù)雜多樣,不同品牌和型號(hào)的模塊各有其獨(dú)特的配置和上網(wǎng)流程,這不僅增加了用戶的學(xué)習(xí)成本,也導(dǎo)致了網(wǎng)絡(luò)穩(wěn)定性難以保障的問題。 為了幫助用戶解決這一問題,飛凌嵌入式精心打造了 4G/
    發(fā)表于 07-13 16:45

    易為芯光電5G射頻線焊接

    5G射頻
    jf_87022464
    發(fā)布于 :2024年06月17日 10:34:31

    請(qǐng)問Lierda 5G EVK具體支持哪些linux系統(tǒng)?

    Lierda 5G EVK這款產(chǎn)品的開發(fā)驅(qū)動(dòng)適用于Ubantu 18.04或者centos嗎,ARM架構(gòu)的主機(jī),接這個(gè)調(diào)驅(qū)動(dòng)麻不麻煩
    發(fā)表于 06-04 07:50

    請(qǐng)問mx880 5G數(shù)據(jù)終端可以設(shè)置優(yōu)先5G網(wǎng)絡(luò)嗎?

    固件版本固件版本5G_DTU master 1.2.5 當(dāng)?shù)?b class='flag-5'>5G網(wǎng)絡(luò)夜里會(huì)關(guān)閉, 設(shè)置lte?nr 或者nul?nr,夜里自動(dòng)跳轉(zhuǎn)4G 網(wǎng)絡(luò), 白天有5G 網(wǎng)絡(luò)時(shí)候不能自動(dòng)切回來,得手
    發(fā)表于 06-04 06:25

    谷歌Tensor G5處理器將由臺(tái)積電生產(chǎn)

    近日,關(guān)于谷歌新一代智能手機(jī)Pixel 10系列將搭載自研處理器Tensor G5的傳聞得到了進(jìn)一步證實(shí)。據(jù)外媒報(bào)道,谷歌Tensor G5處理器的樣品運(yùn)輸清單已被曝光,盡管清單中并未
    的頭像 發(fā)表于 05-29 11:03 ?495次閱讀

    聯(lián)發(fā)科 天璣1200雙5G處理器 _ 智能模塊

    處理器模塊
    jf_87063710
    發(fā)布于 :2024年05月25日 14:24:15

    單北斗定位5G終端V2 Pro版發(fā)布:5G國(guó)產(chǎn)芯+單位對(duì)講防爆終端#北斗定位終端

    5G終端
    頂堅(jiān)北斗防爆手機(jī)
    發(fā)布于 :2024年03月26日 10:41:26

    美格智能聯(lián)合羅德與施瓦茨完成5G RedCap模組SRM813Q驗(yàn)證,推動(dòng)5G輕量化全面商用

    全球5G發(fā)展進(jìn)入下半場(chǎng),5G RedCap以其低成本、低功耗的特性成為行業(yè)焦點(diǎn)。近日,中國(guó)移動(dòng)攜手合作伙伴率先完成全球最大規(guī)模、最全場(chǎng)景、最全產(chǎn)業(yè)的RedCap現(xiàn)網(wǎng)規(guī)模試驗(yàn),推動(dòng)首批芯片、終端具備
    發(fā)表于 02-27 11:31

    一加Nord N30 SE 5G發(fā)布,搭載天璣6020處理器

    據(jù)一加官網(wǎng)站透露,Nord N30 SE 5G 將配備一塊面積達(dá) 6.72 英寸的高清 LCD 顯示屏,搭載聯(lián)發(fā)科天璣 6020 處理器、4GB 運(yùn)行內(nèi)存及 128GB 儲(chǔ)存空間,擁有 5000mAh 大容量電池,并支持 33W 高效快速充電,官方表示可在 30 分鐘內(nèi)將
    的頭像 發(fā)表于 01-30 11:50 ?1110次閱讀

    AMD發(fā)布全新Ryzen 8000G系列臺(tái)式機(jī)處理器

    AMD最近發(fā)布了全新的Ryzen 8000G系列臺(tái)式機(jī)處理器,這個(gè)系列包括Ryzen 7 8700G、Ryzen 5 8600G、Ryzen
    的頭像 發(fā)表于 01-09 15:31 ?970次閱讀

    5G 外置天線

    提供了高效率/高增益,其特點(diǎn)是底座上帶有旋轉(zhuǎn)接頭的柔性塑料表面結(jié)構(gòu)。它們也易于安裝,具有可定制的電纜長(zhǎng)度和連接選項(xiàng),以滿足您的特定需求。 這些天線實(shí)現(xiàn)了LTE、4G5G網(wǎng)絡(luò)之間的無縫過渡,是工業(yè)
    發(fā)表于 01-02 11:58

    4G/5G全系列安卓智模塊開發(fā)板

    模塊5G
    jf_87063710
    發(fā)布于 :2023年12月18日 14:15:20

    微型5G智能網(wǎng)關(guān)助力打造智能清潔機(jī)器

    針對(duì)清潔機(jī)器人應(yīng)用,可以選用微型5G智能網(wǎng)關(guān)方案,為機(jī)器人提供高速、低延時(shí)的5G通信和5G遠(yuǎn)程管理能力,支撐
    的頭像 發(fā)表于 12-08 17:52 ?401次閱讀
    微型<b class='flag-5'>5G</b>智能網(wǎng)關(guān)助力打造智能清潔<b class='flag-5'>機(jī)器</b>人

    #紫光 #5G衛(wèi)星 紫光推出首款5G衛(wèi)星通信芯片

    衛(wèi)星通信5G
    深圳市浮思特科技有限公司
    發(fā)布于 :2023年11月21日 15:45:01