0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AI Engine架構(gòu)的構(gòu)成及應(yīng)用優(yōu)勢

FPGA技術(shù)驛站 ? 來源:TeacherGaoFPGAHub ? 作者:TeacherGaoFPGAHub ? 2022-03-09 15:47 ? 次閱讀

AI Engine陣列是由一系列的AI EngineTile構(gòu)成。每個AI Engine Tile包含一個AI Engine,一個存儲單元和一個互連單元,如下圖所示。可以看到相鄰兩行AI Engine Tile的存儲單元與AI Engine的位置正好相反。

da237382-9e02-11ec-952b-dac502259ad0.png

存儲單元可被東西南北四個方向的AI Engine共享,當(dāng)然這也跟AI Engine的位置有關(guān)。例如圖中紅色AI Engine可訪問與之相鄰的4個存儲單元(黃色標(biāo)記)。最右側(cè)的橙色AI Engine就只能訪問三個存儲單元,因為其位于邊界。每個方向的存儲單元都有對應(yīng)的存儲器接口,AI Engine在訪問相應(yīng)方向的存儲單元時正是通過這些接口實現(xiàn)的。每次訪問的最大位寬為256。

水平方向相鄰的兩個AI Engine之間還有級聯(lián)端口,用于傳送累加器的結(jié)果。仍以上圖為例,最下方的一行AI Engine可從左至右級聯(lián),倒數(shù)第二行的AI Engine可從右至左級聯(lián)。同時,最下方級聯(lián)至最右側(cè)時可與倒數(shù)第二行最右側(cè)的AI Engine級聯(lián),形成蛇形級聯(lián)。

互連單元采用AIX4 Stream接口將數(shù)據(jù)在東西南北四個方向傳送。同時每個AI Engine Tile的存儲單元都包含一個DMA。每個DMA由一個獨立的S2MM和一個獨立的MM2S構(gòu)成。前者用于將數(shù)據(jù)從Stream上取下來寫入到存儲單元,后者用于將存儲單元的數(shù)據(jù)上傳到Stream,如下圖所示。

da32f7a8-9e02-11ec-952b-dac502259ad0.png

再看AI Engine自身,如下圖所示。每個AIEngine包含一個程序存儲單元,大小為16KB,有2個Stream輸入接口和2個Stream輸出接口,均為32位。因此,每個時鐘周期可從一個Stream上獲取一個32位數(shù)據(jù)或每4個時鐘周期可從一個Stream上獲取一個128位數(shù)據(jù)。每個AI Engine還有4個存儲單元訪問接口,但每個時鐘周期只可以有兩次讀操作和一次寫操作。

da4b3c8c-9e02-11ec-952b-dac502259ad0.png

至此,我們可以看到AI Engine有三種數(shù)據(jù)源:存儲單元、AXI4-Stream和級聯(lián)接口。因此,編程時需要充分了解AIE的數(shù)據(jù)訪問能力:2個32位AXI4-Stream輸入,2個32位AXI4-Stream輸出,1個384位級聯(lián)Stream輸入,1個384位級聯(lián)Stream輸出,2個256位讀操作和1個256位寫操作。

AI Engine本身是一個高度優(yōu)化的SIMD(Single Instruction Multiple Data)& VLIW(Very Long Instruction Word)處理器,包含1個標(biāo)量處理單元,1個向量處理單元,2個讀地址發(fā)生器,1個寫地址發(fā)生器,1個取指和譯碼單元,如下圖所示。正因為有2個讀地址發(fā)送器和1個寫地址發(fā)生器,所以每次訪問可實現(xiàn)2個256讀操作和1個256寫操作。

da7e52ca-9e02-11ec-952b-dac502259ad0.png

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    19032

    瀏覽量

    228448
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    29359

    瀏覽量

    267647

原文標(biāo)題:AIE(12)—AI Engine架構(gòu)概覽

文章出處:【微信號:Lauren_FPGA,微信公眾號:FPGA技術(shù)驛站】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    NanoEdge AI的技術(shù)原理、應(yīng)用場景及優(yōu)勢

    能耗并提高數(shù)據(jù)安全性。本文將對 NanoEdge AI 的技術(shù)原理、應(yīng)用場景以及優(yōu)勢進(jìn)行綜述。 1、技術(shù)原理 NanoEdge AI 的核心技術(shù)包括邊緣計算、神經(jīng)網(wǎng)絡(luò)壓縮和低功耗硬件設(shè)計。邊緣計算
    發(fā)表于 03-12 08:09

    AI芯片熱潮和架構(gòu)創(chuàng)新有什么作用

    魏少軍談AI芯片熱潮和架構(gòu)創(chuàng)新 透露清華Thinker芯片將獨立融資
    發(fā)表于 04-23 14:59

    AI芯片熱潮和架構(gòu)創(chuàng)新是什么

    魏少軍談AI芯片熱潮和架構(gòu)創(chuàng)新 透露清華Thinker芯片將獨立融資
    發(fā)表于 04-24 11:29

    基于ATCA的測試系統(tǒng)架構(gòu)是如何構(gòu)成的?

    ATCA在測試領(lǐng)域有哪些應(yīng)用實例?基于ATCA的測試系統(tǒng)架構(gòu)是如何構(gòu)成的?
    發(fā)表于 05-11 07:01

    UltraScale DSP48 Slice架構(gòu)優(yōu)勢是什么?

    UltraScale DSP48 Slice架構(gòu)優(yōu)勢是什么?UltraScale內(nèi)存架構(gòu)優(yōu)勢是什么?
    發(fā)表于 05-24 06:34

    Openharmony的ACE engine lite部分是否需要MMU的支持?

    `M7架構(gòu)的能不能跑OpenHarmony的ACE ENGINE?目前對ace依賴的環(huán)境還不熟悉,如果支持ACE的話,需要修改哪些部分呢?`
    發(fā)表于 05-31 09:25

    基于docker技術(shù)的工業(yè)App架構(gòu)是如何構(gòu)成

    基于docker技術(shù)的工業(yè)App架構(gòu)是如何構(gòu)成的?
    發(fā)表于 09-28 06:35

    XILINX FPGA 芯片整體架構(gòu)是如何構(gòu)成

    XILINX FPGA 芯片整體架構(gòu)是如何構(gòu)成的?XILINX FPGA 芯片有哪些資源?
    發(fā)表于 10-29 06:26

    STM32芯片的架構(gòu)是如何構(gòu)成

    STM32是什么?有哪幾種分類?STM32芯片的架構(gòu)是如何構(gòu)成的?
    發(fā)表于 10-29 07:53

    基于CMSIS標(biāo)準(zhǔn)的軟件架構(gòu)是怎樣構(gòu)成

    CMSIS標(biāo)準(zhǔn)是什么意思?基于CMSIS標(biāo)準(zhǔn)的軟件架構(gòu)是怎樣構(gòu)成的?
    發(fā)表于 11-04 06:06

    【CC3200AI實驗教程11】瘋殼·AI語音人臉識別-AI語音系統(tǒng)架構(gòu)

    CC3200AI實驗教程——瘋殼·開發(fā)板系列AI語音系統(tǒng)架構(gòu)AI語音識別系統(tǒng)的系統(tǒng)架構(gòu)如圖1.0.1所示。圖1.0.1
    發(fā)表于 08-30 14:54

    【CC3200AI實驗教程14】瘋殼·AI語音人臉識別-AI人臉系統(tǒng)架構(gòu)

    CC3200AI實驗教程——瘋殼·開發(fā)板系列AI人臉系統(tǒng)架構(gòu)AI人臉識別系統(tǒng)由7大塊組成,分別是攝像頭、CC3200、串口調(diào)試助手、路由器、公網(wǎng)、服務(wù)器、數(shù)據(jù)庫以及百度
    發(fā)表于 08-31 16:35

    Map Service Engine Based On We

    Abstract:A design and implementation of map service engine based on web is introduced
    發(fā)表于 07-23 10:43 ?17次下載

    Qualcomm推出人工智能引擎AI Engine

    優(yōu)勢包括即時響應(yīng)、隱私保護(hù)增強和可靠性提升。得益于人工智能引擎AI Engine的支持,驍龍核心硬件架構(gòu)——Qualcomm? Hexagon? 向量處理器、Qualcomm? Adr
    發(fā)表于 03-20 18:07 ?1825次閱讀

    螞蟻數(shù)科發(fā)布新一代融合AI風(fēng)控引擎“AIR Engine

    在數(shù)字化浪潮的推動下,金融科技領(lǐng)域的風(fēng)控技術(shù)正迎來新的突破。近日,螞蟻數(shù)科旗下的蟻盾風(fēng)控團(tuán)隊正式發(fā)布了新一代融合AI風(fēng)控引擎——“AIR Engine(AIFUSERiskEngine)”,該引擎在原有的決策式AI
    的頭像 發(fā)表于 06-26 18:20 ?1117次閱讀