0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

利用 Renesas 的 RZ/V2 系列 MPU 加速視覺識(shí)別系統(tǒng)設(shè)計(jì)

海闊天空的專欄 ? 來源:Jacob Beningo ? 作者:Jacob Beningo ? 2023-10-03 14:36 ? 次閱讀

作者:Jacob Beningo

邊緣視覺識(shí)別正成為許多產(chǎn)品的一個(gè)越來越關(guān)鍵的特性,機(jī)器學(xué)習(xí) (ML) 和人工智能AI) 的應(yīng)用范圍不斷擴(kuò)大。開發(fā)人員面臨的問題在于,ML/AI賦能的視覺運(yùn)行識(shí)別算法所需要的計(jì)算能力可能超出了功耗受限應(yīng)用所能提供的能力。如果需要昂貴的熱管理解決方案,則成本還會(huì)增加。

邊緣 ML/AI 的目標(biāo)是找到最優(yōu)架構(gòu)方法以平衡性能與功耗,同時(shí)提供一個(gè)強(qiáng)大的軟件生態(tài)系統(tǒng)來開發(fā)應(yīng)用程序。

基于這些考慮,本文介紹了 Renesas Electronics RZ/V2 系列微處理器單元 (MPU) 解決方案,該方案內(nèi)置 AI硬件加速器。本文探討了 MPU——而非微控制器MCU) 或高端圖形處理單元 (GPU)——如何解決設(shè)計(jì)人員面臨的幾個(gè)問題,本文還說明了如何利用 RZ/V2系列設(shè)計(jì)視覺識(shí)別系統(tǒng),并提供了一些有助于順利完成該過程的“技巧與訣竅”。

RZ/V2 系列 MPU 介紹

RZ/V2 系列 MPU 解決方案為使用三核微處理器的開發(fā)人員解鎖了許多能力。RZ/V2L 系列微處理器包含兩個(gè)運(yùn)行在 1.2 GHz 的 ArmCortex-A55 處理器和一個(gè)運(yùn)行在 200 MHz 的實(shí)時(shí)微控制器內(nèi)核 (Arm? Cortex?-M33)。此外,該系列器件包含一個(gè)基于 ArmMali-G31 多媒體處理器的 GPU,具有 NEON 單指令/多數(shù)據(jù) (SIMD)指令。這三個(gè)處理核心和多媒體處理器相結(jié)合,為從事視覺識(shí)別系統(tǒng)的開發(fā)人員提供了功能全面的解決方案。

RZ/V2 系列目前有兩類 MPU,即 RZ/V2L 和 RZ/V2M 系列。RZ/V2L 有一個(gè)簡單的圖像信號(hào)處理器 (ISP)、3D圖形引擎和一個(gè)高度通用的外設(shè)集。RZ/V2M 則增加了一個(gè)高性能 ISP,支持每秒 30 幀 (fps) 的 4K 分辨率。本文重點(diǎn)介紹 RZ/V2L系列,包括 R9A07G054L23GBG 和R9A07G054L24GBG。這兩款器件的主要區(qū)別在于:R9A07G054L23GBG 采用 15 mm2456-LFBGA 封裝,而 R9A07G054L24GBG 采用 21 mm2 551-LFBGA 封裝。

RZ/V2L 系列的方框圖如圖 1 所示。除了三個(gè)處理核心外,這些 MPU 還包括 DDR3/DDR4內(nèi)存、SPI、USB、以太網(wǎng)、I2C、CAN、SCI、GPIO、模數(shù)轉(zhuǎn)換器ADC)等標(biāo)準(zhǔn)外設(shè)的接口。此外,這些器件包含安全功能,如安全啟動(dòng)、加密引擎和真隨機(jī)數(shù)發(fā)生器 (TRNG)。不過,該 MPU 系列的出眾之處在于其動(dòng)態(tài)可配置處理器(DRP) AI 加速器。

1.png
秘密武器——DRP-AI 加速器

DRP-AI 加速器是讓 RZ/V2L 系列 MPU 以較少的能耗和較低的溫度快速執(zhí)行視覺識(shí)別應(yīng)用的秘密武器。DRP-AI 包括兩個(gè)元件:DRP 和 AI乘法累加 (MAC),二者能通過內(nèi)部開關(guān)優(yōu)化數(shù)據(jù)流來高效處理卷積網(wǎng)絡(luò)和全組合層的操作(圖 2)。

DRP-AI 硬件專門用于執(zhí)行 AI 推理。DRP-AI 采用 Renesas開發(fā)的獨(dú)特動(dòng)態(tài)可配置技術(shù),可提供靈活性、高速處理和高能效。此外,免費(fèi)軟件工具 DRP-AI 翻譯器可以讓用戶實(shí)施優(yōu)化的 AI 模型,迅速實(shí)現(xiàn)性能最大化。由DRP-AI 翻譯器輸出的多個(gè)可執(zhí)行文件可以放在外部存儲(chǔ)器中。然后,應(yīng)用程序可以在運(yùn)行時(shí)在多個(gè) AI 模型之間動(dòng)態(tài)切換。

DRP 可以通過動(dòng)態(tài)改變硬件配置來快速處理復(fù)雜的活動(dòng),如圖像預(yù)處理和 AI 模型池化層。

2.png

DRP-AI 翻譯器

DRP-AI 翻譯器工具從訓(xùn)練好的 ONNX 模型生成 DRP-AI 優(yōu)化的可執(zhí)行文件,與具體 AI 框架無關(guān)。例如,開發(fā)人員可以使用PyTorch、TensorFlow 或任何其他 AI 建??蚣埽灰茌敵?ONNX 模型即可。模型一旦訓(xùn)練完畢,就被送入 DRP-AI 翻譯器,由其生成DRP 和 AI-MAC 可執(zhí)行文件(圖 3)。

3.png

DRP-AI 翻譯器有三個(gè)主要用途:

調(diào)度 AI 模型處理的每個(gè)操作。

隱藏開銷,如計(jì)劃表中每個(gè)操作的轉(zhuǎn)換期間發(fā)生的內(nèi)存訪問時(shí)間。

優(yōu)化網(wǎng)絡(luò)圖結(jié)構(gòu)。

翻譯器自動(dòng)將 AI 模型的每個(gè)進(jìn)程分配給 AI-MAC 和 DRP,用戶無需成為硬件專家就能輕松使用DRP-AI。開發(fā)人員可通過所提供的驅(qū)動(dòng)程序進(jìn)行調(diào)用,以運(yùn)行高性能 AI 模型。此外,DRP-AI 翻譯器可持續(xù)更新以支持新開發(fā)的 AI模型,而無需改變硬件。

系統(tǒng)用例和流程

使用 RZ/V2L MPU 訓(xùn)練和部署視覺識(shí)別應(yīng)用的一般流程如圖 4所示。像平常一樣,工程師可以獲取數(shù)據(jù)集,并使用它來訓(xùn)練自己的視覺識(shí)別模型。無論嘗試識(shí)別的是貓咪、購物車中的產(chǎn)品,還是裝配線上的故障零件,他們都可以使用熟悉的AI 框架開展訓(xùn)練流程。模型訓(xùn)練完成后,就會(huì)被轉(zhuǎn)換成 ONNX 格式,并被送入 DRP-AI 翻譯器,翻譯器進(jìn)而輸出可以在 DRP-AI硬件上執(zhí)行的目標(biāo)代碼。隨后,來自攝像頭、加速計(jì)或其他傳感器的數(shù)據(jù)經(jīng)采樣后饋入可執(zhí)行文件,提供運(yùn)行推理的結(jié)果。

4.png

工程師在其設(shè)計(jì)中可以通過多種方式利用 RZ/V2L MPU(圖 5)。首先,RZ/V2L MPU 可用于獨(dú)立的設(shè)計(jì)中,RZ/V2L用作系統(tǒng)中唯一的處理器。它有三個(gè)核心和 AI 加速硬件,系統(tǒng)可以不需要額外的計(jì)算能力。

第二個(gè)用例是 RZ/V2L 用作更大系統(tǒng)中的 AI 處理器。在此用例中,RZ/V2L 運(yùn)行 AI推理,并將結(jié)果返回給另一個(gè)處理器或系統(tǒng),后者針對(duì)該結(jié)果進(jìn)行操作。所選用例取決于多個(gè)因素,如成本、整體系統(tǒng)架構(gòu)、性能和實(shí)時(shí)響應(yīng)要求。

5.png

現(xiàn)實(shí)生活應(yīng)用示例

有許多可以部署視覺識(shí)別技術(shù)的用例。一個(gè)有趣的例子是在超市。如今,在雜貨店結(jié)賬時(shí),員工或購物者通常會(huì)掃描購物車中的每件物品。一個(gè)有趣的用例是利用視覺識(shí)別檢測穿過傳送帶的物品,并自動(dòng)計(jì)費(fèi)。

可以使用簡單的 CMOS 攝像頭和 Renesas 的 RTK9754L23S01000BE 評(píng)估板來構(gòu)建原型(圖 6)。RZ/V2L嵌入式開發(fā)板帶有系統(tǒng)級(jí)模塊 (SOM) 和載板,便于開發(fā)人員快速啟動(dòng)和運(yùn)行。此外,開發(fā)板支持 Linux 和 DRP-AI 翻譯器等各種工具。

6.png

圖 7 中可以看到獲取圖像數(shù)據(jù)和產(chǎn)生 AI 結(jié)果所需的操作概述。在此應(yīng)用示例中,使用 CMOS 傳感器通過板載 ISP拍攝傳送帶的圖像。然后,圖像被保存到存儲(chǔ)器中并被送入 DRP-AI 引擎。最后,DRP-AI 引擎運(yùn)行推理并提供 AI結(jié)果。例如,結(jié)果可能是發(fā)現(xiàn)了香蕉或蘋果,或其他某種水果。

該結(jié)果通常伴隨一個(gè) 0 到 1 的置信度。例如,置信度 0.90 意味著 AI 確信檢測到蘋果,而置信度 0.52 可能表示 AI認(rèn)為是蘋果但不確定。將多個(gè)樣本的 AI 結(jié)果進(jìn)行平均以提高正確結(jié)果的概率,這種做法并不罕見。

7.png

最后,在此例中,檢測到的物體周圍會(huì)繪制一個(gè)方框,識(shí)別到的物體的名稱與置信度一起顯示在方框中(圖 8)。

8.png

RZ/V2L 入門技巧與訣竅

希望在 Renesas 的 RZ/V2L MPU
上開始機(jī)器學(xué)習(xí)的開發(fā)人員會(huì)發(fā)現(xiàn),他們有很多資源可資利用。為了簡化和加快開發(fā),開發(fā)人員應(yīng)牢記以下幾個(gè)“技巧和竅門”:

從開發(fā)板和現(xiàn)有示例開始,體驗(yàn)應(yīng)用的部署和運(yùn)行。

如果有必要執(zhí)行多個(gè)推理,則將可執(zhí)行模型保存到外部存儲(chǔ)器中,并使用 DRP-AI 功能在模型間快速切換。

查看 Renesas 的 RZ/V 嵌入式 AI MPU 網(wǎng)站上的文檔和視頻

下載 DRP-AI 翻譯器。

下載 RZ/V2L DRP-AI 支持包。

開發(fā)人員遵循這些“技巧和竅門”,可以在開始使用時(shí)節(jié)省更多的時(shí)間并省去更多的麻煩。

結(jié)語

ML 和 AI 正在進(jìn)入許多邊緣應(yīng)用,實(shí)時(shí)識(shí)別物品的能力變得越來越重要。設(shè)計(jì)人員的困難在于找到合適的架構(gòu),以便在邊緣執(zhí)行 AI/ML。GPU通常非常耗電,而 MCU 可能沒有足夠的計(jì)算能力。

如本文所述,配備 DRP-AI 的 Renesas RZ/V MPU 系列具備多個(gè)優(yōu)點(diǎn),如硬件加速 AI,同時(shí)還有大量的工具鏈和原型開發(fā)支持。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    19044

    瀏覽量

    228497
  • 加速器
    +關(guān)注

    關(guān)注

    2

    文章

    789

    瀏覽量

    37581
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    29401

    瀏覽量

    267701
  • MPU
    MPU
    +關(guān)注

    關(guān)注

    0

    文章

    335

    瀏覽量

    48667
  • 視覺識(shí)別
    +關(guān)注

    關(guān)注

    3

    文章

    89

    瀏覽量

    16649
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    利用RenesasRZ/V2系列MPU加速視覺識(shí)別系統(tǒng)設(shè)計(jì)

    了功耗受限應(yīng)用所能提供的能力。如果需要昂貴的熱管理解決方案,則成本還會(huì)增加。 邊緣 ML/AI 的目標(biāo)是找到最優(yōu)架構(gòu)方法以平衡性能與功耗,同時(shí)提供一個(gè)強(qiáng)大的軟件生態(tài)系統(tǒng)來開發(fā)應(yīng)用程序。 基于這些考慮,本文介紹了 Renesas Electronics
    的頭像 發(fā)表于 11-05 16:52 ?9120次閱讀
    <b class='flag-5'>利用</b><b class='flag-5'>Renesas</b>的<b class='flag-5'>RZ</b>/<b class='flag-5'>V2</b><b class='flag-5'>系列</b><b class='flag-5'>MPU</b><b class='flag-5'>加速</b><b class='flag-5'>視覺</b><b class='flag-5'>識(shí)別系統(tǒng)</b>設(shè)計(jì)

    基于瑞薩RZ/V2H AI微處理器的解決方案:高性能視覺AI系統(tǒng)

    復(fù)雜的實(shí)時(shí)物體識(shí)別及推理,同時(shí)功耗可與傳統(tǒng)的嵌入式MPU相媲美,無需冷卻風(fēng)扇。這里介紹基于RZ/V2H的解決方案:高性能視覺AI
    發(fā)表于 07-02 18:36 ?383次閱讀
    基于瑞薩<b class='flag-5'>RZ</b>/<b class='flag-5'>V2</b>H AI微處理器的解決方案:高性能<b class='flag-5'>視覺</b>AI<b class='flag-5'>系統(tǒng)</b>

    面向邊緣AI應(yīng)用的全新RZ/V2H

    一款新的64位 MPU RZ/V2H ,為瑞薩電子的RZ/V系列帶來了針對(duì)邊緣AI的重大升級(jí)。邊
    的頭像 發(fā)表于 05-07 14:56 ?7301次閱讀
    面向邊緣AI應(yīng)用的全新<b class='flag-5'>RZ</b>/<b class='flag-5'>V2</b>H

    貿(mào)澤開售面向AI視覺IoT應(yīng)用的Renesas RZ/V2L高精度MPU

    /V2L AI 微處理器。RZ/V2L支持入門級(jí)人工智能 (AI),同時(shí)又沿襲了其前代產(chǎn)品RZ/V2M的多項(xiàng)強(qiáng)大功能,包括出色的能效和高精度
    發(fā)表于 07-05 10:15 ?1124次閱讀
    貿(mào)澤開售面向AI<b class='flag-5'>視覺</b>IoT應(yīng)用的<b class='flag-5'>Renesas</b> <b class='flag-5'>RZ</b>/<b class='flag-5'>V2</b>L高精度<b class='flag-5'>MPU</b>

    MPU6050可以測線加速度嗎?----基于Mems傳感器的運(yùn)動(dòng)目標(biāo)姿態(tài)識(shí)別系統(tǒng)(硬件部分)

    大家好,我最近在做畢業(yè)設(shè)計(jì),題目叫做《基于Mems傳感器的運(yùn)動(dòng)目標(biāo)姿態(tài)識(shí)別系統(tǒng)(硬件部分)》,任務(wù)書要求求出姿態(tài)角,轉(zhuǎn)矩,還有位移,然后我就用的是MPU6050來測角加速度,然后就是測不出線
    發(fā)表于 04-25 21:10

    劃片機(jī)視覺識(shí)別系統(tǒng)設(shè)計(jì)原理分析

    劃片機(jī)視覺識(shí)別系統(tǒng)設(shè)計(jì)原理分析 1 視覺識(shí)別系統(tǒng)構(gòu)成 劃片機(jī)的視覺識(shí)別系統(tǒng)是以計(jì)算機(jī)為主的實(shí)
    發(fā)表于 04-21 09:20 ?2961次閱讀
    劃片機(jī)<b class='flag-5'>視覺</b><b class='flag-5'>識(shí)別系統(tǒng)</b>設(shè)計(jì)原理分析

    瑞薩電子推出支持入門級(jí)AI應(yīng)用設(shè)計(jì)的全新RZ/V2L MPU

    MPU集成瑞薩獨(dú)有的人工智能(AI)加速器——DRP-AI(動(dòng)態(tài)可配置處理器),使嵌入式AI系統(tǒng)更加簡單、節(jié)能。全新RZ/V2L沿襲了多項(xiàng)從
    的頭像 發(fā)表于 05-24 09:59 ?2362次閱讀

    使用 Renesas RZ/V2 系列 MPU 加速視覺識(shí)別系統(tǒng)設(shè)計(jì)

    發(fā)表于 11-24 19:19 ?0次下載
    使用 <b class='flag-5'>Renesas</b> <b class='flag-5'>RZ</b>/<b class='flag-5'>V2</b> <b class='flag-5'>系列</b> <b class='flag-5'>MPU</b> <b class='flag-5'>加速</b><b class='flag-5'>視覺</b><b class='flag-5'>識(shí)別系統(tǒng)</b>設(shè)計(jì)

    瑞薩RZ/G系列MPU簡介

    瑞薩RZ/G系列MPU基于Arm Cortex架構(gòu)或RISC-V架構(gòu),支持Linux操作系統(tǒng),可為圖形、多媒體和嵌入式
    的頭像 發(fā)表于 09-11 12:41 ?1167次閱讀
    瑞薩<b class='flag-5'>RZ</b>/G<b class='flag-5'>系列</b><b class='flag-5'>MPU</b>簡介

    瑞薩電子RZ/V2系列MPU簡介

    RZ/V2系列是一種內(nèi)置瑞薩電子獨(dú)家硬件加速器 “DRP(Dynamically Reconfigurable Processor,動(dòng)態(tài)可配置處理器)-AI”的AI專用微處理器(
    的頭像 發(fā)表于 09-13 12:24 ?1057次閱讀
    瑞薩電子<b class='flag-5'>RZ</b>/<b class='flag-5'>V2</b><b class='flag-5'>系列</b><b class='flag-5'>MPU</b>簡介

    基于RZ/V2L AI MPU的人頭計(jì)數(shù)應(yīng)用

    瑞薩基于RZ/V2L AI MPU開發(fā)了大量可拿來即用的AI應(yīng)用程序,并提供源代碼、預(yù)編譯應(yīng)用程序二進(jìn)制文件和預(yù)訓(xùn)練的人工智能模型對(duì)象。您可以從各種用例中選擇感興趣的應(yīng)用程序,并立即在RZ
    的頭像 發(fā)表于 12-15 13:49 ?568次閱讀

    產(chǎn)品簡介 | RZ/G2系列MPU

    產(chǎn)品簡介 | RZ/G2系列MPU
    的頭像 發(fā)表于 04-29 08:08 ?278次閱讀
    產(chǎn)品簡介 | <b class='flag-5'>RZ</b>/G<b class='flag-5'>2</b><b class='flag-5'>系列</b><b class='flag-5'>MPU</b>

    產(chǎn)品簡介 | RZ/V2系列MPU

    產(chǎn)品簡介 | RZ/V2系列MPU
    的頭像 發(fā)表于 05-08 08:06 ?350次閱讀
    產(chǎn)品簡介 | <b class='flag-5'>RZ</b>/<b class='flag-5'>V2</b><b class='flag-5'>系列</b><b class='flag-5'>MPU</b>

    產(chǎn)品簡介 | RZ/A系列MPU

    產(chǎn)品簡介 | RZ/A系列MPU
    的頭像 發(fā)表于 05-24 08:06 ?334次閱讀
    產(chǎn)品簡介 | <b class='flag-5'>RZ</b>/A<b class='flag-5'>系列</b><b class='flag-5'>MPU</b>

    瑞薩RZ/T系列MPU的中斷重入實(shí)現(xiàn)

    基于Arm的RZ/T系列MPU通過工業(yè)以太網(wǎng)通信提供高性能和高速實(shí)時(shí)控制,為自動(dòng)化市場構(gòu)建高性能系統(tǒng)。RZ/T
    的頭像 發(fā)表于 07-23 14:47 ?420次閱讀
    瑞薩<b class='flag-5'>RZ</b>/T<b class='flag-5'>系列</b><b class='flag-5'>MPU</b>的中斷重入實(shí)現(xiàn)