0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Imagination發(fā)布其最新一代IMG Series4神經(jīng)網(wǎng)絡(luò)加速器產(chǎn)品

Dbwd_Imgtec ? 來源:半導(dǎo)體行業(yè)觀察 ? 作者:半導(dǎo)體行業(yè)觀察 ? 2020-12-14 16:50 ? 次閱讀

隨著智能駕駛和自動駕駛等應(yīng)用越發(fā)火熱,汽車AI芯片市場在最近幾年進(jìn)入了高速發(fā)展期。無論是NXP瑞薩這樣的傳統(tǒng)汽車芯片廠,還是如英偉達(dá)英特爾這樣的消費(fèi)芯片大廠,甚至是FPGA龍頭Xilinx,都對這個(gè)市場虎視眈眈。此外,國內(nèi)外也有一大波初創(chuàng)芯片企業(yè)涌入這個(gè)市場。 Imagination作為全球半導(dǎo)體IP大廠,已推出多代AI加速產(chǎn)品,獲得了良好的市場反響,可以為汽車芯片廠商打造高性能車用AI芯片提供強(qiáng)有力的支持。日前,Imagination發(fā)布其最新一代IMG Series4神經(jīng)網(wǎng)絡(luò)加速器(NNA)產(chǎn)品,該公司視覺和人工智能部門高級總監(jiān)Andrew Grant在接受媒體采訪時(shí)指出:“雖然目前市場上已經(jīng)有能滿足自動駕駛需求的AI芯片,但功耗不夠理想。所以,我們花兩年時(shí)間去了解和評估客戶需求,推出了高性能低功耗的4系列NNA產(chǎn)品,并且將自動駕駛作為主打市場”。

Andrew Grant還介紹道,IMG Series4 NNA采用了全新的多核架構(gòu),能提供高達(dá)600 TOPS的算力,從而為ADAS和自動駕駛等應(yīng)用提供高效支持。Imagination之所以能提供性能如此強(qiáng)悍的產(chǎn)品,得益于公司多年來在IP領(lǐng)域的深厚積累。

IP專家的步步為“贏”

在談及Imagination的時(shí)候,大家首先想到的就是他們在手機(jī)GPU IP市場的影響力。

從Imagination提供的數(shù)據(jù)也可以看到,他們在移動GPU IP市場的份額已經(jīng)達(dá)到35.5%,這幫助他們超越Arm Mali系列和高通Adreno系列,登上移動GPU IP龍頭的位置。除了移動GPU以外,Imagination在車載GPU IP市場也幾乎拿下了半壁江山。數(shù)據(jù)顯示,他們在這個(gè)市場的占有率高達(dá)43%。

此外,Imagination在近來熱門的AI 市場也布局多年。據(jù)介紹,Imagination在過去七年里持續(xù)加大對AI研發(fā)的投入,公司迄今已擁有超過80項(xiàng)針對AI領(lǐng)域的專利,并推出了一系列神經(jīng)網(wǎng)絡(luò)加速器IP產(chǎn)品。 這系列IP是一個(gè)從0開始設(shè)計(jì)的完整、獨(dú)立式的硬件IP神經(jīng)網(wǎng)絡(luò)加速器,可以同時(shí)支持CNN、RNN、LSTM三種神經(jīng)網(wǎng)絡(luò)類型,并且可支持caff、caffe2、Google TensorFlow等通用機(jī)器學(xué)習(xí)體系架構(gòu),還支持可適用于移動端的TensorFlow Lite、caffe2go等機(jī)器學(xué)習(xí)體系架構(gòu)。再加上這系列內(nèi)核可在最小的硅面積上以非常低的功耗實(shí)現(xiàn)高性能的神經(jīng)網(wǎng)絡(luò)計(jì)算,因此自面世以來獲得了客戶的高度認(rèn)可。Imagination在過去幾年里也在快速迭代該系列IP。

2017年9月,Imagination發(fā)布了旗下首款神經(jīng)網(wǎng)絡(luò)加速器PowerVR Series 2NX NNA,其單核性能僅覆蓋1 TOPS到4.1 TOPS的范圍;而到了2018年推出的第二代PowerVR 3NX,單核性能不但覆蓋了0.6 TOPS到10 TOPS,其多核產(chǎn)品性能更是能做到20 TOPS到160 TOPS,可以滿足從L2級到L5級自動駕駛的邊緣推理需求。 而文章開頭談到的IMG Series 4NNA則是Imagination推出的第三代NNA。 Andrew Grant表示,這款公司歷時(shí)兩年打造出來的產(chǎn)品不但在性能上獲得大幅度提升,還擁有靈活的多核設(shè)計(jì)、創(chuàng)新性的Tensor Tiling( Imagination’s Tensor Tiling,ITT)技術(shù)、低功耗和滿足車規(guī)級安全需求等多項(xiàng)優(yōu)勢,從而能為領(lǐng)先的汽車行業(yè)顛覆者、一級供應(yīng)商、整車廠(OEM)和汽車系統(tǒng)級芯片(SoC)廠商提供強(qiáng)大助力。

IMGSeries4 NNA 的強(qiáng)勢出擊

根據(jù)Andrew Grant的觀點(diǎn),當(dāng)前的車載AI芯片擁有三方面的需求,分別是超強(qiáng)性能、超低功耗和超低延遲。當(dāng)然,作為汽車級別的芯片,安全也是必不可少的,這就是IMG Series 4 NNA的設(shè)計(jì)指導(dǎo)。

從官方提供的資料我們可以看到,Series4具有以下特性: 首先是多核擴(kuò)展性和靈活性方面,據(jù)Imagination介紹,其多核架構(gòu)支持在多個(gè)核之間對工作負(fù)載進(jìn)行靈活的分配和同步。Imagination的軟件提供了精細(xì)的控制能力,并通過對多個(gè)工作負(fù)載進(jìn)行批處理、拆分和調(diào)度而提高了靈活性,現(xiàn)在可以在任意數(shù)量的內(nèi)核上使用。Series4可為每個(gè)集群配置 2個(gè)、4個(gè)、6個(gè)或者8個(gè)核。

其次是性能。據(jù)介紹,Series4的每個(gè)單核能夠以不到一瓦的功耗提供12.5 TOPS的性能。舉例來說,一個(gè)8核集群在5nm工藝的加持下,可以提供100 TOPS的算力。那就代表著配有6個(gè)8核集群的解決方案可以提供600 TOPS的算力。來到AI推理方面,Series4 NNA的性能比嵌入式GPU快20倍以上,與嵌入式CPU相比,更是快了1000倍。

第三,超低延遲也是這一代NNA IP的另一個(gè)特性。據(jù)了解,通過將多個(gè)單核組成2核、4核、6核或8核的多核集群,所有內(nèi)核可以相互協(xié)作,并行處理一個(gè)任務(wù)。這就降低了處理延遲,縮短響應(yīng)時(shí)間。數(shù)據(jù)顯示,對于一個(gè)8核集群,理想情況下延遲會減少為單核獨(dú)立執(zhí)行時(shí)的1/8。節(jié)省大量帶寬則是Imagination新NNA的另一大優(yōu)勢,這主要得益于公司正在申請專利的的Tensor Tiling技術(shù)(Imagination’s Tensor Tiling,ITT),這也是Series4中新增的功能。據(jù)介紹,借助這項(xiàng)技術(shù),Imagination的Series4可以通過對計(jì)算任務(wù)進(jìn)行tiling,充分利用片上存儲,提升數(shù)據(jù)處理效率,并節(jié)省訪問外部存儲的帶寬。

在具體操作中,針對不同的任務(wù),有不同的操作方式。據(jù)了解,在批處理大量的小型任務(wù)時(shí),Tensor Tiling能夠把批處理任務(wù)分配到各個(gè)NNA單核,讓每個(gè)NNA單核獨(dú)立工作,提升并行處理的能力;而在面對一些大型網(wǎng)絡(luò)的時(shí)候,Tensor Tiling則可以從多個(gè)維度拆分任務(wù),讓所有NNA單核共同執(zhí)行一個(gè)推理任務(wù)。這不但減少了網(wǎng)絡(luò)推理的延遲,在理想情況下,協(xié)同并行處理的吞吐量與獨(dú)立并發(fā)處理也是相同的。 值得一提的是,這里的拆分都是通過Imagination的編譯器來完成的,不需要開發(fā)者手動操作,借助NNA的性能分析工具,開發(fā)者還能對AI任務(wù)進(jìn)行更好的調(diào)度和分配。

另外,因?yàn)槔帽镜財(cái)?shù)據(jù)的依賴性將中間數(shù)據(jù)保存在片上存儲器中,ITT可以最大限度地減少將數(shù)據(jù)傳輸至外部存儲器,從而將帶寬降低多達(dá)90%。作為一種可擴(kuò)展的算法,ITT在擁有大量輸入數(shù)據(jù)的網(wǎng)絡(luò)上具有顯著優(yōu)勢。車規(guī)級安全性則是Series4不得不提的另一個(gè)優(yōu)勢。眾所周知,汽車芯片對安全提出了更高的要求。Imagination為其全新的NNA引入了IP級別的安全功能,且產(chǎn)品的設(shè)計(jì)流程符合ISO 26262標(biāo)準(zhǔn),這就能幫助客戶更容易獲得ISO 26262認(rèn)證。據(jù)報(bào)道,Series4可以在不影響性能的情況下,安全地進(jìn)行神經(jīng)網(wǎng)絡(luò)推理。硬件安全機(jī)制可以保護(hù)編譯后的網(wǎng)絡(luò)、網(wǎng)絡(luò)的執(zhí)行和數(shù)據(jù)處理管道。

在IMG Series4 NNA的發(fā)布會上,Andrew Grant除了介紹新IP的硬件性能外,也同時(shí)講述公司圍繞這系列芯片打造的軟件生態(tài)系統(tǒng),這與硬件配合,加速了開發(fā)者的開發(fā)速度,簡化了開發(fā)流程。而為了給汽車運(yùn)算提供更多的算力支持,Imagination還打通了NNA多核平臺與GPU協(xié)同,給開發(fā)者提供更多的選擇。

Andrew Grant在發(fā)布會上表示,公司的IMG Series4 NNA已經(jīng)開始向客戶提供授權(quán),產(chǎn)品也將于2020年12月在市場上全面供應(yīng)。 ABI Research智慧出行和汽車首席分析師James Hodgson說道:“在從L2和L3級ADAS向L4和L5級全自動駕駛演進(jìn)的過程中,神經(jīng)網(wǎng)絡(luò)的廣泛應(yīng)用將是至關(guān)重要的因素。這些系統(tǒng)將要處理數(shù)以百計(jì)的復(fù)雜場景,從多個(gè)攝像頭和激光雷達(dá)等大量傳感器中提取數(shù)據(jù),從而實(shí)現(xiàn)自動代客泊車、十字路口管理和復(fù)雜城市環(huán)境安全導(dǎo)航等解決方案。高性能、低延遲和高能效的結(jié)合將是實(shí)現(xiàn)高度自動駕駛的關(guān)鍵所在?!?由此可見,一個(gè)全新的大門正在面向Imagination開啟。

責(zé)任編輯:lq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 傳感器
    +關(guān)注

    關(guān)注

    2542

    文章

    50303

    瀏覽量

    750281
  • imagination
    +關(guān)注

    關(guān)注

    1

    文章

    566

    瀏覽量

    61219
  • AI芯片
    +關(guān)注

    關(guān)注

    17

    文章

    1846

    瀏覽量

    34801

原文標(biāo)題:推出600 Tops產(chǎn)品,Imagination持續(xù)發(fā)力汽車AI芯片市場

文章出處:【微信號:Imgtec,微信公眾號:Imagination Tech】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    什么是神經(jīng)網(wǎng)絡(luò)加速器?它有哪些特點(diǎn)?

    神經(jīng)網(wǎng)絡(luò)加速器種專門設(shè)計(jì)用于提高神經(jīng)網(wǎng)絡(luò)計(jì)算效率的硬件設(shè)備。隨著深度學(xué)習(xí)技術(shù)的快速發(fā)展和廣泛應(yīng)用,神經(jīng)網(wǎng)絡(luò)模型的復(fù)雜度和計(jì)算量急劇增加,
    的頭像 發(fā)表于 07-11 10:40 ?361次閱讀

    BP神經(jīng)網(wǎng)絡(luò)和人工神經(jīng)網(wǎng)絡(luò)的區(qū)別

    BP神經(jīng)網(wǎng)絡(luò)和人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Networks,簡稱ANNs)之間的關(guān)系與區(qū)別,是神經(jīng)網(wǎng)絡(luò)領(lǐng)域中個(gè)基礎(chǔ)且重要的話題。本文將從定義、結(jié)構(gòu)、算法、應(yīng)用及
    的頭像 發(fā)表于 07-10 15:20 ?608次閱讀

    rnn是遞歸神經(jīng)網(wǎng)絡(luò)還是循環(huán)神經(jīng)網(wǎng)絡(luò)

    RNN(Recurrent Neural Network)是循環(huán)神經(jīng)網(wǎng)絡(luò),而非遞歸神經(jīng)網(wǎng)絡(luò)。循環(huán)神經(jīng)網(wǎng)絡(luò)種具有時(shí)間序列特性的神經(jīng)網(wǎng)絡(luò),能
    的頭像 發(fā)表于 07-05 09:52 ?435次閱讀

    遞歸神經(jīng)網(wǎng)絡(luò)是循環(huán)神經(jīng)網(wǎng)絡(luò)

    遞歸神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,簡稱RNN)和循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,簡稱RNN)實(shí)際上是同個(gè)概念,只是不同的翻譯方式
    的頭像 發(fā)表于 07-04 14:54 ?549次閱讀

    循環(huán)神經(jīng)網(wǎng)絡(luò)和卷積神經(jīng)網(wǎng)絡(luò)的區(qū)別

    結(jié)構(gòu)。它們在處理不同類型的數(shù)據(jù)和解決不同問題時(shí)具有各自的優(yōu)勢和特點(diǎn)。本文將從多個(gè)方面比較循環(huán)神經(jīng)網(wǎng)絡(luò)和卷積神經(jīng)網(wǎng)絡(luò)的區(qū)別。 基本概念 循環(huán)神經(jīng)網(wǎng)絡(luò)種具有循環(huán)連接的
    的頭像 發(fā)表于 07-04 14:24 ?807次閱讀

    人工智能神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)是什么

    人工智能神經(jīng)網(wǎng)絡(luò)種模擬人腦神經(jīng)網(wǎng)絡(luò)的計(jì)算模型,結(jié)構(gòu)和功能非常復(fù)雜。 引言 人工智能神經(jīng)網(wǎng)絡(luò)
    的頭像 發(fā)表于 07-04 09:37 ?353次閱讀

    反向傳播神經(jīng)網(wǎng)絡(luò)和bp神經(jīng)網(wǎng)絡(luò)的區(qū)別

    反向傳播神經(jīng)網(wǎng)絡(luò)(Backpropagation Neural Network,簡稱BP神經(jīng)網(wǎng)絡(luò))是種多層前饋神經(jīng)網(wǎng)絡(luò),它通過反向傳播算法來調(diào)整網(wǎng)
    的頭像 發(fā)表于 07-03 11:00 ?525次閱讀

    bp神經(jīng)網(wǎng)絡(luò)和卷積神經(jīng)網(wǎng)絡(luò)區(qū)別是什么

    結(jié)構(gòu)、原理、應(yīng)用場景等方面都存在定的差異。以下是對這兩種神經(jīng)網(wǎng)絡(luò)的比較: 基本結(jié)構(gòu) BP神經(jīng)網(wǎng)絡(luò)種多層前饋神經(jīng)網(wǎng)絡(luò),由輸入層、隱藏層和
    的頭像 發(fā)表于 07-03 10:12 ?742次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)的原理與實(shí)現(xiàn)

    1.卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,簡稱CNN)是種深度學(xué)習(xí)模型,廣泛應(yīng)用于圖像識別、視頻分析、自然語言處理等領(lǐng)域。 卷積神經(jīng)網(wǎng)絡(luò)種前饋
    的頭像 發(fā)表于 07-02 16:47 ?392次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)的原理是什么

    卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,簡稱CNN)是種深度學(xué)習(xí)模型,廣泛應(yīng)用于圖像識別、語音識別、自然語言處理等領(lǐng)域。本文將詳細(xì)介紹卷積神經(jīng)網(wǎng)絡(luò)的原理,包括
    的頭像 發(fā)表于 07-02 14:44 ?444次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)和bp神經(jīng)網(wǎng)絡(luò)的區(qū)別

    不同的神經(jīng)網(wǎng)絡(luò)模型,它們在結(jié)構(gòu)、原理、應(yīng)用等方面都存在定的差異。本文將從多個(gè)方面對這兩種神經(jīng)網(wǎng)絡(luò)進(jìn)行詳細(xì)的比較和分析。 引言 神經(jīng)網(wǎng)絡(luò)
    的頭像 發(fā)表于 07-02 14:24 ?1823次閱讀

    西門子推出Catapult AI NN:重塑神經(jīng)網(wǎng)絡(luò)加速器設(shè)計(jì)的未來

    的需求,西門子數(shù)字化工業(yè)軟件日前推出了款名為Catapult AI NN的創(chuàng)新軟件,旨在幫助神經(jīng)網(wǎng)絡(luò)加速器在專用集成電路(ASIC)和芯片級系統(tǒng)(SoC)上實(shí)現(xiàn)更高效的高層次綜合(HLS)。
    的頭像 發(fā)表于 06-19 16:40 ?569次閱讀

    西門子推出Catapult AI NN軟件,賦能神經(jīng)網(wǎng)絡(luò)加速器設(shè)計(jì)

    西門子數(shù)字化工業(yè)軟件近日發(fā)布了Catapult AI NN軟件,這款軟件在神經(jīng)網(wǎng)絡(luò)加速器設(shè)計(jì)領(lǐng)域邁出了重要步。Catapult AI NN軟件專注于在專用集成電路(ASIC)和芯片級
    的頭像 發(fā)表于 06-19 11:27 ?752次閱讀

    Arm發(fā)布新一代Ethos-U AI加速器 Arm旨在瞄準(zhǔn)國產(chǎn)CPU市場

    Arm發(fā)布新一代Ethos-U AI加速器確實(shí)在業(yè)界引起了廣泛關(guān)注。
    的頭像 發(fā)表于 04-18 15:59 ?672次閱讀

    NVIDIA將在今年第二季度發(fā)布Blackwell架構(gòu)的新一代GPU加速器“B100”

    根據(jù)各方信息和路線圖,NVIDIA預(yù)計(jì)會在今年第二季度發(fā)布Blackwell架構(gòu)的新一代GPU加速器“B100”。
    的頭像 發(fā)表于 03-04 09:33 ?1176次閱讀
    NVIDIA將在今年第二季度<b class='flag-5'>發(fā)布</b>Blackwell架構(gòu)的<b class='flag-5'>新一代</b>GPU<b class='flag-5'>加速器</b>“B100”