0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

從制程、架構(gòu)、應(yīng)用入手,深入分析這十款AI處理器

GReq_mcu168 ? 來源:互聯(lián)網(wǎng) ? 作者:佚名 ? 2018-01-19 08:59 ? 次閱讀

寒武紀Cambricon-1A:核心的核心

寒武紀科技的Cambricon-1A是一款深度學習專用處理器芯片(NPU),其高性能硬件架構(gòu)及軟件支持Caffe、Tensorflow、MXnet等主流AI開發(fā)平臺。據(jù)稱這是國際上首個成功商用的深度學習處理器IP產(chǎn)品,可廣泛應(yīng)用于計算機視覺、語音識別、自然語言處理等智能處理關(guān)鍵領(lǐng)域。專注于人工智能產(chǎn)業(yè)發(fā)展的美國權(quán)威媒體CB Insights最新發(fā)布全球AI 100榜單,寒武紀以其深度學習專用處理器入選,是中國大陸唯一一家上榜的AI硬件創(chuàng)業(yè)公司。

寒武紀目前有三條產(chǎn)品線:首先是智能終端處理器IP授權(quán),智能IP指令集可授權(quán)集成到手機、安防、可穿戴設(shè)備等終端芯片中,客戶包括國內(nèi)頂尖SoC廠商,現(xiàn)已開始投入市場。其次,在智能云服務(wù)器芯片領(lǐng)域,作為PCIE加速卡插在云服務(wù)器上,客戶主要是國內(nèi)的知名服務(wù)器廠商。第三,家用智能服務(wù)機器人芯片:從智能玩具、智能助手入手,使服務(wù)機器人獨立具備看聽說的能力??蛻羰歉黝愊掠螜C器人廠商,產(chǎn)品的推出將比智能云服務(wù)器芯片更晚一些。

華為麒麟970:號稱全球首款AI處理器

華為聲稱麒麟970是全球第一款人工智能系統(tǒng)級芯片,Kirin 970選擇了異構(gòu)計算架構(gòu)來大幅提升AI的運算能力,內(nèi)置獨立的神經(jīng)網(wǎng)絡(luò)處理單元。據(jù)說這種專用硬件處理單元源自寒武紀NPU IP授權(quán),專門用于機器學習和一般的AI應(yīng)用程序。

Kirin970采用臺積電10ns芯片組制程技術(shù)(耗電量減少20%,體積減少 40%),主要規(guī)格如下:8 核心 CPU(時脈最高達2.4GHz),新世代12核心GPU(Mali G72MP12)、Kirin NPU(1.92T FP16 OPS)、Image DSP(512bit SIMD)、Dual Camera ISP(具備臉部、動作偵測)、HiFi Audio(32bit/384k)、UFS 2.1、安全引擎(inSE&TEE)、全球通用4.5G數(shù)據(jù)機(1.2Gbps@LTE Cat 18)、4K影像(HDR10)、LPDDR 4X、i7感應(yīng)處理器。

華為宣布將在美國上市的Huawei Mate 10 Pro會搭載麒麟970芯片,另外華為榮耀(Honor V10)也會采用。相較之下,高通驍龍845也把大部分焦點集中在AI,而普及率無疑會比麒麟970高,驍龍845支持眾多Android 旗艦智能手機,當中包括三星、Sony、LG 和小米的高端產(chǎn)品。

與華為麒麟970芯片不同的是,高通是在通用平臺內(nèi)做內(nèi)核優(yōu)化,它沒有獨立的神經(jīng)網(wǎng)絡(luò)引擎單元,而是更彈性的機器學習架構(gòu),分布在CPU、GPU、DPS等每個單元上,從而可以針對不同移動終端彈性調(diào)用各個處理單元。

對于兩者方向的不同,高通方面認為集成更加有效。但華為認為,鑒于手機對能耗的要求,獨立NPU處理單元未來一定是手機處理器的必由之路,從現(xiàn)在看只有蘋果和華為做了獨立的NPU。

最近從微博流出Kirin 970與Snapdragon 845跑分對比,聲稱前者跑分比后者還要高出7%,但麒麟970、驍龍845的差異其實不大,且網(wǎng)絡(luò)還只秀出幾個獨立測試結(jié)果,并非完整跑分的平均值,顯示差距甚至可能比表面看來還小。同樣地,就算處理器的跑分很高,實地運作的績效還是不一定,尤其在差距如此微小的情況下。話雖如此,外泄的跑分結(jié)果依舊暗示華為旗艦處理器的運算能力有可能很快會追上高通。

高通驍龍845:今年將在高端Android手機中廣泛應(yīng)用

驍龍845采用最新的八核Kryo 385定制架構(gòu),性能比驍龍835的Kryo 280提升25%,三星第二代10nm工藝制程,主頻最高為2.8GHz;其次驍龍845集成的Adreno 630 GPU性能比驍龍835的Adreno 540提升30%,功耗降低30%。另外,驍龍845集成了第二代千兆級LTE Modem——X20調(diào)制解調(diào)器,比驍龍835的X16速度提升20%,其集成的全新Hexagon 685 DSP與Spectra 280 ISP全面提升拍照功能。

從微博發(fā)布的驍龍845和麒麟970參數(shù)規(guī)格對比看出,驍龍845核心發(fā)生巨大升級,采用全新高端大核心A75與A53組合,GPU升級為Adreno 630,三星10nm LPE制程工藝。而麒麟970繼續(xù)采用A73核心與A53核心,GPU型號未知,同樣采用10nm工藝,由臺積電代工。

三星Exynos 9810:蘋果A11的最強對手?

三星Exynos9810處理器采用其第三代自研M3架構(gòu),擁有4個2.9GHz的M3大核和4個1.9GHz的A55小核,依然是10nm(FinFET)的制程工藝。10nm也是目前蘋果A11、驍龍845和麒麟970都在采用的制程工藝。

GPU方面,Exynos9810采用最新的Mali-G72,采用了18顆核心(MP18),預計工作頻率在700MHz。Mali-G72是ARM去年發(fā)布的基于Bifrost架構(gòu)的圖形處理器,在更小面積與更低功耗的基礎(chǔ)上,提供更強大的效能。采用Mali-G72的設(shè)備,整體圖形性能是前一代的1.4倍。能效提升25%,芯片面積效能提升20%,機器學習效率提升17%。

在人工智能方面,支持人臉檢測的Bixby變得更加聰明?;谏窠?jīng)網(wǎng)絡(luò)的深度學習,新的處理器能夠通過快速圖像搜索和分類精確識別照片中的人或物,以進行快速圖像搜索或分類,或者通過深度感測,在3D中掃描用戶的臉部以進行混合式人臉檢測。通過利用硬件和軟件,混合式人臉檢測功能可以實現(xiàn)真實的人臉跟蹤檢測,從而在使用人臉進行設(shè)備解鎖時候更加安全。

英偉達DRIVE Xavier:為自動駕駛提供強勁驅(qū)動力

在CES會展上搶盡風頭的英偉達展示了DRIVE Xavier,這個AI芯片由一個特別定制的8核CPU、一個全新的512核Volta GPU、一個全新深度學習加速器、全新計算機視覺加速器、以及全新8K HDR視頻處理器而打造。DRIVE Xavier可以提供更高的處理能力,運行功率更低,每秒可運行30 萬億次計算,功耗卻僅為30瓦,能效比上一代架構(gòu)高出15倍。TensorCore、視頻識別和流處理、物體定位、路徑規(guī)劃等所有AI計算任務(wù)都能在上面飛快跑起來,據(jù)稱首批樣品2018年第一季度就可以交付給客戶。英偉達CEO黃仁勛表示,中國市場是全球最大市場,所有的系統(tǒng)在設(shè)計時都考慮到了本地化和中國客戶的需求,比如百度的每輛自動駕駛車輛都搭載了Drive Xavier。

Intel Loihi:挑戰(zhàn)神經(jīng)擬態(tài)計算難題

為了抵御NVIDIA在人工智能領(lǐng)域的強勢進攻,Intel先后收購了FPGA芯片巨頭Altera、AI初創(chuàng)公司Nervana Systems,以及以色列自動駕駛芯片公司Mobileye等。Intel在CES上向各界展示了其自主學習神經(jīng)擬態(tài)芯片“Loihi”,這是在收購以上技術(shù)公司并匯集眾多研究成果后推出的神經(jīng)擬態(tài)芯片。

AI芯片可以分為兩類,一類為人工神經(jīng)網(wǎng)絡(luò),而另一類為神經(jīng)擬態(tài)計算,理論上來說神經(jīng)擬態(tài)計算效能更好,但芯片開發(fā)難度更大,Intel的Loihi采用神經(jīng)擬態(tài)計算這條更難的道路可以看出它希望逆襲NVIDIA的野心。

Loihi采用了架構(gòu)到芯片建模、異步設(shè)計流程以及基于FPGA仿真的圓形算法驗證,具有非常節(jié)能的特點,擁有128個核+3個低功耗X86核、可編程的學習規(guī)則等特點。

Intel介紹Loihi芯片擁有自主學習功能,并且可以利用數(shù)據(jù)來學習和推斷,隨著時間延長能變得更加智能,可以應(yīng)用于汽車和工業(yè)生產(chǎn)等領(lǐng)域,不過說了這么多優(yōu)點,這一切還需要在現(xiàn)實中應(yīng)用以證明它是否具有這些能力,這恰恰是Intel相較NVIDIA的弱點,因為當前在全球的神經(jīng)網(wǎng)絡(luò)訓練系統(tǒng)大多數(shù)都采用NVIDIA的芯片,Intel需要加大力度推廣以在市場份額上趕上NVIDIA。

瑞芯微RK3399Pro:首次采用CPU+GPU+NPU硬件結(jié)構(gòu)設(shè)計

瑞芯微電子Rockchip)在CES上發(fā)布旗下首款性能超強的AI處理器RK3399Pro,為人工智能領(lǐng)域提供一站式Turnkey解決方案,其NPU運算性能高達2.4TOPs,具高性能、低功耗、開發(fā)易等優(yōu)勢。

RK3399Pro AI芯片采用big.LITTLE大小核CPU架構(gòu),雙核Cortex-A72+四核Cortex-A53,在整體性能、功耗方面具技術(shù)領(lǐng)先性;四核ARM高端GPU Mali-T860,集成更多帶寬壓縮技術(shù),整體性能優(yōu)異。RK3399Pro具備極強的AI運算性能,是瑞芯微首次采用CPU+GPU+NPU硬件結(jié)構(gòu)設(shè)計的AI芯片,其集成的NPU融合了瑞芯微在機器視覺、語音處理、深度學習等領(lǐng)域的多年經(jīng)驗。相較傳統(tǒng)芯片,典型深度神經(jīng)網(wǎng)絡(luò)Inception V3、ResNet34、VGG16等模型在RK3399Pro芯片上的運行效果表現(xiàn)出眾。

聯(lián)發(fā)科NeuroPilot:廣泛用于消費性產(chǎn)品

聯(lián)發(fā)科在CES發(fā)布了NeuroPilot人工智能(AI)平臺,主攻智能手機、智能家庭、自駕車的終端邊緣運算。聯(lián)發(fā)科表示,目前1年約有15億臺消費電子產(chǎn)品采用聯(lián)發(fā)科芯片,2018年將整合AI處理器與NeuroPilot SDK軟件開發(fā)套件技術(shù),將AI帶入廣泛的消費性產(chǎn)品中。

聯(lián)發(fā)科已在2018年新款Helio手機芯片中加入AI運算核心,現(xiàn)在已為智能語音助理、智能電視、自駕車打造AI解決方案,并在CES中展示具體跨平臺應(yīng)用,包括Amazon Echo智能語音助理、Android O智能電視、BelkinWemo智能型插座、以及聯(lián)發(fā)科全網(wǎng)覆蓋家庭路由器等。

華夏芯“北極星”:完全自主知識產(chǎn)權(quán)的AI芯片平臺

華夏芯發(fā)布全自主IP的AI芯片平臺——“北極星”,這是國內(nèi)首次發(fā)布的CPU、DSP和AI全部具有自主知識產(chǎn)權(quán)的平臺型人工智能芯片?!氨睒O星”是一款面向多種應(yīng)用的SoC芯片,不但有負責神經(jīng)網(wǎng)絡(luò)和深度學習的AI專用處理器,還集成了高性能的CPU/DSP,其能力可以延伸到多個產(chǎn)品領(lǐng)域,諸如智能輔助駕駛、智能安防監(jiān)控、機器人、計算機視覺、車載和商用雷達探測、語音識別等嵌入式人工智能應(yīng)用。此外,還能延伸到工業(yè)4.0、現(xiàn)場控制、邊緣計算、智能硬件、智慧家居等在內(nèi)的多個其它領(lǐng)域,是一款市場適應(yīng)性極強的異構(gòu)計算和人工智能平臺型芯片。

“北極星”可以在單芯片上采用編程擴展的方法實現(xiàn)復雜度很高的現(xiàn)場控制與決策、數(shù)字信號處理、圖像信號處理、基于神經(jīng)網(wǎng)絡(luò)的深度學習和特征提取、多線程并行計算等多種功能。“北極星”芯片采用臺積電28nm工藝制程,將于2018年上半年量產(chǎn)。

地平線“征程”和“旭日”:嵌入式人工智能視覺芯片

去年獲得Intel一億美元投資的地平線推出了征程(Journey)和旭日(Sunrise)兩款處理器,都屬于嵌入式人工智能視覺芯片,分別面向智能駕駛和智能攝像頭。

這兩款芯片性能可達到1Tops,實時處理1080P@30幀,每幀可同時對200個目標進行檢測、跟蹤、識別。典型功耗做到1.5W。兩款芯片采用關(guān)注模型(Attention Engine)+認知模型(Cognition Engine)的數(shù)據(jù)處理流模式。通過這一個組合算法,芯片的計算速度可以10倍以上。通過邊緣學習,模型可以不斷提升自己,錯誤率降低在50%以上。此外,兩款芯片利用彈性張量計算核,地平線人工智能處理器的乘法器利用率接近100%。

征程1.0處理器具備同時對形容、機動車、非機動車、車道線、交通標志牌、紅綠燈等多類目標進行精準實時檢測與識別的處理能力,可支持L2級別的輔助駕駛系統(tǒng)旭日1.0系列處理器集合了深度學習算法,支持在前段實現(xiàn)大規(guī)模人臉檢測跟蹤、視頻結(jié)構(gòu)化,可應(yīng)用于智能城市、智能商業(yè)等場景。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    29359

    瀏覽量

    267635
  • 英偉達
    +關(guān)注

    關(guān)注

    22

    文章

    3680

    瀏覽量

    90475
  • 寒武紀
    +關(guān)注

    關(guān)注

    11

    文章

    185

    瀏覽量

    73835

原文標題:寒武紀/華為/高通等十款AI處理器對比,誰更強?

文章出處:【微信號:mcu168,微信公眾號:硬件攻城獅】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    ARM處理器和CPU有什么區(qū)別

    ARM處理器和CPU(中央處理器)之間的關(guān)系及區(qū)別,可以多個維度進行深入探討。首先,需要明確的是,ARM處理器并非一種獨立的CPU類型,而
    的頭像 發(fā)表于 09-10 11:24 ?559次閱讀

    處理器的指令集架構(gòu)介紹

    處理器的指令集架構(gòu)(Instruction Set Architecture,ISA)是計算機體系結(jié)構(gòu)中至關(guān)重要的部分,它定義了微處理器能夠執(zhí)行的操作和指令的集合,以及這些指令如何被組織、存儲
    的頭像 發(fā)表于 08-22 10:53 ?582次閱讀

    國產(chǎn)新型AI PC處理器亮相上海

    處理器
    北京中科同志科技股份有限公司
    發(fā)布于 :2024年08月01日 09:21:01

    聯(lián)發(fā)科或?qū)⑴c英偉達開發(fā)Arm架構(gòu)AI PC處理器

    據(jù)悉,聯(lián)發(fā)科正與英偉達合作,共同開發(fā)基于Arm架構(gòu)AI PC處理器。這款新芯片預計將在第三季度完成設(shè)計定案,第四季度進入驗證階段。
    的頭像 發(fā)表于 05-13 10:18 ?474次閱讀

    英特爾酷睿Ultra處理器突破500個AI模型優(yōu)化

    英特爾在最新推出的英特爾? 酷睿? Ultra處理器上宣布,超過500AI模型已得到優(yōu)化運行。這款處理器無疑是市場上領(lǐng)先的AI PC
    的頭像 發(fā)表于 05-09 11:18 ?670次閱讀

    深入分析運放的作用

    深入分析了4-20mA的運放選型、A/D基準電壓對測量精度影響等問題。
    的頭像 發(fā)表于 01-15 13:47 ?3253次閱讀
    <b class='flag-5'>深入分析</b>運放的作用

    英特爾新處理器,掀AI PC戰(zhàn)火

    隨著ai時代的到來,英特爾正在構(gòu)想新的酷睿Ultra處理器(代號Meteor Lake),這是英特爾的第一個基于npu的處理器,旨在在pc上應(yīng)用ai加速和邊緣推理。meterlake采
    的頭像 發(fā)表于 12-11 11:26 ?871次閱讀

    現(xiàn)代處理器的主要指令集架構(gòu)

    ? ?現(xiàn)代處理器的主要指令集架構(gòu)(ISA)包括:x86指令集架構(gòu)、RISC指令集架構(gòu)
    的頭像 發(fā)表于 12-11 09:55 ?3771次閱讀
    現(xiàn)代<b class='flag-5'>處理器</b>的主要指令集<b class='flag-5'>架構(gòu)</b>

    瑞薩推出首基于RISC-V指令集架構(gòu)處理器內(nèi)核

    嵌入式硬件專家瑞薩電子宣布推出首基于免費開放的 RISC-V 指令集架構(gòu) (ISA) 的完全自主研發(fā)的處理器內(nèi)核。
    的頭像 發(fā)表于 12-01 17:28 ?1356次閱讀
    瑞薩推出首<b class='flag-5'>款</b>基于RISC-V指令集<b class='flag-5'>架構(gòu)</b>的<b class='flag-5'>處理器</b>內(nèi)核

    簡單認識MIPS架構(gòu)處理器

    無互鎖流水級微處理器 (Microprocessors without Interlocked Pipeline Stages,MIPS) 是流行的 RISC 架構(gòu)處理器之一。其原理是盡量利用軟件
    的頭像 發(fā)表于 11-29 09:14 ?1611次閱讀
    簡單認識MIPS<b class='flag-5'>架構(gòu)</b><b class='flag-5'>處理器</b>

    簡單認識POWER系列架構(gòu)處理器

    的 POWER ( Performance Optimization With Enhanced RISC) 架構(gòu)的原型機。1990年 IBM 推出了第一代的 POWER1架構(gòu)處理器,隨后 1993 年
    的頭像 發(fā)表于 11-28 09:21 ?1985次閱讀
    簡單認識POWER系列<b class='flag-5'>架構(gòu)</b><b class='flag-5'>處理器</b>

    簡單認識IA-64架構(gòu)處理器

    IA- 64 架構(gòu)處理器(IA - 64 Processors )最早為安騰架構(gòu) (Itanium Architecture)處理器的縮寫,支持64 位
    的頭像 發(fā)表于 11-27 09:33 ?1148次閱讀

    AMD EPYC 9554處理器參數(shù)分析

    AMD EPYC 9554處理器?是第四代AMD EPYC處理器家族中的主流型號,這是一兼具頻率與核心數(shù)量的處理器。它采用5nm先進制程,
    發(fā)表于 11-20 16:36 ?1450次閱讀
    AMD EPYC 9554<b class='flag-5'>處理器</b>參數(shù)<b class='flag-5'>分析</b>

    深入分析:大帶寬競爭形勢下同軸接入網(wǎng)的價值

    電子發(fā)燒友網(wǎng)站提供《深入分析:大帶寬競爭形勢下同軸接入網(wǎng)的價值.pdf》資料免費下載
    發(fā)表于 11-10 11:26 ?0次下載
    <b class='flag-5'>深入分析</b>:大帶寬競爭形勢下同軸接入網(wǎng)的價值

    全球首!蘋果發(fā)布3納米制程處理器M3系列

    來源:滿天芯 編輯:感知芯視界 系列芯片,為全球首發(fā)以3納米生產(chǎn)的計算機中央處理器(CPU),業(yè)界分析由臺積電獨家代工,看好蘋果新品有望掀起換機潮,推升臺積電先進制程訂單動能持續(xù)強勁。 業(yè)界
    的頭像 發(fā)表于 11-02 09:32 ?571次閱讀