人工智能的三大核心,是深度學(xué)習(xí)算法、數(shù)據(jù)和算力。在這三大要素中,大數(shù)據(jù)的獲取和處理難度在下降,算法也在深度學(xué)習(xí)模型的基礎(chǔ)上不斷優(yōu)化,而統(tǒng)一協(xié)調(diào)數(shù)據(jù)和算法的AI芯片能否獲得大的飛躍,成為市場關(guān)注的焦點。
根據(jù)Gartner數(shù)據(jù),全球各大芯片公司、互聯(lián)網(wǎng)巨頭和創(chuàng)業(yè)企業(yè)都在AI芯片市場競爭,預(yù)計到2023年全球市場規(guī)模將達到323億美元,其中數(shù)據(jù)中心、個人終端和物聯(lián)網(wǎng)芯片是增長重點。
深度學(xué)習(xí)算法對芯片性能需求主要為:大數(shù)據(jù)在計算和存儲單元之間的高速通信需求;專業(yè)計算能力需求,深度學(xué)習(xí)算法中有大量卷積、殘差網(wǎng)絡(luò)、全連接等特殊計算需要處理,需要需要提升運算速度,降低功耗;大數(shù)據(jù)對芯片提出的新要求,非結(jié)構(gòu)化數(shù)據(jù)增多,對傳統(tǒng)芯片結(jié)構(gòu)造成較大壓力。
通用CPU在深度學(xué)習(xí)中可用但效率低。比如在圖像處理領(lǐng)域,主要用到的是CNN(卷積神經(jīng)網(wǎng)絡(luò)),在自然語言識別、語音處理等領(lǐng)域,主要用到的是RNN(循環(huán)神經(jīng)網(wǎng)絡(luò)),雖然這兩種算法模型有較大差別,但本質(zhì)都是向量和矩陣運算。
正因為CPU在AI計算上的弱點,給了可以實現(xiàn)海量并行計算且能夠計算加速的AI芯片開拓了市場空間。AI芯片,包括基于傳統(tǒng)架構(gòu)的GPU、FPGA以及ASIC,也包括類腦芯片和可重構(gòu)AI芯片等。
AI芯片還可以按照部署位置劃分為云端芯片和邊緣端芯片。云端芯片部署位置包括公有云、私有云、混合云等,主要用于處理大數(shù)據(jù)和大規(guī)模運算,還能夠支持語音、圖片、視頻等非結(jié)構(gòu)化應(yīng)用的計算和傳輸,可用多個處理器并行完成相關(guān)任務(wù);邊緣端AI芯片主要應(yīng)用于嵌入式、移動終端等,如攝像頭、智能手機、邊緣服務(wù)器、工控設(shè)備,此類芯片一般體系小、耗電低,性能要求略低,一般只具備少量AI能力。
同時AI芯片按照任務(wù)還可以劃分為訓(xùn)練芯片和推理芯片。訓(xùn)練芯片通過大量標記過的數(shù)據(jù)在平臺上進行“學(xué)習(xí)”,并形成具備特定功能的神經(jīng)網(wǎng)絡(luò)模型;推理則是利用已經(jīng)訓(xùn)練好的模型輸入新數(shù)據(jù)通過計算得到各種結(jié)論。訓(xùn)練芯片對算力、精度要求高且需要一定的通用性,推理芯片更注重綜合能力,包括算力能耗、時延、成本等。
訓(xùn)練芯片由于對算力的要求,只適合在云端部署,多采用“CPU+加速芯片”,加速芯片可以是CPU、FPGA或者ASIC。AI訓(xùn)練芯片市場集中度高,英偉達和谷歌領(lǐng)先,英特爾和AMD正在發(fā)力。推理芯片在云端和終端都可以進行,門檻低,市場參與者多,比如英偉達、谷歌、賽靈思、寒武紀等。終端推理芯片市場較為分散,參與者有英偉達、英特爾、ARM、高通、寒武紀、地平線、云知聲等。
GPU、FPGA、ASIC各有特點和優(yōu)勢。GPU是由大量核心組成的大規(guī)模并行計算架構(gòu),專為多任務(wù)并行運算處理設(shè)計的芯片。以英偉達的GPUTITANX為例,其在深度學(xué)習(xí)中所需的訓(xùn)練時間是CPU的1/10以下,但缺點是功耗高。
FPGA靈活性最高,可根據(jù)用戶需求,用硬件描述語言對FPGA的硬件電路進行設(shè)計。同時FPGA具有算力強、功耗優(yōu)勢明顯、成本可控等優(yōu)勢,但是技術(shù)難度大,目前國內(nèi)公司差距明顯?;诖耍現(xiàn)PGA被廣泛應(yīng)用在AI云端和終端推理,亞馬遜、微軟都推出了基于FPGA的云計算服務(wù),國內(nèi)包括騰訊云、阿里云和百度大腦也有所布局,但差距較大。從市場上看,F(xiàn)PGA被賽靈思、英特爾、Lattice和Microsemi壟斷,其中賽靈思和英特爾市場份額超過90%。
ASIC是對特定用戶需求設(shè)計的定制芯片,性能強、體積小、功耗低、可靠性高。ASIC是一種技術(shù)方案,產(chǎn)品和功能可以是多樣的。越來越多的公司開始采用ASIC芯片進行深度學(xué)習(xí)算法加速,比如Google的TPU。但是ASIC研發(fā)周期長,商業(yè)應(yīng)用風(fēng)險大。國內(nèi)寒武紀開發(fā)的Cambricon系列處理器就在此列中,華為海思的麒麟980處理器搭載的NPU就是寒武紀的處理器IP。
整體來看,短期GPU仍然主導(dǎo)AI芯片市場,GPGA使用更為廣泛。長期來看GPU、FPGA和ASIC三大技術(shù)路線將并存。GPU主要方向是高級復(fù)雜算法和通用型人工智能平臺,F(xiàn)PGA在垂直領(lǐng)域有較大空間,ASIC長遠來看適用于面向各種場景的定制化需求。
目前國內(nèi)人工智能芯片行業(yè)發(fā)展處于起步階段,在GPU和DSP設(shè)計上處于追趕狀態(tài)。但全球芯片生態(tài)上并沒有形成全封閉式壟斷,國內(nèi)芯片廠商尤其是專用芯片設(shè)計廠商,還是存在彎道超車的機會,其主打的應(yīng)用場景為云端數(shù)據(jù)中心、自動駕駛、智能家居和機器人領(lǐng)域。隨著5G和物聯(lián)網(wǎng)等應(yīng)用的成熟落地,相關(guān)芯片產(chǎn)品的市場空間將進一步擴大。
責(zé)任編輯人:CC
-
人工智能
+關(guān)注
關(guān)注
1789文章
46368瀏覽量
236548 -
人工智能芯片
+關(guān)注
關(guān)注
1文章
119瀏覽量
28942
發(fā)布評論請先 登錄
相關(guān)推薦
評論