0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AI算法在FPGA芯片上的創(chuàng)新應(yīng)用

電子工程師 ? 來源:ZF ? 2019-04-21 09:20 ? 次閱讀

碾壓與崛起

AI算法的崛起并非一帆風(fēng)順的,現(xiàn)在的主流的NN類的卷積神經(jīng)網(wǎng)絡(luò)已經(jīng)是第二波浪潮了,早在上個世紀(jì)80年代,源于仿生學(xué),后又發(fā)展于概率學(xué)的早期AI算法已經(jīng)取得了重大的進(jìn)展,到1986年Rumelhart等人提出多層網(wǎng)絡(luò)的反向傳播算法(BP算法,這是AI算法可進(jìn)行數(shù)據(jù)訓(xùn)練并能收斂的基礎(chǔ))后,第一波AI算法以“連接主義”的旗幟高高舉起。

不幸的是,旗幟沒舉多久就開始偃旗息鼓,讓位于基于統(tǒng)計學(xué)的算法,直到2006年,Hinton提出了“深度信念網(wǎng)絡(luò)”的概念,從此,AI算法從“連接主義”變成“深度神經(jīng)網(wǎng)絡(luò)”再次華麗登場。

第一波AI算法之所以會快速落寞,不在于算法不夠精美,是因為當(dāng)時的cpu不夠強(qiáng)大,算力完全無法適配當(dāng)時的算法需求.第二次AI算法的崛起也并非算法足夠驚艷,恰恰是證明了算力的崛起。

而且這算力的提供者并不是CPU,這種基于調(diào)度和內(nèi)存交換的方式難以支持如此強(qiáng)大的AI算力缺口。

與此同時,基于異構(gòu)計算的ASIC/FPGA/GPU也在快速崛起,其計算性能完全碾壓CPU,有效的補(bǔ)充AI算力的缺口。

其中GPU迅速發(fā)展,成為目前AI崛起之路的最大收益者,然而GPU最初的設(shè)計目的不是針對AI算法而是處理圖形圖像的,因為圖像上每個像素點處理的過程和方式都十分相似,所以GPU的構(gòu)成相對簡單,有數(shù)量眾多的計算單元和用于并行的流水線,正是這種單指令流多數(shù)據(jù)流的設(shè)計模式,特別適合處理大量的類型統(tǒng)一的數(shù)據(jù)。

這也是在用GPU處理AI算法時,batchsize不能太低的原因。而在其他方面,如面積/功耗/能耗比方面,GPU也便成了弱勢,相比較而言,ASIC芯片從一開始便是為AI而生,能效比高,不會有冗余,功耗低,適合算法穩(wěn)定且要求的應(yīng)用。

其缺點也是硬件為算法而定制,導(dǎo)致其只能運行特定的算法,當(dāng)然,能做出通用AI算法的ASIC芯片是業(yè)界的終極目標(biāo)。

而同時,作為ASIC的共軛形式存在的FPGA越來越受重視,F(xiàn)PGA能效比高,可編程邏輯,計算效率高,F(xiàn)PGA 同時擁有控制流并行和數(shù)據(jù)并行,是天生適合異構(gòu)計算的芯片,目前開發(fā)FPGA應(yīng)用方面還有很多潛能可挖。

通用Or靈活

一個基本的認(rèn)知是ASIC雖然高效,但只能走專業(yè)化定制化的部分,ASIC制作成本很高,而算法一直在持續(xù)更新,如何解決這個矛盾呢?

是否可以做一個通用的ASIC來解決算力提升和靈活性的問題?寒武紀(jì)的NPU和google的TPU給出了答案,兩者的實現(xiàn)雖然不同,但思路是一致的。

即:既然NN算法可以拆分成不同的算子,設(shè)計的硬件建模應(yīng)該全部支持這些算子從而解決通用性問題,并建立相應(yīng)的指令集來解決不同算子的組合,來解決靈活性的問題。當(dāng)然,核心模塊還是圍繞計算量最大的模塊卷積進(jìn)行的。那么,在實現(xiàn)方式上它們又有哪些共同點和不足呢?

寒武紀(jì)dadiannao:

圖1 (dadiannao)

上圖的硬件建模就是在模仿神經(jīng)網(wǎng)絡(luò)部分的數(shù)據(jù)流向,NFU(Neural Functional Units)分三部分順序展開,NFU-1是乘法單元,NFU-2是加法數(shù)樹,處理filter內(nèi)部或通道累加的問題,NFU-3是激活單元。

從模型上不難看出,這里的核心處理卷積的單元是在數(shù)據(jù)流方向上的一維展開進(jìn)行計算的。

一維度展開會帶來兩個問題,一個是多扇出(fan-out)的問題,如果想更大限度的利用內(nèi)部數(shù)據(jù)帶寬優(yōu)勢以及多用乘法器模塊,一個data需要同時廣播給多個計算單元,這會導(dǎo)致多扇出的問題,要保證多個模塊同時到達(dá),則頻率就不能提的太高。

另外一個問題就是為了保證乘法器都能充分工作,需對filter的相關(guān)參數(shù)進(jìn)行限制.以DianNao為例,一個PE中的16個mul是同時計算的,那么卷積層中的kernel、channel、windows的長和寬都會對計算的效率造成影響,如channel最好是16或16的倍數(shù),否則就會造成計算資源的浪費.

相比較而言,Google的TPU采用脈動矩陣的方式,巧妙的避開了對filter敏感的問題,TPU的脈動矩陣是面向數(shù)據(jù)流方向的二維結(jié)構(gòu),在處理卷積乘加這塊有很強(qiáng)的優(yōu)勢。

理論上可以支持任何形式的windows、kernel和channel這種設(shè)計使得TPU有更強(qiáng)的靈活性和高效性。

TPU:

圖2 (TPU)

然而,有得必有失。脈動矩陣中處理卷積時優(yōu)勢明顯,但在處理非卷積類算子方面則未必高效。

比如在fastRcnn中的要用到排序算法proposal層,又如在多網(wǎng)融合的過程中會經(jīng)常被使用 interp層(雙線性插值)。

其中,排序算法在基因里是反asic的(區(qū)塊鏈中的零幣就是以排序為主的算法,主要用于反asic的功能)。類似這種非卷積算法因子則會導(dǎo)致脈動矩陣的功能大大降低,正是因為硬件的固定設(shè)置所限制。

ASIC 在走一個統(tǒng)一的路子,DADIANNAO和TPU都在用統(tǒng)一的模式來解決一切問題,然而現(xiàn)實是很骨感的,有兩個基本點是ASIC中無法完美解決的,一個就是AI算法在不同的探索和更改期。

目前尚未突破其中的黑盒特性,而支持AI算法優(yōu)化的強(qiáng)有力的基礎(chǔ)理論遲遲沒有發(fā)現(xiàn),這個時期就好比科學(xué)歷史上人們只知道電的存在而沒有電磁原理支撐是一個道理,說明AI算法的研究應(yīng)處于發(fā)展初期。

另外一點就是針對各個垂直領(lǐng)域,如無人機(jī)/自動駕駛/智能安防/無人零售的各種特殊的情況,每一個領(lǐng)域都對功耗/能耗比/性能/系統(tǒng)等等方面有不同的訴求,這些需求都有極強(qiáng)的定制性。如此,想要一顆ASIC芯片通吃天下的事情似乎是個無法求出的解。

找規(guī)律,找突破

如果ASIC無法解決算法通用性問題,那么更具有靈活配置性的芯片F(xiàn)PGA便越來越受到重視,F(xiàn)PGA的低延時,高可配置性的特點使其天然的在靈活性方面比ASIC略勝一籌。

那么FPGA能否滿足統(tǒng)一性呢?其實,在業(yè)界對FPGA的探索一直沒有停止,

AI算法在FPGA芯片上的創(chuàng)新應(yīng)用

圖3(三級壓縮流水線)

國內(nèi)FPGA的頭部公司深鑒科技一直研究深度壓縮技術(shù),并在FPGA上實現(xiàn)了基于深度壓縮技術(shù)的方案:深度壓縮技術(shù),其采用剪枝+量化+霍夫曼編碼,形成三級大流水,如圖3所示,實現(xiàn)高度壓縮權(quán)重占用的存儲空間。

其基本的思路就是,先對網(wǎng)絡(luò)本身做pruning來減少權(quán)重的個數(shù),同時通過訓(xùn)練來彌補(bǔ)由于減少權(quán)重而帶來的精度損失,然后經(jīng)過量化部分來減少權(quán)重的位寬,最后用霍夫曼編碼來壓縮權(quán)重。

總之目的只有一個,制作稀疏矩陣,然后利用稀疏矩陣的特性生成weight查找表,從而達(dá)到數(shù)據(jù)壓縮的目的。數(shù)據(jù)壓縮后再用FPGA實現(xiàn)會大大的降低開發(fā)難度和門檻。

而國內(nèi)另外一個頭部公司商湯科技的設(shè)計思想就是:通過大量減少卷積計算的乘法操作,降低運算復(fù)雜度,來提高運算速度,并在FPGA中順利實現(xiàn)。

不管是降低乘法操作,還是做網(wǎng)絡(luò)裁剪,其思路都是在修改算法的方式來適配FPGA的實現(xiàn)。

即先將FPGA的設(shè)計以固定的方式配置好,然后去修改算法來適配這種固定好的硬件設(shè)計。

這種方式的缺點也是顯而易見的,且不說固定的設(shè)計方式會遇到ASIC同樣的問題,單就修改網(wǎng)絡(luò)的部分可能會導(dǎo)致原有網(wǎng)絡(luò)的精度丟失的問題。

更為嚴(yán)重的是,這種設(shè)計方式會導(dǎo)致無法挖掘FPGA的全部潛力。

FPGA本身就是一個可編程系統(tǒng),能夠適配各種算法,為什么大家都在想辦法修改算法問題,而沒有想辦法去修改FPGA的內(nèi)部實現(xiàn)優(yōu)化,從而完美的使其適配不同神經(jīng)網(wǎng)絡(luò)算法呢?答案很簡單,用FPGA開發(fā)高難度的算法是一件很困難的事。

換一個語言,換一個世界

工欲善其事,必先利其器,現(xiàn)在主流的開發(fā)語言verilog HDL 是上個世紀(jì)80年代研究出來的,這在計算機(jī)界就好比是原始社會階段,而且這么多年來一直沒有更新過,對比高級語言的B->C->C++->java->python的不斷升級,它就好比一個古老的青銅寶劍,雖價值連城,但并不適用,而讓這個古老的語言來開發(fā)現(xiàn)在最先進(jìn)的AI算法,這便是一個現(xiàn)代版的愚翁移山的故事。

接著探尋問題的本質(zhì),verilog的缺陷:

A)無規(guī)則化,或規(guī)范化,或許這是一個社會工程的問題,因為用的人少,所以沒有形成統(tǒng)一的規(guī)范,編程方式過分自由,基本上是一千個人里有一千個哈姆雷特。

B)遇到復(fù)雜的邏輯,只能用狀態(tài)機(jī)。

C)同步信號建模時,對控制信號的掌控偏弱。

D)沒有圖形化界面,仿真工具都是看波形。

而改進(jìn)的方案正是解決這些問題,F(xiàn)PGA的開發(fā)就像是在玩樂高游戲,其實現(xiàn)過程就是在搭積木,其中的原語部分就是積木的原始器件,只是顆粒度有點小而已。

有沒有一種方式將原始器件進(jìn)行封裝,加強(qiáng)控制邏輯,同時將控制邏輯和數(shù)據(jù)流邏輯分開,用軟件的思想來封裝硬件,包含繼承,多態(tài),遞歸,然后以圖形化的形式展現(xiàn)出來,自帶仿真系統(tǒng),所見即所得,利用核心庫器件,真正做到用搭積木的方式來開發(fā)FPGA,這樣便能大大降低其開發(fā)門檻。

有一種很好用的開發(fā)工具ptero,是雪湖信息科技公司自主研發(fā)的開發(fā)FPGA的工具鏈,可以顛覆對FPGA開發(fā)的認(rèn)知,上文的種種特性都已經(jīng)在該工具中實現(xiàn),相當(dāng)于用全新的語言來開發(fā)FPGA,且完全是界面化的形式進(jìn)行開發(fā),所見即所得,極大的降低了開發(fā)門檻并提高了開發(fā)效率。

舉個例子,在實現(xiàn)AI算法的過程中,對數(shù)據(jù)流的嚴(yán)格控制是關(guān)鍵,如下圖所示,圖中的例子是一個卷積核是3×3的數(shù)據(jù)組裝功能實現(xiàn),一個數(shù)據(jù)產(chǎn)生器來模擬數(shù)據(jù)來源,補(bǔ)零模塊來進(jìn)行padding補(bǔ)零操作,地址譯碼器來處理數(shù)據(jù)組裝需要的不斷變化的bram地址,三行緩存模塊完成數(shù)據(jù)的組裝。

AI算法在FPGA芯片上的創(chuàng)新應(yīng)用

圖4 卷積里面的數(shù)據(jù)組裝模塊

圖4便是對上述流程的一個展示,從圖形化里面我們很容易理解設(shè)計思路,由于里面的用到的模塊都是在核心模塊封裝好。

所以,對開發(fā)人員來說,只需要將所有的精力都來放到邏輯這塊即可。

同時,可以隨時驗證邏輯的正確性,所有的輸出結(jié)果都可以打印輸出。這種所見即所得的開發(fā)模式極大的提高了硬件邏輯的開發(fā)效率。

那么,在FPGA實現(xiàn)的過程中,是否可以做出通用化的過程呢?答案是肯定的,如圖4中的紅色字體所示,控制參數(shù)部分就是自動更新的參數(shù),通過自動化工具生成的控制參數(shù)能有效的控制不同算子模塊的實現(xiàn),而無需改動硬件電路。

有了這樣方便又強(qiáng)大的工具,又有了底層封裝的模塊,才能在上層建筑有更大的發(fā)揮空間,就能更好的發(fā)揮FPGA的潛能,使其適配更多的算法結(jié)構(gòu),而不是只關(guān)注于修改算法來削足適履。

換一種維度思考

解決了開發(fā)FPGA效率的問題,我們可以把主要精力在提升FPGA的性能上下功夫,利用FPGA的分布式的存儲的思路來設(shè)計模型,將FPGA的性能提升到最高。

假設(shè)網(wǎng)絡(luò)結(jié)構(gòu)中有三層卷積依次執(zhí)行,如下圖所示:

AI算法在FPGA芯片上的創(chuàng)新應(yīng)用

圖5(卷積合并示例)

在這樣的網(wǎng)絡(luò)結(jié)構(gòu)下,第一層是1×1的卷積核,第二層是3×3的depwise卷積運算,第三層又是一個1×1的卷積核,每層的conv模塊的kernel和channel都不是很大,類似這樣的網(wǎng)絡(luò)不同的算子組合在AI算法中很常見,若按傳統(tǒng)的思路,只能每層conv都單獨計算。

但每一層的計算都不能將FPGA的資源用滿(dsp&bram),這會導(dǎo)致資源的浪費,最重要的是沒有發(fā)揮FPGA的最大的性能,從而導(dǎo)致處理的幀率降低。

為了更好的利用FPGA 資源,挖掘FPGA的潛能,我們可以根據(jù)每層的資源分布做個統(tǒng)計,發(fā)現(xiàn)將上述三層的資源合并成一個全流水的方式(即一次IO讀寫,三層連續(xù)計算)才能將FPGA的潛能發(fā)揮到最大。

這種設(shè)計方案是根據(jù)算法的規(guī)律進(jìn)行調(diào)整FPGA的組裝結(jié)構(gòu),從而發(fā)揮出并行計算的最大性能。

如此定制化的方式是發(fā)揮了FPGA的最大性能,那么又會產(chǎn)生一個問題:AI算法那么多,有沒有那種即能發(fā)揮FPGA的最大性能,又能有通用性的方法?

要回答這個問題,我們得先探究FPGA的本質(zhì),F(xiàn)PGA本質(zhì)上是個分布式的資源分布系統(tǒng),那么對核心資源(主要是dsp和bram)是否可以進(jìn)行動態(tài)分配?

如果解決了這個問題,那么就能完美解決上述問題。

我們可以通過給相應(yīng)模塊不同的參數(shù)來適配不同的算法因子以及不同的算法組合,而修改這些參數(shù)并不需要修改FPGA程序。

而對這種方式的探索,雪湖信息科技已經(jīng)做了很多工作,并有相當(dāng)多的積累,并有可以商用的成熟案例,如下圖,是我們生成參數(shù)的一角。

AI算法在FPGA芯片上的創(chuàng)新應(yīng)用

圖6(控制參數(shù)列表)

這樣的設(shè)計思路是根據(jù)不同的參數(shù)控制,針對不同的filter大小、不同的算子、不同的算子組合、不同的conv層的組合,來進(jìn)行不同的控制。

這種設(shè)計兼顧了FPGA的靈活性和通用性,可以說著兼顧通用性的情況下最大限度的提高了FPGA資源的使用率,也不會出現(xiàn)設(shè)計硬傷,可以適配任何新的算子,對interp等非卷積類支持很充分。

而針對proposal層的處理,可以在采用將網(wǎng)絡(luò)一分為二,預(yù)留比較小的資源進(jìn)行排序處理,而其他資源可以處理新的數(shù)據(jù),兩者并行處理,只有控制邏輯和周期計算處理好,兩者不會產(chǎn)生阻塞和延時。

另一種維度的統(tǒng)一

反過來想,能否在保持FPGA靈活性的情況下,做成統(tǒng)一平臺,這種探索是可行的,這種探索雪湖信息科技一直在堅持。

AI算法在FPGA芯片上的創(chuàng)新應(yīng)用

圖7(各個網(wǎng)絡(luò)/芯片平臺的評估數(shù)據(jù)表)

控制參數(shù)在處理平臺的靈活性,而模塊化的開發(fā)則是開發(fā)平臺的基石ptero在開發(fā)卷積過程中不斷的積累現(xiàn)有的卷積模塊/非卷積模塊,在不斷的打磨過程中將平臺的核心庫不斷的更新/優(yōu)化,這些高效的模塊才是能兼顧通用和靈活的關(guān)鍵所在。

當(dāng)這種模塊經(jīng)過實踐證明可行之后,雪湖開發(fā)出了自動化工具平臺,該工具平臺包括自動解析網(wǎng)絡(luò)結(jié)構(gòu)、生成控制參數(shù)、生成計算參數(shù)、推薦相應(yīng)的模塊、分配合理的FPGA資源等等內(nèi)容。

同時會包含自動測試部分,有了自動化工具的支持,對平臺的通用性和便捷性提到了一個新的高度。

如下圖,便是自動化測試工具測試示例:

已經(jīng)實現(xiàn)的卷積算法計算量在5.3 Gflops左右(算法的細(xì)節(jié)涉及機(jī)密不便展開),用znq7020里進(jìn)行實現(xiàn),dsp利用率在88.88%左右,下圖為自動測試工具生成結(jié)果圖:

AI算法在FPGA芯片上的創(chuàng)新應(yīng)用

圖8(自動測試工具生成結(jié)果圖)

自動化工具是自適應(yīng)FPGA開發(fā)平臺的濃縮表現(xiàn),可以根據(jù)不同的算法推薦不同的方案,通過生成的不同的控制參數(shù)來合理的分配FPGA資源使用。隨著該平臺的不斷更新和升級,最終完成一鍵式端到端的FPGA實現(xiàn)方案。

通過這種方式,最終解決FPGA開發(fā)中通用性和靈活性的問題,這是雪湖不遺余力去追求的目標(biāo)。

通過這種方式,不同的用戶可以根據(jù)自己的需求進(jìn)行不同的配置,得到高性價比的FPGA開發(fā)方案。

同時,更重要的是該方案不需要修改網(wǎng)絡(luò)結(jié)構(gòu),不需要對用戶的數(shù)據(jù)進(jìn)行重新訓(xùn)練,從而保護(hù)用戶的核心資產(chǎn)。

而同時,由于FPGA的高度可配置性,當(dāng)用戶的算法進(jìn)行更新時,可以快速的修改和部署,這也是保護(hù)用戶投資的有效手段。

總之,從復(fù)雜到簡單,由繁瑣到簡潔,是事物發(fā)展的普遍規(guī)律。

而將FPGA開發(fā)的由難到易,以工具建平臺,以平臺來培養(yǎng)人才,在靈活易用的FPGA芯片上,解決應(yīng)用開發(fā)難題,能夠加快AI算法的快速落地。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • FPGA芯片
    +關(guān)注

    關(guān)注

    3

    文章

    246

    瀏覽量

    39720
  • TPU
    TPU
    +關(guān)注

    關(guān)注

    0

    文章

    138

    瀏覽量

    20669
  • 寒武紀(jì)
    +關(guān)注

    關(guān)注

    11

    文章

    185

    瀏覽量

    73835
  • AI算法
    +關(guān)注

    關(guān)注

    0

    文章

    244

    瀏覽量

    12210

原文標(biāo)題:AI算法在FPGA芯片上還有這種操作?| 技術(shù)頭條

文章出處:【微信號:rgznai100,微信公眾號:rgznai100】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    FPGA芯片用于神經(jīng)網(wǎng)絡(luò)算法優(yōu)化的設(shè)計實現(xiàn)方案

    確定了算力的基礎(chǔ),盡量最大化硬件的計算和帶寬性能。經(jīng)歷了一年多的理論學(xué)習(xí),開始第一次神經(jīng)網(wǎng)絡(luò)算法優(yōu)化的嘗試。之所以從一個FPGA開發(fā)者轉(zhuǎn)向算法
    的頭像 發(fā)表于 09-29 11:36 ?4800次閱讀
    <b class='flag-5'>FPGA</b><b class='flag-5'>芯片</b>用于神經(jīng)網(wǎng)絡(luò)<b class='flag-5'>算法</b>優(yōu)化的設(shè)計實現(xiàn)方案

    平衡創(chuàng)新與倫理:AI時代的隱私保護(hù)和算法公平

    的發(fā)展不應(yīng)背離人類的倫理道德。推動技術(shù)創(chuàng)新的同時,我們必須確保每一步都走得穩(wěn)健和負(fù)責(zé)。通過提高透明度、保障算法公平性、保護(hù)個人隱私權(quán)以及加強(qiáng)國際合作,我們可以確保AI技術(shù)的健康發(fā)展,
    發(fā)表于 07-16 15:07

    求助-FPGA實現(xiàn)retinex算法

    求助大神,FPGA實現(xiàn)retinex算法 。。。
    發(fā)表于 05-08 23:29

    電子元器件+AI創(chuàng)新發(fā)展論壇

    `物聯(lián)網(wǎng)時代下,基于大數(shù)據(jù)和人工智能算法實現(xiàn)的萬物互聯(lián),重構(gòu)了新業(yè)態(tài)、新模式、新發(fā)展,為智造業(yè)注入新鮮血液。就此,我們特邀知名元器件電商平臺、方案商和芯片商一起探討分享新的時代背景下,如何通過
    發(fā)表于 11-15 14:53

    AI芯片算法不談智能,談實現(xiàn)不談芯片!

    1談算法不談智能IEEE協(xié)會首次在京舉辦研討會的時候,中國自動化學(xué)會副理事長兼秘書長、中科院自動化研究所復(fù)雜系統(tǒng)管理與控制國家重點實驗室主任王飛躍稱不存在AI芯片。對于這一觀點的爭議非常大,網(wǎng)絡(luò)
    發(fā)表于 08-24 10:36

    手把手教你設(shè)計人工智能芯片及系統(tǒng)--(全階設(shè)計教程+AI芯片FPGA實現(xiàn)+開發(fā)板)

    AI芯片產(chǎn)品的設(shè)計和開發(fā);技巧提升:課程剖析AI芯片開發(fā)流程及技巧,學(xué)員可熟悉AI芯片架構(gòu)設(shè)計的
    發(fā)表于 07-19 11:54

    29頁P(yáng)PT,詳細(xì)介紹Ouroboros的語音AI芯片

    阿里達(dá)摩院發(fā)布一款名為Ouroboros的語音AI芯片。據(jù)官方表示,這款芯片是業(yè)界首款專門用于語音合成算法AI
    發(fā)表于 10-16 16:32

    【免費直播】AI芯片專家陳小柏博士,帶你解析AI算法及其芯片操作系統(tǒng)。

    智慧化進(jìn)程。人工智能芯片是人工智能發(fā)展的基石,是數(shù)據(jù)、算法和算力各類場景應(yīng)用落地的基礎(chǔ)依托?!盁o芯片AI”已經(jīng)深入人心,成為業(yè)界共識。本
    發(fā)表于 11-07 14:03

    【免費直播】讓AI芯片擁有最強(qiáng)大腦—AI芯片的操作系統(tǒng)設(shè)計介紹.

    智慧化進(jìn)程。人工智能芯片是人工智能發(fā)展的基石,是數(shù)據(jù)、算法和算力各類場景應(yīng)用落地的基礎(chǔ)依托?!盁o芯片AI”已經(jīng)深入人心,成為業(yè)界共識。本
    發(fā)表于 11-07 14:18

    AI芯片熱潮和架構(gòu)創(chuàng)新有什么作用

    魏少軍談AI芯片熱潮和架構(gòu)創(chuàng)新 透露清華Thinker芯片將獨立融資
    發(fā)表于 04-23 14:59

    AI芯片熱潮和架構(gòu)創(chuàng)新是什么

    魏少軍談AI芯片熱潮和架構(gòu)創(chuàng)新 透露清華Thinker芯片將獨立融資
    發(fā)表于 04-24 11:29

    FPGA實現(xiàn)CRC算法的程序

    Xilinx FPGA工程例子源碼:FPGA實現(xiàn)CRC算法的程序
    發(fā)表于 06-07 15:07 ?28次下載

    關(guān)于FPGAAI芯片中的重要性

    人工智能的三大支撐是硬件、算法和數(shù)據(jù),其中硬件指的是運行 AI 算法芯片與相對應(yīng)的計算平臺。硬件方面,目前主要是使用 GPU 并行計算神
    發(fā)表于 09-03 17:55 ?2528次閱讀

    FPGA 實施 AI/ML 的選項

    FPGA 實施 AI/ML 的選項
    的頭像 發(fā)表于 12-28 09:51 ?763次閱讀

    FPGA建立MATLAB和Simulink算法原型

    存在功能瑕疵,需要返工。由于HDL 仿真 不足以發(fā)現(xiàn)系統(tǒng)級錯誤,芯片設(shè)計人員正利用 FPGA 來加速算法創(chuàng)建和原型設(shè)計。 利用FPGA處理大型測試數(shù)據(jù)集可以使工程師快速評估
    的頭像 發(fā)表于 08-06 10:45 ?565次閱讀
    <b class='flag-5'>在</b><b class='flag-5'>FPGA</b><b class='flag-5'>上</b>建立MATLAB和Simulink<b class='flag-5'>算法</b>原型