0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

FPGA取代AI加速器中的GPU

eeDesigner ? 2020-07-21 15:14 ? 次閱讀

AI軟件初創(chuàng)公司Mipsology正在與Xilinx合作,以使FPGA能夠僅使用一個(gè)附加命令即可替換AI加速器應(yīng)用程序中的GPU。Mipsology的“零努力”軟件Zebra將GPU代碼轉(zhuǎn)換為可在FPGA上的Mipsology的AI計(jì)算引擎上運(yùn)行,而無(wú)需進(jìn)行任何代碼更改或重新培訓(xùn)。

賽靈思今天宣布,將為數(shù)據(jù)中心向Zebra交付最新版本的Alveo U50卡。Zebra已經(jīng)在其他Xilinx板上支持推理加速,包括Alveo U200和Alveo U250。

Xilinx Alveo U50卡,旨在取代AI Acceleration中的GPU
賽靈思最新版本的Alveo U50數(shù)據(jù)中心加速卡現(xiàn)在帶有Mipsology的Zebra軟件,用于轉(zhuǎn)換GPU AI代碼以在FPGA上運(yùn)行(圖片:Xilinx)

Xilinx營(yíng)銷副總裁Ramine Roane表示:“ Zebra帶給我們的Alveo卡的加速水平使CPU和GPU加速器感到羞愧?!?/span>“與Zebra結(jié)合使用,Alveo U50滿足了AI工作負(fù)載的靈活性和性能需求,并為任何部署提供了高吞吐量和低延遲性能優(yōu)勢(shì)。”


過(guò)去,即插即用的FPGA對(duì)于非專業(yè)人士來(lái)說(shuō)很難編程,但是Mipsology希望將FPGA變成即插即用的解決方案,就像CPU或GPU一樣容易使用。這樣做的想法是使從其他類型的加速切換到FPGA盡可能容易。

Mipsology首席執(zhí)行官Ludovic Larzul說(shuō):“最好的方式是[Mipsology],我們使用FPGA之上的軟件來(lái)使它們透明化,就像Nvidia用Cuda CuDNN來(lái)使GPU對(duì)AI用戶完全透明一樣?!霸诮邮?/span>EE Times采訪時(shí)。

至關(guān)重要的是,這可以由非專家完成,而無(wú)需具備深厚的AI專業(yè)知識(shí)或FPGA技能,因?yàn)闊o(wú)需進(jìn)行模型再培訓(xùn)即可過(guò)渡。

“易用性非常重要,因?yàn)楫?dāng)您查看人們的AI項(xiàng)目時(shí),他們通常無(wú)法訪問(wèn)設(shè)計(jì)神經(jīng)網(wǎng)絡(luò)的AI團(tuán)隊(duì),” Larzul說(shuō)。“通常,如果有人安裝了一個(gè)機(jī)器人系統(tǒng)或一個(gè)視頻監(jiān)視系統(tǒng)……他們會(huì)讓其他團(tuán)隊(duì)或其他團(tuán)體開發(fā)神經(jīng)網(wǎng)絡(luò)并對(duì)其進(jìn)行培訓(xùn)。一旦獲得了[訓(xùn)練有素的模型],他們就不會(huì)更改它,因?yàn)樗麄儧]有專業(yè)知識(shí)。”

Mipsology Zebra軟件堆棧。 Zebra使FPGA能夠取代GPU
斑馬的堆棧。該技術(shù)適用于數(shù)據(jù)中心,邊緣和嵌入式應(yīng)用程序(圖片:Mipsology)

與Xilinx對(duì)比當(dāng)Xilinx
已經(jīng)擁有自己的神經(jīng)網(wǎng)絡(luò)加速器引擎(XDNN)時(shí),為什么會(huì)支持第三方軟件?

“一句話的重點(diǎn)是:我們做得更好,”拉爾祖爾說(shuō)。“另一句話是:我們的作品。”

Mipsology在Zebra中擁有自己的計(jì)算引擎,該引擎支持客戶現(xiàn)有的卷積神經(jīng)網(wǎng)絡(luò)(CNN)模型,與XDNN不同,Larzul表示XDNN支持大量演示,但不太適合定制神經(jīng)網(wǎng)絡(luò)。他說(shuō),這使使用XDNN建立和運(yùn)行自定義網(wǎng)絡(luò)“痛苦”。盡管XDNN可以在不受GPU威脅的應(yīng)用程序中競(jìng)爭(zhēng),但Zebra旨在使FPGA根據(jù)性能,成本和易用性直接采用GPU。

Mipsology Zebra堆棧詳細(xì)-幫助FPGA取代GPU
斑馬的堆棧詳細(xì)。目的是通過(guò)盡可能多地隱藏硬件來(lái)使FPGA成為從GPU或CPU到AI加速的更簡(jiǎn)單的切換(圖片:Mipsology)

Larzul說(shuō),大多數(shù)客戶改變GPU解決方案的動(dòng)機(jī)是成本。

他說(shuō):“他們想降低硬件成本,但又不想重新設(shè)計(jì)神經(jīng)網(wǎng)絡(luò)?!?/span>“(避免了)一筆非經(jīng)常性的費(fèi)用,因?yàn)槲覀兡軌蛲该鞯靥鎿QGPU,并且無(wú)需重新訓(xùn)練或修改神經(jīng)網(wǎng)絡(luò)?!?/span>

FPGA還具有可靠性,部分原因是因?yàn)樗鼈冊(cè)?a target="_blank">芯片領(lǐng)域不那么積極,并且通常比包括GPU在內(nèi)的其他加速器類型運(yùn)行溫度更低。這在需要長(zhǎng)期維護(hù)成本的數(shù)據(jù)中心中尤其重要。

拉爾祖爾說(shuō):“總擁有成本不僅僅是董事會(huì)的價(jià)格?!?/span>“確保系統(tǒng)正常運(yùn)行還需要付出代價(jià)。”

Zebra還旨在使FPGA在性能上競(jìng)爭(zhēng)。Larzul說(shuō),盡管FPGA通常提供比其他加速器更少的TOPS(每秒Tera操作),但由于Zebra精心設(shè)計(jì)的計(jì)算引擎,它們能夠更有效地使用TOPS。

Ludovic Larzul(圖片:Mipsology)
Ludovic Larzul(圖片:Mipsology)

“這是大多數(shù)加速AI的ASIC初創(chuàng)企業(yè)都忘記了的-他們?cè)谧龊艽蟮囊粔K硅片,試圖包裝更多的TOPS,但是他們沒有考慮如何在網(wǎng)絡(luò)上映射它以提高效率”,他說(shuō),并指出Zebra的基于FPGA的引擎比TOPS量為6倍的GPU每秒能夠處理更多圖像。

如何實(shí)現(xiàn)的?盡管Larzul沒有提供確切的細(xì)節(jié),但他確實(shí)表示它們不依賴修剪,因?yàn)榫冉档吞螅灾劣诓贿M(jìn)行重新培訓(xùn)就無(wú)法接受。由于相同的原因,它們不使用極限量化(低于8位)。

Zebra的引擎加快了CNN的速度,而CNN如今已廣泛用于圖像和視頻處理應(yīng)用程序,但Zebra也可以應(yīng)用于使用類似數(shù)學(xué)概念的BERT(Google的自然語(yǔ)言處理模型)。Zebra的未來(lái)迭代可能會(huì)覆蓋其他類型的神經(jīng)網(wǎng)絡(luò),包括LSTM(長(zhǎng)期短期記憶)和RNN(遞歸神經(jīng)網(wǎng)絡(luò)),但這很難實(shí)現(xiàn),因?yàn)镽NN在數(shù)學(xué)上更加多樣化。

EVE
Mipsology的團(tuán)隊(duì)成立于2015年,在法國(guó)約有30人從事研發(fā)工作,在加利福尼亞有一個(gè)小團(tuán)隊(duì),主要負(fù)責(zé)業(yè)務(wù)發(fā)展。公司已獲得總計(jì)700萬(wàn)美元的資金,其中200萬(wàn)美元是2019年法國(guó)政府創(chuàng)新競(jìng)賽的獎(jiǎng)金。

Mipsology的核心團(tuán)隊(duì)來(lái)自EVE,這一家ASIC仿真器公司,于2012年被Synopsys收購(gòu),用于其ZeBu(零錯(cuò)誤)硬件輔助驗(yàn)證產(chǎn)品,當(dāng)時(shí)是Cadence鈀金驗(yàn)證平臺(tái)的競(jìng)爭(zhēng)對(duì)手。Larzul認(rèn)為,幾乎所有主要的ASIC公司都使用EVE技術(shù)在設(shè)計(jì)周期內(nèi)驗(yàn)證ASIC。該技術(shù)依賴于連接在一起的數(shù)千個(gè)FPGA來(lái)重現(xiàn)ASIC行為。

Mipsology擁有12項(xiàng)正在申請(qǐng)的專利,并且與Xilinx密切合作,并且與第三方加速器卡兼容,例如Western Digital小型(SFF U.2)卡和Vega-4001等研華卡。


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • FPGA
    +關(guān)注

    關(guān)注

    1624

    文章

    21573

    瀏覽量

    600704
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    27

    文章

    4640

    瀏覽量

    128480
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    29438

    瀏覽量

    267755
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    英特爾發(fā)布Gaudi3 AI加速器,押注低成本優(yōu)勢(shì)挑戰(zhàn)市場(chǎng)

    英特爾近期震撼發(fā)布了專為AI工作負(fù)載設(shè)計(jì)的Gaudi3加速器,這款新芯片雖在速度上不及英偉達(dá)熱門型號(hào)H100與H200 GPU,但英特爾巧妙地將競(jìng)爭(zhēng)優(yōu)勢(shì)聚焦于其更為親民的價(jià)格與總擁有成本(TCO)上。
    的頭像 發(fā)表于 09-26 16:16 ?670次閱讀

    下一代高功能新一代AI加速器(DRP-AI3):10x在高級(jí)AI系統(tǒng)高級(jí)AI更快的嵌入處理

    電子發(fā)燒友網(wǎng)站提供《下一代高功能新一代AI加速器(DRP-AI3):10x在高級(jí)AI系統(tǒng)高級(jí)AI
    發(fā)表于 08-15 11:06 ?0次下載
    下一代高功能新一代<b class='flag-5'>AI</b><b class='flag-5'>加速器</b>(DRP-<b class='flag-5'>AI</b>3):10x在高級(jí)<b class='flag-5'>AI</b>系統(tǒng)高級(jí)<b class='flag-5'>AI</b><b class='flag-5'>中</b>更快的嵌入處理

    美國(guó)限制向中東AI加速器出口,審查國(guó)家安全

    AI加速器能協(xié)助數(shù)據(jù)中心處理大量人工智能聊天機(jī)器人和其他工具的開發(fā)信息。如今,它們已然成為構(gòu)建AI基礎(chǔ)設(shè)施的企業(yè)和政府的必需品。
    的頭像 發(fā)表于 05-31 09:20 ?482次閱讀

    臺(tái)積電:AI服務(wù)處理預(yù)計(jì)翻番,拉動(dòng)收入增長(zhǎng)?

    臺(tái)積電將 AI 服務(wù)處理嚴(yán)格限定為用于 AI 訓(xùn)練與推理的 GPU、CPU 及 AI
    的頭像 發(fā)表于 04-19 15:04 ?297次閱讀

    Arm發(fā)布新一代Ethos-U AI加速器 Arm旨在瞄準(zhǔn)國(guó)產(chǎn)CPU市場(chǎng)

    Arm發(fā)布的新一代Ethos-U AI加速器確實(shí)在業(yè)界引起了廣泛關(guān)注。
    的頭像 發(fā)表于 04-18 15:59 ?672次閱讀

    FPGA在深度學(xué)習(xí)應(yīng)用或?qū)?b class='flag-5'>取代GPU

    ,這使其在 AI 應(yīng)用面臨著一些挑戰(zhàn)。 Larzul 表示,想要解決這些問(wèn)題的解決方案便是實(shí)現(xiàn)現(xiàn)場(chǎng)可編程門陣列 (FPGA),這也是他們公司的研究領(lǐng)域。FPGA 是一種處理
    發(fā)表于 03-21 15:19

    瑞薩發(fā)布下一代動(dòng)態(tài)可重構(gòu)人工智能處理加速器

    瑞薩最新發(fā)布的動(dòng)態(tài)可重構(gòu)人工智能處理(DRP-AI加速器,在業(yè)界引起了廣泛關(guān)注。這款加速器擁有卓越的10 TOPS/W高功率效率,相比傳統(tǒng)技術(shù),效率提升了驚人的10倍。其獨(dú)特之處在
    的頭像 發(fā)表于 03-08 13:45 ?658次閱讀

    家居智能化,推動(dòng)AI加速器的發(fā)展

    提高了系統(tǒng)的運(yùn)算能力和數(shù)據(jù)處理能力,還為用戶帶來(lái)了更加智能化、個(gè)性化的生活體驗(yàn)。 ? AI 加速器的發(fā)展 ? 在人工智能和機(jī)器學(xué)習(xí)任務(wù)變得日益復(fù)雜和密集之前,傳統(tǒng)的CPU和GPU已經(jīng)足以處理這些任務(wù)。然而,隨著深度學(xué)習(xí)模型的出現(xiàn)
    的頭像 發(fā)表于 02-23 00:18 ?4478次閱讀

    【國(guó)產(chǎn)FPGA+OMAPL138開發(fā)板體驗(yàn)】(原創(chuàng))5.FPGAAI加速源代碼

    使用硬件加速器來(lái)進(jìn)一步提升性能。我寫的這個(gè)簡(jiǎn)化的代碼只是為了幫助理解FPGA如何可能參與AI計(jì)算的過(guò)程。在實(shí)際的FPGA AI
    發(fā)表于 02-12 16:18

    回旋加速器原理 回旋加速器的影響因素

    回旋加速器(Cyclotron)是一種用于加速帶電粒子的可再生粒子加速器。它的工作原理基于帶電粒子在恒定強(qiáng)磁場(chǎng)的運(yùn)動(dòng)。本文將詳細(xì)介紹回旋加速器
    的頭像 發(fā)表于 01-30 10:02 ?3312次閱讀

    FPGAGPU的區(qū)別

    FPGA(現(xiàn)場(chǎng)可編程門陣列)和GPU(圖形處理)是兩種常見的硬件加速器,用于提高計(jì)算和處理速度。盡管它們?cè)诤芏喾矫娑加兄丿B,但在架構(gòu)、設(shè)計(jì)和應(yīng)用上存在許多區(qū)別。在本文中,我們將詳細(xì)探
    的頭像 發(fā)表于 12-25 15:28 ?1563次閱讀

    粒子加速器加速原理是啥呢?

    粒子加速器加速原理是啥呢? 粒子加速器是一種重要的實(shí)驗(yàn)設(shè)備,用于研究粒子物理學(xué)、核物理學(xué)等領(lǐng)域。其主要原理是通過(guò)電場(chǎng)和磁場(chǎng)的作用,對(duì)帶電粒子進(jìn)行加速,在高速運(yùn)動(dòng)過(guò)程中使其獲得較大的動(dòng)
    的頭像 發(fā)表于 12-18 13:52 ?1868次閱讀

    21489的IIR加速器濾波參數(shù)設(shè)置如何對(duì)應(yīng)加速器的濾波參數(shù)?

    目前在用21489內(nèi)部的IIR加速器去做一個(gè)低通濾波,在例程的基礎(chǔ)上修改參數(shù)。通過(guò)平板的fda 工具工具去設(shè)計(jì)參數(shù),但是設(shè)計(jì)出來(lái)的參數(shù)不知道如何對(duì)應(yīng)加速器的濾波參數(shù),手冊(cè)里也看得不是很明白。 設(shè)計(jì)的參數(shù)如下: 請(qǐng)問(wèn)
    發(fā)表于 11-30 08:11

    PCIe在AI加速器的作用

    從線上購(gòu)物時(shí)的“猜你喜歡”、到高等級(jí)自動(dòng)駕駛汽車上的實(shí)時(shí)交通信息接收,再到在線視頻游戲,所有的這些都離不開人工智能(AI加速器。AI加速器是一種高性能的并行計(jì)算設(shè)備,旨在高效處理神經(jīng)
    的頭像 發(fā)表于 11-18 10:36 ?1929次閱讀
    PCIe在<b class='flag-5'>AI</b><b class='flag-5'>加速器</b><b class='flag-5'>中</b>的作用

    FPGA和CPU、GPU有什么區(qū)別?為什么越來(lái)越重要?

    ,在數(shù)據(jù)中心高性能計(jì)算及 AI 訓(xùn)練,CPU 這一“主角”的重要性下降,而以往的“配角們”,即 GPU、FPGA、TPU、DPU 等的加速器
    發(fā)表于 11-09 14:09