0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

浪潮宣布為可重構(gòu)AI計算發(fā)展計劃參與者提供最新FPGA加速卡支持

倩倩 ? 來源:IT168 ? 2020-07-25 10:58 ? 次閱讀

近日,浪潮宣布為可重構(gòu)AI計算發(fā)展計劃參與者提供最新FPGA加速卡支持。參與該計劃的高校將FPGA開源AI框架TF2應(yīng)用于AI科研或應(yīng)用并取得創(chuàng)新成果,并承諾將優(yōu)化后代碼反饋回TF2開源社區(qū),即可獲贈最新FPGA加速卡。同時,參與該計劃的商業(yè)用戶也可獲得較大程度的FPGA加速卡購買優(yōu)惠。該計劃可在TF2開源社區(qū)(網(wǎng)址:https://github.com/TF2-Engine/TF2)進行申請。目前南開大學等知名高校已加入該計劃。

FPGA技術(shù)具有可定制性、低延遲和高性能功耗比等優(yōu)勢,已成為諸多AI用戶部署推理應(yīng)用的選擇。但FPGA技術(shù)進入到大規(guī)模AI業(yè)務(wù)部署仍舊存在軟件編寫門檻高、性能優(yōu)化受限、功耗難以控制等諸多挑戰(zhàn)。為了應(yīng)對這些挑戰(zhàn),浪潮推出了開源的TF2框架。

TF2是全球首個完整方案的FPGA高效AI計算開源框架,可對模型進行壓縮、裁剪、量化等優(yōu)化轉(zhuǎn)換以減少模型計算量,將模型文件自動轉(zhuǎn)化為FPGA目標運行文件,降低FPGA的AI軟件實現(xiàn)門檻,通過創(chuàng)新的DNN移位計算技術(shù)大幅提升FPGA做推理計算的性能,并有效降低其實際運行功耗,幫助用戶快速實現(xiàn)FPGA線上推理。在浪潮F10A FPGA卡上采用FaceNet模型對TF2進行的測試(BatchSize=1)表明,運行TF2后單張圖片的計算耗時為0.612ms,提速12.8倍。目前,TF2開源社區(qū)已吸引第四范式、快手、上海大學、華大智造、遠鑒科技、睿視智覺、華展匯元等多家領(lǐng)先公司或機構(gòu)加入。

TF2計算加速流程

為了推動TF2社區(qū)建設(shè),浪潮推出了可重構(gòu)AI計算發(fā)展計劃,為參與者提供F10A、F37X等最新FPGA加速卡支持,鼓勵參與者將創(chuàng)新性成果反饋至社區(qū),共同促進FPGA技術(shù)的開源開放合作發(fā)展,降低高性能AI計算技術(shù)門檻,加速AI應(yīng)用落地。浪潮F10A是目前業(yè)界支持OpenCL的最高性能密度的FPGA加速卡,每瓦特性能達到42GFlops,已實現(xiàn)大規(guī)模應(yīng)用部署,適用于數(shù)據(jù)中心AI推理、邊緣高密計算及桌面端應(yīng)用加速等多種計算環(huán)境;浪潮F37X是全球首款集成HBM2的FPGA加速卡,可在75W典型功耗條件下,提供28.1TOPS INT8計算性能。此外,浪潮還將提供針對性的技術(shù)培訓和服務(wù)支持,并定期舉行開發(fā)者會議和線上公開課,分享最新技術(shù)進展和經(jīng)驗成果。

浪潮AI&HPC總經(jīng)理劉軍表示:“視覺、語音識別以及文本、語義理解等人工智能技術(shù)正在與各行業(yè)融合,以FPGA為代表的可重構(gòu)計算將在各類線上推理場景中得到更廣泛的應(yīng)用。浪潮希望通過可重構(gòu)AI計算發(fā)展計劃促進TF2開源社區(qū)發(fā)展,同時增進開發(fā)者對最新FPGA計算加速技術(shù)的熟悉和了解,最大化釋放FPGA的計算潛力,加速產(chǎn)業(yè)AI化進程?!?/p>

浪潮是人工智能計算的領(lǐng)導品牌,AI服務(wù)器中國市場份額保持50%以上。并與人工智能領(lǐng)先科技公司保持在系統(tǒng)與應(yīng)用方面的深入緊密合作,幫助AI客戶在語音、語義、圖像、視頻、搜索、網(wǎng)絡(luò)等方面取得數(shù)量級的應(yīng)用性能提升。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • FPGA
    +關(guān)注

    關(guān)注

    1624

    文章

    21539

    瀏覽量

    600479
  • 浪潮
    +關(guān)注

    關(guān)注

    1

    文章

    444

    瀏覽量

    23757
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    29368

    瀏覽量

    267647
收藏 人收藏

    評論

    相關(guān)推薦

    AMD推出新款纖薄尺寸電子交易加速卡

    UL3422 交易商、做市商和金融機構(gòu)提供了一款針對機架空間和成本進行優(yōu)化的纖薄型加速卡,旨在快速部署到各種服務(wù)器中。
    的頭像 發(fā)表于 10-16 09:14 ?265次閱讀

    大模型向邊端側(cè)部署,AI加速卡朝高算力、小體積發(fā)展

    電子發(fā)燒友網(wǎng)報道(文/李彎彎)AI加速卡是專門用于處理人工智能應(yīng)用中的大量計算任務(wù)的模塊。它集成了高性能的計算核心和大量的內(nèi)存,旨在加速機器
    的頭像 發(fā)表于 09-17 00:18 ?2710次閱讀

    EPSON差分晶振SG3225VEN頻點312.5mhz應(yīng)用于AI加速卡

    處理、語音識別等,隨著AI技術(shù)的不斷發(fā)展,AI加速卡的設(shè)計和性能也在持續(xù)進化,以滿足日益增長的計算需求。而在這些應(yīng)用中,高精度、低延遲的時鐘
    發(fā)表于 09-10 14:56 ?0次下載

    基于菲數(shù)科技FA728Q加速卡實現(xiàn)低時延LLT應(yīng)用

    菲數(shù)科技使用Stratix 10 FPGA和開源的開放式FPGA堆棧(OFS)基礎(chǔ)設(shè)施開發(fā)高性能FPGA加速卡。
    的頭像 發(fā)表于 08-30 17:13 ?395次閱讀
    基于菲數(shù)科技FA728Q<b class='flag-5'>加速卡</b>實現(xiàn)低時延LLT應(yīng)用

    YXC高頻差分晶振,頻點312.5mhz,高精度.高穩(wěn)定性,應(yīng)用于AI加速卡

    在一些AI加速卡中,揚興推薦的YXC差分晶振YSO210PR系列,該系列頻率范圍10MHz ~1500MHz,滿足高精度、高穩(wěn)定度的需求,支持
    的頭像 發(fā)表于 08-21 14:03 ?230次閱讀
    YXC高頻差分晶振,頻點312.5mhz,高精度.高穩(wěn)定性,應(yīng)用于<b class='flag-5'>AI</b><b class='flag-5'>加速卡</b>

    借助全新 AMD Alveo? V80 計算加速卡釋放計算能力

    靈活應(yīng)變能力以實現(xiàn)工作負載優(yōu)化。Alveo V80 加速卡現(xiàn)已量產(chǎn)出貨,其能提供較之上一代加速卡至高 2 倍的帶寬與計算密度1,并為使用 AMD Vivado? 設(shè)計套件的
    發(fā)表于 05-16 14:09 ?178次閱讀
    借助全新 AMD Alveo? V80 <b class='flag-5'>計算</b><b class='flag-5'>加速卡</b>釋放<b class='flag-5'>計算</b>能力

    OpenAI Sora模型需大量AI加速卡及電力支持

    若以每片H100加速卡3萬美元市價估算,總花費將高達216億美元(相當于1561.68億元人民幣),這僅是H100加速卡采購費用。該模型在運營時還會產(chǎn)生極高的能耗,每片H100能耗達到700瓦,72萬片則意味著能耗高達50.4億瓦。
    的頭像 發(fā)表于 03-27 15:58 ?478次閱讀

    英偉達發(fā)布最強AI加速卡Blackwell GB200

    英偉達在最近的GTC開發(fā)大會上發(fā)布了其最新、最強大的AI加速卡——GB200。這款加速卡采用了新一代AI圖形處理器架構(gòu)Blackwell,
    的頭像 發(fā)表于 03-20 11:38 ?979次閱讀

    英偉達發(fā)布超強AI加速卡,性能大幅提升,支持1.8萬億參數(shù)模的訓練

    得益于NVIDIA每兩年進行一次GPU架構(gòu)升級以提高性能的策略,全新的基于Blackwell的加速卡比之前的H100更為強大,尤其適用于AI相關(guān)任務(wù)。
    的頭像 發(fā)表于 03-19 12:04 ?652次閱讀

    今日看點丨英偉達發(fā)布最強 AI 加速卡--Blackwell GB200;三星面臨罷工 存儲市場供需引關(guān)注

    的 GTC 開發(fā)大會上,正式發(fā)布了最強 AI 加速卡 GB200,并計劃今年晚些時候發(fā)貨。 ? GB200 采用新一代 AI 圖形處理器架
    發(fā)表于 03-19 11:08 ?1135次閱讀

    寧暢發(fā)布《基于標準PCIe接口的人工智能加速卡液冷設(shè)計》白皮書

    寧暢公司最近發(fā)布了一份名為《基于標準PCIe接口的人工智能加速卡液冷設(shè)計》的技術(shù)白皮書,這份白皮書由寧暢參與起草,并由開放計算標準工作委員會(OCTC)歸口,旨在為冷板式人工智能加速卡
    的頭像 發(fā)表于 01-09 14:02 ?634次閱讀

    寧暢參與發(fā)布AI加速卡液冷設(shè)計白皮書

    近日,由寧暢參與起草的《基于標準PCIe接口的人工智能加速卡液冷設(shè)計》白皮書正式發(fā)布。該技術(shù)白皮書由開放計算標準工作委員會(OCTC)歸口,旨在為冷板式人工智能加速卡的設(shè)計
    的頭像 發(fā)表于 01-09 11:28 ?689次閱讀

    瞬變對AI加速卡供電的影響

    圖形處理單元(GPU)、張量處理單元(TPU)和其他類型的專用集成電路(ASIC)通過提供并行處理能力來實現(xiàn)高性能計算,以滿足加速人工智能(AI)訓練和推理工作負載的需求 。
    的頭像 發(fā)表于 12-01 18:10 ?361次閱讀
    瞬變對<b class='flag-5'>AI</b><b class='flag-5'>加速卡</b>供電的影響

    HPC領(lǐng)域的一款大殺器-HBX-G500大帶寬加速卡

    HBX-G500是一款高性能可編程加速卡,AI、計算、網(wǎng)絡(luò)等領(lǐng)域,提供多通道的高帶寬存儲、高性能計算
    的頭像 發(fā)表于 11-29 09:16 ?872次閱讀
    HPC領(lǐng)域的一款大殺器-HBX-G500大帶寬<b class='flag-5'>加速卡</b>

    FPGA加速卡的PCB設(shè)計注意事項

    。 該圖顯示了典型加速卡的框圖。 典型的功能總結(jié)如下: 目標器件:Xilinx? Virtex? UltraScale+ ? FPGA SDRAM:2 到 4 個 x72 DDR4 接口,在設(shè)備關(guān)閉
    的頭像 發(fā)表于 10-30 09:39 ?9115次閱讀