0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

賽靈思推出了業(yè)界首款自適應(yīng)計(jì)算加速平臺(tái)Versal和加速器Alveo

佐思汽車研究 ? 來(lái)源:未知 ? 作者:李倩 ? 2018-10-23 11:19 ? 次閱讀

10月16日,XDF(賽靈思開(kāi)發(fā)者大會(huì))在北京國(guó)際飯店舉行。作為業(yè)界最權(quán)威、最具深度的FPGA交流大會(huì)之一,Xilinx把行業(yè)最頂尖的FPGA專家和企業(yè)匯聚一堂,集思廣益,分享和交流FPGA產(chǎn)品開(kāi)發(fā)經(jīng)驗(yàn)與應(yīng)用方案。

Xilinx CEOVictor Peng 、華為IT智能計(jì)算業(yè)務(wù)副總裁張小華、阿里云FPGA異構(gòu)計(jì)算研發(fā)總監(jiān)張振祥等業(yè)內(nèi)領(lǐng)袖出席。同時(shí),在會(huì)上,賽靈思推出了業(yè)界首款自適應(yīng)計(jì)算加速平臺(tái)Versal和加速器Alveo。

作為Xilinx在中國(guó)智能汽車電子領(lǐng)域唯一的Certified member,深圳市自行科技有限公司(簡(jiǎn)稱:自行科技)受邀參加,公司聯(lián)合創(chuàng)始人兼CTO諶璟博士在現(xiàn)場(chǎng)分享了“基于FPGA的計(jì)算機(jī)視覺(jué)系統(tǒng)設(shè)計(jì)與開(kāi)發(fā)”的主題演講。諶璟博士結(jié)合其多年的深度學(xué)習(xí)與FPGA開(kāi)發(fā)經(jīng)驗(yàn),從性能、成本、開(kāi)發(fā)難度等多個(gè)維度出發(fā),提出一套系統(tǒng)化的FPGA深度神經(jīng)網(wǎng)絡(luò)優(yōu)化流程。

圖:自行科技聯(lián)合創(chuàng)始人兼CTO諶璟博士做主題演講

諶博認(rèn)為,CNN與FPGA的結(jié)合可以組合利用多種算法模塊,充分發(fā)揮FPGA在計(jì)算速度、功耗、成本等方面的優(yōu)勢(shì),降低開(kāi)發(fā)難度與周期,減少開(kāi)發(fā)成本。但是CNN中存在大量冗余計(jì)算,因此如何在FPGA中實(shí)現(xiàn)CNN加速設(shè)計(jì)就尤為重要。

圖:諶璟博士演講獲得現(xiàn)場(chǎng)嘉賓觀眾好評(píng)

自行科技通過(guò)多年CNN與FPGA自主研發(fā)經(jīng)驗(yàn),開(kāi)發(fā)出業(yè)內(nèi)領(lǐng)先性價(jià)比的FPGA加速設(shè)計(jì)方案。會(huì)中,她表示,F(xiàn)PGA加速設(shè)計(jì)需要算法工程師和FPGA工程師共同參與。

一方面,通過(guò)剪枝壓縮、權(quán)值壓縮等方法對(duì)網(wǎng)絡(luò)壓縮算法進(jìn)行優(yōu)化,以減少網(wǎng)絡(luò)冗余計(jì)算,釋放可用資源。例如,我們可以僅僅將少數(shù)“重要”的卷積核量化為8bit權(quán)值,其余卷積核用1bit權(quán)值表示,構(gòu)造混合精度網(wǎng)絡(luò),在確保網(wǎng)絡(luò)檢測(cè)性能的基礎(chǔ)上大幅度提高計(jì)算效率。

另一方面,不同的FPGA架構(gòu)需要適配對(duì)應(yīng)的CNN網(wǎng)絡(luò)結(jié)構(gòu),因此需要有針對(duì)性地進(jìn)行并行化和結(jié)構(gòu)化設(shè)計(jì),讓計(jì)算模塊得到充分利用,避免大量計(jì)算資源閑置。同時(shí),在進(jìn)行網(wǎng)絡(luò)設(shè)計(jì)時(shí)還要充分利用FPGA片內(nèi)資源,避免DSP計(jì)算資源與邏輯資源的浪費(fèi)。

以SSD網(wǎng)絡(luò)為例,在不考慮其他操作帶來(lái)的時(shí)延(DDR時(shí)延、FSM狀態(tài)轉(zhuǎn)移時(shí)延~等)的情況下,Xilinx zynq7020在CNN計(jì)算幀率最高可達(dá)5.7fps;但是,自行科技通過(guò)權(quán)值壓縮、并行化設(shè)計(jì)等CNN網(wǎng)絡(luò)加速設(shè)計(jì)和算法優(yōu)化后,計(jì)算幀率提升了4-5倍,大大提高了芯片的運(yùn)行效率。

最后,諶博總結(jié)到:“FPGA與CNN的結(jié)合具備廣泛的應(yīng)用前景,但是在開(kāi)發(fā)的過(guò)程中也需要我們不斷克服困難和挑戰(zhàn)。當(dāng)前FPGA平臺(tái)技術(shù)與工具不斷迭代更新,這就需要我們時(shí)刻關(guān)注世界最前沿的技術(shù)。今天我非常高興在現(xiàn)場(chǎng)見(jiàn)證了業(yè)界首款自適應(yīng)計(jì)算加速平臺(tái)Versal ACAP以及新一代FPGA加速器卡Alveo。這不僅可以加快公司軟硬件迭代創(chuàng)新進(jìn)程,還為我們探索更優(yōu)秀的FPGA加速方案提供了思路。未來(lái),隨著CNN的計(jì)算量不斷上升,數(shù)據(jù)吞吐量也會(huì)顯著增大,這就需要不斷提高FPGA片內(nèi)BRAM資源利用效率,深入研究CNN模型壓縮算法,優(yōu)化基于FPGA的CNN框架,這也需要行業(yè)共同的努力!”

目前,該方案已經(jīng)成功應(yīng)用于公司的三大產(chǎn)品:前向ADAS系統(tǒng)、駕駛員監(jiān)控(DMS)系統(tǒng)和智能環(huán)視影像系統(tǒng),產(chǎn)品都已順利實(shí)現(xiàn)量產(chǎn)?;贔PGA平臺(tái)與CNN算法的深度結(jié)合,自行科技率先開(kāi)發(fā)出國(guó)內(nèi)首款基于深度學(xué)習(xí)技術(shù)的駕駛員監(jiān)控(DMS)系統(tǒng),打造出業(yè)內(nèi)功能最全面、性價(jià)比最高的駕駛員監(jiān)控(DMS)系統(tǒng),成為國(guó)內(nèi)駕駛員監(jiān)控系統(tǒng)標(biāo)桿企業(yè)。

除此之外,自行科技前向ADAS系統(tǒng)與智能環(huán)視影像系統(tǒng)以其可靠的目標(biāo)檢測(cè)準(zhǔn)確性和語(yǔ)義分割精度獲得國(guó)內(nèi)眾多傳統(tǒng)車廠(乘用車與商用車)、新能源和互聯(lián)網(wǎng)造車公司和Tier1汽車零部件供應(yīng)商的高度認(rèn)可。相信隨著FPGA開(kāi)發(fā)技術(shù)的不斷成熟,CNN加速設(shè)計(jì)將獲得更廣泛的應(yīng)用。

更多自行科技的 ADAS解決方案信息:www.autocruis.com

附:賽靈思發(fā)布7nm 自適應(yīng)計(jì)算加速平臺(tái)Versal及新一代FPGA加速器Alveo

2018年10月16日,F(xiàn)PGA大廠賽靈思(Xilinx)在北京召開(kāi)了一年一度的“Xilinx開(kāi)發(fā)者大會(huì) ”(XDF) 。在本次會(huì)議上,賽靈思發(fā)布了全球首款自適應(yīng)計(jì)算加速平臺(tái) (Adaptive Compute Acceleration Platform ,ACAP)芯片系列Versal。與此同時(shí),賽靈思還針對(duì)云端和本地?cái)?shù)據(jù)中心市場(chǎng)還發(fā)布了一款功能強(qiáng)大的加速器卡——Alveo。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 加速器
    +關(guān)注

    關(guān)注

    2

    文章

    789

    瀏覽量

    37592
  • 賽靈思
    +關(guān)注

    關(guān)注

    32

    文章

    1794

    瀏覽量

    131085
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5442

    瀏覽量

    120799

原文標(biāo)題:自行科技CTO諶璟博士出席賽靈思開(kāi)發(fā)者大會(huì),推出FPGA CNN加速設(shè)計(jì)方案

文章出處:【微信號(hào):zuosiqiche,微信公眾號(hào):佐思汽車研究】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    貿(mào)澤開(kāi)售適用于高性能計(jì)算應(yīng)用的AMD Alveo V80加速器

    、分子動(dòng)力學(xué)、數(shù)據(jù)分析、網(wǎng)絡(luò)安全、傳感處理、計(jì)算存儲(chǔ)和金融技術(shù)。 ? AMD Alveo V80加速器卡基于7nm Versal?
    發(fā)表于 09-27 14:59 ?129次閱讀

    ALINX受邀參加AMD自適應(yīng)計(jì)算峰會(huì)

    近日,AMD 自適應(yīng)計(jì)算峰會(huì)(AMD Adaptive Computing Summit, 即 AMD ACS)在深圳舉行,聚焦 AMD 自適應(yīng) SoC 和 FPGA 產(chǎn)品最新動(dòng)態(tài),以及設(shè)計(jì)工具和開(kāi)發(fā)環(huán)境的前沿技巧,是全球硬件開(kāi)發(fā)者和工程師們深入交流與學(xué)習(xí)的優(yōu)質(zhì)
    的頭像 發(fā)表于 08-02 14:36 ?516次閱讀

    貿(mào)澤開(kāi)售AMD / Xilinx Alveo MA35D媒體加速器 為流媒體、游戲、遠(yuǎn)程醫(yī)療和在線學(xué)習(xí)應(yīng)用提供支持

    媒體加速器。Alveo MA35D媒體加速器是一基于 ASIC 的AI視頻處理 PCIe 卡,適用于視頻協(xié)作、社交直播活動(dòng)、遠(yuǎn)程醫(yī)療、云游戲、拍賣、在線學(xué)習(xí)應(yīng)用等領(lǐng)域的高密度、超低延
    發(fā)表于 07-12 10:44 ?509次閱讀

    新思科技推出業(yè)界首PCIe 7.0 IP解決方案

    《Acquired》欄目邀請(qǐng),共同分享了當(dāng)前全球EDA(電子設(shè)計(jì)自動(dòng)化)領(lǐng)域的前沿技術(shù)進(jìn)展,以及EDA如何加速人工智能(AI)、智能汽車等核心科技產(chǎn)業(yè)變革,賦能萬(wàn)物智能時(shí)代加速到來(lái)。 ? 新思科技推出
    的頭像 發(fā)表于 06-29 15:13 ?529次閱讀

    集成32GB HBM2e內(nèi)存,AMD Alveo V80加速卡助力傳感處理、存儲(chǔ)壓縮等

    電子發(fā)燒友網(wǎng)報(bào)道(文/黃晶晶)日前,AMD推出Alveo V80加速卡,Versal FPGA自適應(yīng)SoC搭配HBM,可處理
    的頭像 發(fā)表于 06-05 16:16 ?2025次閱讀
    集成32GB HBM2e內(nèi)存,AMD <b class='flag-5'>Alveo</b> V80<b class='flag-5'>加速</b>卡助力傳感<b class='flag-5'>器</b>處理、存儲(chǔ)壓縮等

    PMP22165.1-適用于 Xilinx 通用自適應(yīng)計(jì)算加速平臺(tái) (ACAP) 的電源 PCB layout 設(shè)計(jì)

    電子發(fā)燒友網(wǎng)站提供《PMP22165.1-適用于 Xilinx 通用自適應(yīng)計(jì)算加速平臺(tái) (ACAP) 的電源 PCB layout 設(shè)計(jì).pdf》資料免費(fèi)下載
    發(fā)表于 05-19 10:45 ?0次下載
    PMP22165.1-適用于 Xilinx 通用<b class='flag-5'>自適應(yīng)計(jì)算</b><b class='flag-5'>加速</b><b class='flag-5'>平臺(tái)</b> (ACAP) 的電源 PCB layout 設(shè)計(jì)

    在Vivado中構(gòu)建AMD Versal可擴(kuò)展嵌入式平臺(tái)示例設(shè)計(jì)流程

    為了應(yīng)對(duì)無(wú)線波束形成、大規(guī)模計(jì)算和機(jī)器學(xué)習(xí)推斷等新一代應(yīng)用需求的非線性增長(zhǎng),AMD 開(kāi)發(fā)了一項(xiàng)全新的創(chuàng)新處理技術(shù) AI 引擎,片內(nèi)集成該AI Engine的FPGA系列是Versal? 自適應(yīng)計(jì)算
    的頭像 發(fā)表于 04-09 15:14 ?1238次閱讀
    在Vivado中構(gòu)建AMD <b class='flag-5'>Versal</b>可擴(kuò)展嵌入式<b class='flag-5'>平臺(tái)</b>示例設(shè)計(jì)流程

    AMD Versal AI Edge自適應(yīng)計(jì)算加速平臺(tái)之PL LED實(shí)驗(yàn)(3)

    對(duì)于Versal來(lái)說(shuō)PL(FPGA)開(kāi)發(fā)是至關(guān)重要的,這也是Versal比其他ARM的有優(yōu)勢(shì)的地方,可以定制化很多ARM端的外設(shè)
    的頭像 發(fā)表于 03-22 17:12 ?2145次閱讀

    AMD Versal AI Edge自適應(yīng)計(jì)算加速平臺(tái)PL LED實(shí)驗(yàn)(3)

    對(duì)于Versal來(lái)說(shuō)PL(FPGA)開(kāi)發(fā)是至關(guān)重要的,這也是Versal比其他ARM的有優(yōu)勢(shì)的地方,可以定制化很多ARM端的外設(shè)
    的頭像 發(fā)表于 03-13 15:38 ?872次閱讀
    AMD <b class='flag-5'>Versal</b> AI Edge<b class='flag-5'>自適應(yīng)計(jì)算</b><b class='flag-5'>加速</b><b class='flag-5'>平臺(tái)</b>PL LED實(shí)驗(yàn)(3)

    【ALINX 技術(shù)分享】AMD Versal AI Edge 自適應(yīng)計(jì)算加速平臺(tái)Versal 介紹(2)

    【ALINX 技術(shù)分享】AMD Versal AI Edge 自適應(yīng)計(jì)算加速平臺(tái)Versal 介紹,以及
    的頭像 發(fā)表于 03-07 16:03 ?917次閱讀
    【ALINX 技術(shù)分享】AMD <b class='flag-5'>Versal</b> AI Edge <b class='flag-5'>自適應(yīng)計(jì)算</b><b class='flag-5'>加速</b><b class='flag-5'>平臺(tái)</b>之 <b class='flag-5'>Versal</b> 介紹(2)

    【ALINX 技術(shù)分享】AMD Versal AI Edge 自適應(yīng)計(jì)算加速平臺(tái)之準(zhǔn)備工作(1)

    AMD Versal AI Edge 自適應(yīng)計(jì)算加速平臺(tái)之準(zhǔn)備工作,包含軟件環(huán)境、硬件環(huán)境。
    的頭像 發(fā)表于 03-07 15:49 ?711次閱讀
    【ALINX 技術(shù)分享】AMD <b class='flag-5'>Versal</b> AI Edge <b class='flag-5'>自適應(yīng)計(jì)算</b><b class='flag-5'>加速</b><b class='flag-5'>平臺(tái)</b>之準(zhǔn)備工作(1)

    AMD Versal AI Edge自適應(yīng)計(jì)算加速平臺(tái)Versal介紹(2)

    Versal 包含了 Cortex-A72 處理和 Cortex-R5 處理,PL 端可編程邏輯部分,PMC 平臺(tái)管理控制,AI En
    的頭像 發(fā)表于 03-06 18:12 ?1331次閱讀
    AMD <b class='flag-5'>Versal</b> AI Edge<b class='flag-5'>自適應(yīng)計(jì)算</b><b class='flag-5'>加速</b><b class='flag-5'>平臺(tái)</b>之<b class='flag-5'>Versal</b>介紹(2)

    Versal自適應(yīng)SoC硬件、IP和平臺(tái)開(kāi)發(fā)方法指南

    電子發(fā)燒友網(wǎng)站提供《Versal自適應(yīng)SoC硬件、IP和平臺(tái)開(kāi)發(fā)方法指南.pdf》資料免費(fèi)下載
    發(fā)表于 01-03 10:49 ?0次下載
    <b class='flag-5'>Versal</b><b class='flag-5'>自適應(yīng)</b>SoC硬件、IP和<b class='flag-5'>平臺(tái)</b>開(kāi)發(fā)方法指南

    粒子加速器加速原理是啥呢?

    粒子加速器加速原理是啥呢? 粒子加速器是一種重要的實(shí)驗(yàn)設(shè)備,用于研究粒子物理學(xué)、核物理學(xué)等領(lǐng)域。其主要原理是通過(guò)電場(chǎng)和磁場(chǎng)的作用,對(duì)帶電粒子進(jìn)行加速,在高速運(yùn)動(dòng)過(guò)程中使其獲得較大的動(dòng)
    的頭像 發(fā)表于 12-18 13:52 ?1863次閱讀

    Versal 自適應(yīng)SoC設(shè)計(jì)指南

    電子發(fā)燒友網(wǎng)站提供《Versal 自適應(yīng)SoC設(shè)計(jì)指南.pdf》資料免費(fèi)下載
    發(fā)表于 12-14 16:22 ?1次下載
    <b class='flag-5'>Versal</b> <b class='flag-5'>自適應(yīng)</b>SoC設(shè)計(jì)指南