0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Neuchips與新思科技合作開展幫助降低進(jìn)入人工智能領(lǐng)域的門檻

新思科技 ? 來源:新思科技 ? 作者:新思科技 ? 2022-09-28 09:22 ? 次閱讀

大數(shù)據(jù)真的很厲害,相信很多人都感受到了,比如你剛逛完某寶開始刷某音,卻發(fā)現(xiàn)某音給你推送了你剛剛看過的商品的廣告,以及相似品類的帶貨直播;再比如某頭條每次給你推送的內(nèi)容都是你感興趣的。這些APP似乎比你更了解你自己。

“精準(zhǔn)推薦”的背后,其實(shí)是大量具有挑戰(zhàn)性的開發(fā)工作,是人工智能技術(shù)的加持。AI加速器是推薦系統(tǒng)的關(guān)鍵技術(shù),它的速度和能效是預(yù)測準(zhǔn)確性的關(guān)鍵。

2019年,Meta(前Facebook)呼吁業(yè)界在其開發(fā)的開源深度學(xué)習(xí)推薦模型(DLRM)基礎(chǔ)上進(jìn)行推薦系統(tǒng)硬件加速的開發(fā)。Neuchips Inc.的開發(fā)團(tuán)隊(duì)倍受啟發(fā),他們隨后設(shè)計(jì)出推薦模型容量更大的DLRM加速器Neuchips RecAccel-N3000。

RecAccel-N3000是專為數(shù)據(jù)中心的推薦模型而設(shè)計(jì)的,它能做到每焦耳能量實(shí)現(xiàn)100萬次DLRM推斷,舉個例子來說,也就是當(dāng)芯片工作在20W時,每秒可進(jìn)行2000萬次推斷。

這款A(yù)I加速器是使用新思科技EDA工具開發(fā)的,并將采用臺積電7nm工藝制造,樣品計(jì)劃在2022年底完成。

正常來說,這一過程通常需要100多人花3到4年才能完成,但Neuchips僅30人的開發(fā)團(tuán)隊(duì)在短短18個月內(nèi)就制造出了400mm2的人工智能芯片。今天的文章中我們將詳細(xì)介紹他們是如何做到的。

開創(chuàng)一種獨(dú)特的

“直連ASIC”開發(fā)方法

以DLRM為代表的人工智能推薦系統(tǒng),是利用云計(jì)算和大數(shù)據(jù)方面的最主要的機(jī)器學(xué)習(xí)應(yīng)用之一。優(yōu)化過的DLRM可以產(chǎn)生更加有效的推理結(jié)果,但卻需要平臺能夠在能耗和存儲不大幅增加的情況下提供更多的算力。

Neuchips開創(chuàng)了一種獨(dú)特的“直連ASIC”開發(fā)方法,通過專門構(gòu)建的特定領(lǐng)域AI加速器以及共同設(shè)計(jì)的編譯器和runtime軟件來進(jìn)行加速。在該公司的異步、異構(gòu)數(shù)據(jù)流架構(gòu)中,用來優(yōu)化DLRM邏輯架構(gòu)的每種IP和處理器都是精心定制的。

此外,RecAccel-N3000還具有以下特點(diǎn):

160MB片上SRAM

4x64帶有ECC的LPDDR5

高達(dá)128GB的卡上DRAM

多達(dá)16通道的PCI Express(PCIe)3.0、4.0和5.0

嵌入式安全硬件信任根模塊

為了能夠率先進(jìn)入市場,Neuchips積極尋求能夠幫助該公司加快設(shè)計(jì)周期的支持、設(shè)計(jì)和驗(yàn)證工具以及IP。Neuchips在人工智能芯片設(shè)計(jì)實(shí)驗(yàn)室找到了所需的資源,這一實(shí)驗(yàn)室是新思科技與臺灣工業(yè)技術(shù)研究院(ITRI)的合作項(xiàng)目。因?yàn)閳F(tuán)隊(duì)內(nèi)的很多成員已經(jīng)非常熟悉新思科技的技術(shù),因此Neuchips很快決定與新思科技合作開展這一項(xiàng)目。

該人工智能芯片設(shè)計(jì)實(shí)驗(yàn)室位于臺灣新竹的工研院總部,已獲得臺灣工業(yè)技術(shù)部門(DoIT)和經(jīng)濟(jì)部門(MOEA)技術(shù)發(fā)展計(jì)劃的支持。人工智能芯片設(shè)計(jì)實(shí)驗(yàn)室的主要產(chǎn)品之一是基于ARC人工智能參考設(shè)計(jì)平臺的新思科技系統(tǒng)級解決方案,涵蓋了架構(gòu)設(shè)計(jì)、虛擬原型、系統(tǒng)驗(yàn)證等。該設(shè)計(jì)平臺旨在幫助降低進(jìn)入人工智能領(lǐng)域的門檻,縮短設(shè)計(jì)周期。

將芯片開發(fā)時間縮短一年以上

基于其獨(dú)特的特性,DLRM可能難以用通用的AI加速器來加速。Neuchips開發(fā)的RecAccel-N3000具有定制的硬件IP,可以加速Embedding、矩陣乘法和特征交互。Neuchips與新思科技合作,實(shí)現(xiàn)了由ARC AI參考設(shè)計(jì)平臺支持的早期硬件/軟件協(xié)同開發(fā),為芯片開發(fā)節(jié)省了一年多的時間。

借助該設(shè)計(jì)平臺,Neuchips團(tuán)隊(duì)能夠在早期開發(fā)和驗(yàn)證RecAccel-N3000特定領(lǐng)域人工智能加速器的PCIe 5.0子系統(tǒng)和LPDDR5子系統(tǒng),然后將其集成到整個芯片中。新思科技的云端ZeBu Server 4硬件加速系統(tǒng)用于驗(yàn)證這些子系統(tǒng)以及整個RecAccel-N3000。

RecAccel-N3000采用了新思科技的一系列IP模塊,包括:

ARC HS48處理器

ARC EV72處理器

用于AMBA、LPDDR5和PCIe的接口IP

具有高級電源管理功能的內(nèi)存編譯器

硬件安全模塊,具有信任根,為數(shù)據(jù)中心的IT設(shè)備提供安全保障,確保啟動代碼的完整性和設(shè)備認(rèn)證

使用經(jīng)驗(yàn)證的新思科技IP幫助Neuchips團(tuán)隊(duì)降低了集成風(fēng)險,大幅縮短了設(shè)計(jì)周期。新思科技的應(yīng)用開發(fā)者還支持Neuchips優(yōu)化其基于云的芯片設(shè)計(jì)代碼、配置IP,并在基于FPGA的ZeBu Server 4系統(tǒng)上進(jìn)行仿真和驗(yàn)證,這將整個ASIC RTL仿真的時間從兩周縮短到了20分鐘左右。

助力RecAccel-N3000開發(fā)過程的其他設(shè)計(jì)和驗(yàn)證工具包括 Design Compiler RTL綜合解決方案、VCS功能驗(yàn)證解決方案、SpyGlass靜態(tài)和形式化驗(yàn)證平臺、Verdi自動調(diào)試系統(tǒng)、Formality等效性檢查、PrimeTime靜態(tài)時序分析工具、PrimePower RTL to signoff功率分析工具以及IC Compiler II布局布線解決方案。

推薦系統(tǒng)在數(shù)智化世界中的應(yīng)用逐漸廣泛且日益精準(zhǔn), RecAccel-N3000的出現(xiàn)恰逢其時。通過加速數(shù)據(jù)中心的推薦,這一高性能、高能效、可擴(kuò)展的人工智能平臺有望幫助各行各業(yè)實(shí)現(xiàn)個性化的用戶體驗(yàn)。通過與新思科技、工研院以及臺灣半導(dǎo)體領(lǐng)域的其他公司的密切合作,Neuchips Inc.已經(jīng)實(shí)現(xiàn)了快速上市的目標(biāo),在提供有影響力的人工智能解決方案的競爭中取得了先機(jī)。

審核編輯:彭靜

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 芯片
    +關(guān)注

    關(guān)注

    452

    文章

    50005

    瀏覽量

    419725
  • 人工智能
    +關(guān)注

    關(guān)注

    1789

    文章

    46368

    瀏覽量

    236561
  • 新思科技
    +關(guān)注

    關(guān)注

    5

    文章

    778

    瀏覽量

    50270
收藏 人收藏

    評論

    相關(guān)推薦

    《AI for Science:人工智能驅(qū)動科學(xué)創(chuàng)新》第6章人AI與能源科學(xué)讀后感

    幸得一好書,特此來分享。感謝平臺,感謝作者。受益匪淺。 在閱讀《AI for Science:人工智能驅(qū)動科學(xué)創(chuàng)新》的第6章后,我深刻感受到人工智能在能源科學(xué)領(lǐng)域中的巨大潛力和廣泛應(yīng)用。這一章詳細(xì)
    發(fā)表于 10-14 09:27

    AI for Science:人工智能驅(qū)動科學(xué)創(chuàng)新》第4章-AI與生命科學(xué)讀后感

    。 4. 對未來生命科學(xué)發(fā)展的展望 在閱讀這一章后,我對未來生命科學(xué)的發(fā)展充滿了期待。我相信,在人工智能技術(shù)的推動下,生命科學(xué)將取得更加顯著的進(jìn)展。例如,在藥物研發(fā)領(lǐng)域,AI技術(shù)將幫助科學(xué)家們更加
    發(fā)表于 10-14 09:21

    《AI for Science:人工智能驅(qū)動科學(xué)創(chuàng)新》第一章人工智能驅(qū)動的科學(xué)創(chuàng)新學(xué)習(xí)心得

    的效率,還為科學(xué)研究提供了前所未有的洞察力和精確度。例如,在生物學(xué)領(lǐng)域,AI能夠幫助科學(xué)家快速識別基因序列中的關(guān)鍵變異,加速新藥研發(fā)進(jìn)程。 2. 跨學(xué)科融合的新范式 書中強(qiáng)調(diào),人工智能的應(yīng)用促進(jìn)了多個
    發(fā)表于 10-14 09:12

    risc-v在人工智能圖像處理應(yīng)用前景分析

    其在人工智能圖像處理領(lǐng)域的應(yīng)用提供更多支持。 標(biāo)準(zhǔn)化和規(guī)范化推進(jìn) :為了降低RISC-V的碎片化風(fēng)險并促進(jìn)其在全球范圍內(nèi)的廣泛應(yīng)用,標(biāo)準(zhǔn)化和規(guī)范化將是未來的重要趨勢。這將有助于提升RISC-V技術(shù)
    發(fā)表于 09-28 11:00

    人工智能ai4s試讀申請

    目前人工智能在繪畫對話等大模型領(lǐng)域應(yīng)用廣闊,ai4s也是方興未艾。但是如何有效利用ai4s工具助力科研是個需要研究的課題,本書對ai4s基本原理和原則,方法進(jìn)行描訴,有利于總結(jié)經(jīng)驗(yàn),擬按照要求準(zhǔn)備相關(guān)體會材料??茨芊裼兄谌腴T和提高ss
    發(fā)表于 09-09 15:36

    名單公布!【書籍評測活動NO.44】AI for Science:人工智能驅(qū)動科學(xué)創(chuàng)新

    活的世界? 編輯推薦 《AI for Science:人工智能驅(qū)動科學(xué)創(chuàng)新》聚焦于人工智能與材料科學(xué)、生命科學(xué)、電子科學(xué)、能源科學(xué)、環(huán)境科學(xué)五大領(lǐng)域的交叉融合,通過深入淺出的語言和諸多實(shí)際應(yīng)用案例,介紹了
    發(fā)表于 09-09 13:54

    報名開啟!深圳(國際)通用人工智能大會將啟幕,國內(nèi)外大咖齊聚話AI

    8月28日至30日,2024深圳(國際)通用人工智能大會暨深圳(國際)通用人工智能產(chǎn)業(yè)博覽會將在深圳國際會展中心(寶安)舉辦。大會以“魅力AI·無限未來”為主題,致力于打造全球通用人工智能領(lǐng)域
    發(fā)表于 08-22 15:00

    FPGA在人工智能中的應(yīng)用有哪些?

    FPGA(現(xiàn)場可編程門陣列)在人工智能領(lǐng)域的應(yīng)用非常廣泛,主要體現(xiàn)在以下幾個方面: 一、深度學(xué)習(xí)加速 訓(xùn)練和推理過程加速:FPGA可以用來加速深度學(xué)習(xí)的訓(xùn)練和推理過程。由于其高并行性和低延遲特性
    發(fā)表于 07-29 17:05

    思科技受邀參加2024世界人工智能大會

    2024年7月4日上午,新思科技總裁兼首席執(zhí)行官Sassine Ghazi(蓋思新)先生受邀參加2024世界人工智能大會暨人工智能全球治理高級別會議,并發(fā)表《自芯片創(chuàng)新視角思考負(fù)責(zé)任的人工智能
    的頭像 發(fā)表于 07-05 11:45 ?654次閱讀

    英偉達(dá)與戴爾幫助企業(yè)創(chuàng)建“人工智能工廠”

    英偉達(dá)公司首席執(zhí)行官黃仁勛近日表示,英偉達(dá)與戴爾科技公司的合作將極大地推動人工智能技術(shù)的普及。雙方的合作旨在幫助企業(yè)和組織建立自己的“人工智能
    的頭像 發(fā)表于 05-22 09:37 ?321次閱讀

    思科技與臺積公司深化EDA與IP合作

    思科技近日與臺積公司宣布,在先進(jìn)工藝節(jié)點(diǎn)設(shè)計(jì)領(lǐng)域開展了廣泛的EDA和IP合作。雙方的合作成果已經(jīng)成功應(yīng)用于一系列
    的頭像 發(fā)表于 05-13 11:04 ?448次閱讀

    星云數(shù)字與普強(qiáng)信息在人工智能領(lǐng)域開展合作 共推大模型技術(shù)革新

    近日,南京星云數(shù)字技術(shù)有限公司(下稱“星云數(shù)字”)與普強(qiáng)信息技術(shù)(北京)有限公司(下稱“普強(qiáng)信息”)達(dá)成戰(zhàn)略合作。雙方將在人工智能尤其是生成式人工智能領(lǐng)域
    的頭像 發(fā)表于 04-12 19:10 ?1076次閱讀

    機(jī)器學(xué)習(xí)怎么進(jìn)入人工智能

    人工智能(Artificial Intelligence,AI)是一門涉及計(jì)算機(jī)、工程、數(shù)學(xué)、哲學(xué)和認(rèn)知科學(xué)等多個領(lǐng)域的交叉學(xué)科,旨在構(gòu)建智能化計(jì)算機(jī)系統(tǒng),使之能夠自主感知、理解、學(xué)習(xí)和決策。如今
    的頭像 發(fā)表于 04-04 08:41 ?203次閱讀

    思科技與英特爾深化合作加速先進(jìn)芯片設(shè)計(jì)

    近日,新思科技與英特爾宣布深化合作,共同加速先進(jìn)芯片設(shè)計(jì)的步伐。據(jù)悉,新思科技的人工智能驅(qū)動的數(shù)字和模擬設(shè)計(jì)流程已經(jīng)成功通過英特爾代工的Intel 18A工藝認(rèn)證,這一突破性的進(jìn)展標(biāo)志
    的頭像 發(fā)表于 03-06 10:33 ?557次閱讀

    嵌入式人工智能的就業(yè)方向有哪些?

    嵌入式人工智能的就業(yè)方向有哪些? 在新一輪科技革命與產(chǎn)業(yè)變革的時代背景下,嵌入式人工智能成為國家新型基礎(chǔ)建設(shè)與傳統(tǒng)產(chǎn)業(yè)升級的核心驅(qū)動力。同時在此背景驅(qū)動下,眾多名企也紛紛在嵌入式人工智能領(lǐng)域
    發(fā)表于 02-26 10:17