0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

亞馬遜推出基于Inferentia芯片的Inf1實例

汽車玩家 ? 來源:芯智訊 ? 作者:芯智訊 ? 2019-12-05 14:31 ? 次閱讀

當(dāng)?shù)貢r間12月3日,亞馬遜在“AWS re:invent”大會上正式發(fā)布了自主研發(fā)的第二代基于Arm架構(gòu)的服務(wù)器芯片Graviton2,同時公布了去年發(fā)布的云端AI推理芯片Inferentia的最新進(jìn)展。

亞馬遜AWS在此次大會上推出了Inf1實例,該實例由Inferentia芯片提供支持,是一個在云端為AI推理提供支持的實例,AWS CEO Andy Jassy稱之為云中可用的成本最低的推理產(chǎn)品。

Andy Jassy 指出:使用云服務(wù)為AI解決方案提供動力的運(yùn)營成本絕大多數(shù)來自推理,而推理芯片可能會很昂貴,并且要求低延遲和高吞吐量。許多企業(yè)都在模型訓(xùn)練的定制芯片上投入了大量精力,盡管常規(guī) CPU 上已經(jīng)能夠較好地執(zhí)行推理運(yùn)算,但定制芯片的效率明顯更高?!芭cNvidia G4實例相比,Inf1具有更低的延遲,吞吐量將提高3倍,并且每個實例的成本降低40%?!?/p>

Inferentia芯片還將由Annapurna Labs提供支持,該芯片企業(yè)是2015年被以色列AWS收購的。Inferentia芯片擁有4的個NeuronCore,可以提供128TOPS的算力,而每個Inf1實例可以提供2000 TOPS的算力。

與 EC4 上的常規(guī) G4 實例相比,Inferentia 能夠讓 AWS 帶來更低的延時、三倍的吞吐量、且降低 40% 單次的成本。

Inf1實例目前已經(jīng)上市,并將與PyTorch,MXNet和TensoRFlow集成。不過,目前其僅可在EC2計算服務(wù)中使用,但明年,Inf1將可以用于EKS實例和Amazon的SageMaker,來進(jìn)行機(jī)器學(xué)習(xí)的推理運(yùn)算。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • ARM
    ARM
    +關(guān)注

    關(guān)注

    134

    文章

    9006

    瀏覽量

    366037
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    29368

    瀏覽量

    267647
  • 亞馬遜
    +關(guān)注

    關(guān)注

    8

    文章

    2612

    瀏覽量

    83025
收藏 人收藏

    評論

    相關(guān)推薦

    LM358LV與INF530N一起做1A恒流源設(shè)計時,運(yùn)放V-電壓不正確是怎么回事?

    LM358LV: 與INF530N一起做1A恒流源設(shè)計時,運(yùn)放V-電壓不正確
    發(fā)表于 07-30 07:18

    亞馬遜AWS自研AI芯片崛起,挑戰(zhàn)英偉達(dá)

    近期,據(jù)路透社獨家報道披露,在德克薩斯州奧斯汀市一處緊密防守的芯片實驗室中,六位來自亞馬遜AWS的工程師正在對一種尚未公開透露名稱及詳細(xì)參數(shù)的新型服務(wù)器展開深入測試。這一關(guān)鍵事件引人注目,因為我們
    的頭像 發(fā)表于 07-27 14:33 ?940次閱讀

    亞馬遜正測試一款融入AI芯片的新型服務(wù)器設(shè)計

    在得克薩斯州奧斯汀的秘密芯片實驗室中,亞馬遜正緊鑼密鼓地測試一款高度保密的新型服務(wù)器設(shè)計,該設(shè)計融入了亞馬遜自主研發(fā)的AI芯片,旨在與業(yè)界巨頭英偉達(dá)展開正面競爭。這一舉措由
    的頭像 發(fā)表于 07-26 14:21 ?459次閱讀

    亞馬遜云科技宣布基于自研Amazon Graviton4的Amazon EC2 R8g實例正式可用

    北京2024年7月15日?/美通社/ -- 亞馬遜云科技宣布基于自研芯片Amazon Graviton4處理器的Amazon Elastic Compute Cloud (Amazon EC2
    的頭像 發(fā)表于 07-15 16:09 ?311次閱讀

    亞馬遜網(wǎng)絡(luò)服務(wù)即將推出第四代Graviton處理器

    7月10日,雅虎財經(jīng)獨家報道了亞馬遜網(wǎng)絡(luò)服務(wù)(AWS)即將推出的重大技術(shù)進(jìn)展——其第四代Graviton處理器,即Graviton4芯片。這一重要信息由AWS的計算與人工智能產(chǎn)品管理總監(jiān)拉胡爾·庫爾卡尼在德克薩斯州奧斯汀的
    的頭像 發(fā)表于 07-10 15:51 ?518次閱讀

    亞馬遜云科技升級“3+1”合作伙伴戰(zhàn)略 與合作伙伴共赴新征程

    北京2024年5月31日?/美通社/ --?亞馬遜云科技中國合作伙伴峰會在上海召開。峰會上,亞馬遜云科技升級推出“3+1”合作伙伴戰(zhàn)略,聚焦生成式AI、專注行業(yè)和業(yè)務(wù)拓展三大業(yè)務(wù)戰(zhàn)略,
    的頭像 發(fā)表于 06-11 10:05 ?517次閱讀
    <b class='flag-5'>亞馬遜</b>云科技升級“3+<b class='flag-5'>1</b>”合作伙伴戰(zhàn)略 與合作伙伴共赴新征程

    亞馬遜云科技升級“3+1”合作伙伴戰(zhàn)略

    亞馬遜云科技近期于上海召開了盛大的中國合作伙伴峰會。在這次會議上,亞馬遜云科技正式宣布推出升級版的“3+1”合作伙伴戰(zhàn)略,旨在通過聚焦生成式AI、專注行業(yè)和業(yè)務(wù)拓展三大核心領(lǐng)域,以及提
    的頭像 發(fā)表于 06-06 10:50 ?613次閱讀

    亞馬遜推出“Project PI”提升商品質(zhì)量

    近日,亞馬遜為提升顧客滿意度,推出了創(chuàng)新性的“Project PI”(偵探項目)。該項目利用先進(jìn)的生成式AI和計算機(jī)視覺技術(shù),為商品質(zhì)量把控提供了強(qiáng)有力的支持。
    的頭像 發(fā)表于 06-06 09:20 ?293次閱讀

    亞馬遜AWS稱未停止任何英偉達(dá)芯片訂單

    針對近期關(guān)于“亞馬遜云計算部門暫停訂購英偉達(dá)Hopper芯片”的報道,亞馬遜AWS部門近日給出了明確回應(yīng)。AWS發(fā)言人表示,公司并未停止任何與英偉達(dá)相關(guān)的訂單。
    的頭像 發(fā)表于 05-22 11:39 ?477次閱讀

    亞馬遜推出電商AI工具

    亞馬遜近日宣布推出了一項創(chuàng)新的電商AI工具,該工具旨在幫助賣家們更加高效地創(chuàng)建產(chǎn)品詳情頁面。據(jù)了解,這一AI新功能具備強(qiáng)大的自動化能力,能夠基于賣家提供的關(guān)鍵詞和產(chǎn)品圖片等信息,智能地生成產(chǎn)品標(biāo)題、描述以及其他重要的詳細(xì)信息。
    的頭像 發(fā)表于 03-21 11:45 ?692次閱讀

    亞馬遜云科技在中國區(qū)域推出Amazon Network Firewall

    輕松實現(xiàn)云上工作負(fù)載保護(hù) 北京2024年3月7日 /美通社/ -- 亞馬遜云科技宣布,通過與光環(huán)新網(wǎng)和西云數(shù)據(jù)的緊密合作,在亞馬遜云科技(北京)區(qū)域和(寧夏)區(qū)域推出網(wǎng)絡(luò)防火墻服務(wù)Amazon
    的頭像 發(fā)表于 03-07 16:02 ?600次閱讀

    如何更改Cypress cyusb3.inf驅(qū)動名稱呢?

    更改了cyusb3.inf文件后,無法安裝驅(qū)動,如何才能正確的更改驅(qū)動名稱呢?
    發(fā)表于 02-27 07:44

    亞馬遜AWS的Trainium2 AI架構(gòu)

    AWS最新推出的Trainium2 AI訓(xùn)練引擎在re:Invent 2023主機(jī)上首次亮相,引起廣泛關(guān)注,通過與AWS實驗室的Gadi Hutt的交流和對技術(shù)文檔的挖掘,可以試圖深入了解Trainium2與之前Inferentia系列的關(guān)系以及對Trainium2的期望
    發(fā)表于 12-14 11:48 ?305次閱讀
    <b class='flag-5'>亞馬遜</b>AWS的Trainium2 AI架構(gòu)

    深度解讀亞馬遜AI芯片核心技術(shù)

    Trainium1 芯片于 2020 年 12 月發(fā)布,并以兩個不同的實例(Trn1 和 Trn1n)發(fā)貨。我們當(dāng)時對 Trainium
    發(fā)表于 12-06 10:04 ?706次閱讀
    深度解讀<b class='flag-5'>亞馬遜</b>AI<b class='flag-5'>芯片</b>核心技術(shù)

    亞馬遜云科技中國區(qū)域推出Amazon FSx for NetApp ONTAP

    亞馬遜云科技宣布通過與光環(huán)新網(wǎng)和西云數(shù)據(jù)的緊密合作,在北京區(qū)域和寧夏區(qū)域推出文件存儲服務(wù)Amazon FSx for NetApp ONTAP。ONTAP是NetApp的文件存儲技術(shù),被眾多客戶廣泛
    的頭像 發(fā)表于 11-14 16:08 ?525次閱讀