0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

亞馬遜宣布推出全新的AI訓(xùn)練芯片AWS Trainium

我快閉嘴 ? 來源:半導(dǎo)體行業(yè)觀察綜合 ? 作者:半導(dǎo)體行業(yè)觀察綜 ? 2020-12-02 15:21 ? 次閱讀

在近日舉辦的re:Invent開發(fā)人員大會上,AWS宣布推出全新的AI訓(xùn)練芯片AWS Trainium,這是該公司用于訓(xùn)練機(jī)器學(xué)習(xí)模型的下一代定制芯片。該公司承諾,通過對TensorFlow,PyTorch和MXNet的支持,它可以提供比云中任何競爭對手更高的性能。

據(jù)亞馬遜方面介紹,AWS Trainium是由AWS設(shè)計的第二個定制的 機(jī)器學(xué)習(xí)(ML)芯片,為在云中訓(xùn)練ML模型提供最佳的性價比。除了提供最具成本效益的ML訓(xùn)練外,Trainium還為云中的ML提供了最高的性能和最大的萬億次運算(TFLOPS)計算能力,并支持更廣泛的ML應(yīng)用。

從他們提供的數(shù)據(jù)可以看到,亞馬遜新芯片與標(biāo)準(zhǔn)的AWS GPU實例相比,帶來了30%的吞吐量提升,并將每次使用成本降低了45%。

亞馬遜指出,Trainium芯片專門針對深度學(xué)習(xí)培訓(xùn)工作負(fù)載進(jìn)行了優(yōu)化,適用于圖像分類,語義搜索,翻譯,語音識別,自然語言處理和推薦引擎等應(yīng)用。

按照亞馬遜的說法,隨著ML的使用加速,我們迫切需要通過推理和訓(xùn)練來提高性能并降低基礎(chǔ)架構(gòu)成本。去年,AWS推出了AWS Inferentia,這是一種定制芯片,可為客戶提供云中最低成本的高性能ML推理。雖然Inferentia解決了推理成本,即使該成本占ML基礎(chǔ)架構(gòu)成本的90%,但許多開發(fā)團(tuán)隊也還受到固定ML訓(xùn)練預(yù)算的限制。這限制了改進(jìn)模型和應(yīng)用程序所需的培訓(xùn)范圍和頻率。AWS Trainium通過為云中的ML培訓(xùn)提供最高的性能和最低的成本來應(yīng)對這一挑戰(zhàn)。借助Trainium和Inferentia,客戶將擁有從擴(kuò)展培訓(xùn)工作量到部署加速推理的ML計算的端到端流程。

亞馬遜進(jìn)一步指出,AWS Trainium與AWS Inferentia共享相同的AWS神經(jīng)元SDK,這就方便Inferentia開發(fā)人員開始使用Trainium。由于Neuron SDK已與包括TensorFlow,PyTorch和MXNet在內(nèi)的流行ML框架集成在一起,因此開發(fā)人員可以通過最少的代碼更改輕松地從基于GPU的實例遷移到AWS Trainium。

據(jù)介紹,AWS Trainium可通過Amazon EC2實例和AWS Deep Learning AMI以及包括Amazon SageMaker,Amazon ECS,EKS和AWS Batch在內(nèi)的托管服務(wù)使用。

因為沒有基準(zhǔn)測試結(jié)果,所以我們尚不清楚Trainium的性能在與Google的張量處理單元(TPU)進(jìn)行比較時,誰更厲害。后者是Google托管在Google Cloud Platform中的AI訓(xùn)練工作負(fù)載的芯片。谷歌表示,即將推出的第四代TPU提供的矩陣乘法萬億次運算能力是第三代TPU的兩倍以上。(矩陣通常用于表示輸入到AI模型的數(shù)據(jù)。)它還提供了“顯著”的內(nèi)存帶寬提升,同時受益于互連技術(shù)的進(jìn)步。

過去,機(jī)器學(xué)習(xí)的部署受到算法的大小和速度以及對昂貴硬件的需求的限制。實際上, 麻省理工學(xué)院的一份報告發(fā)現(xiàn),機(jī)器學(xué)習(xí)可能正在接近計算極限。一項單獨的Synced 研究估計,華盛頓大學(xué)的Grover假新聞檢測模型在大約兩周內(nèi)花費了25,000美元進(jìn)行訓(xùn)練。據(jù)報道,OpenAI花費了高達(dá)1200萬美元來訓(xùn)練其GPT-3語言模型,而Google估計花費了6,912美元來訓(xùn)練BERT,這是一種雙向轉(zhuǎn)換器模型,可為11種自然語言處理任務(wù)重新定義最先進(jìn)的技術(shù)。

隨著企業(yè)需求的增長,Amazon越來越傾向于轉(zhuǎn)向AI和機(jī)器學(xué)習(xí)訓(xùn)練以及推理服務(wù)。根據(jù)一項估計,2017年全球機(jī)器學(xué)習(xí)市場的價值為15.8億美元,預(yù)計到2024年將達(dá)到208.3億美元。11月,亞馬遜宣布將Alexa和Rekognition的部分計算轉(zhuǎn)移到Inferentia支持的實例上,旨在使工作更快,更便宜,同時將其從Nvidia芯片上移開。當(dāng)時,該公司聲稱將部分Alexa工作轉(zhuǎn)移到Inferentia,從而使延遲時間縮短了25%,而成本卻降低了30%。
責(zé)任編輯:tzh

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 芯片
    +關(guān)注

    關(guān)注

    452

    文章

    50005

    瀏覽量

    419706
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8323

    瀏覽量

    132183
  • 亞馬遜
    +關(guān)注

    關(guān)注

    8

    文章

    2613

    瀏覽量

    83035
收藏 人收藏

    評論

    相關(guān)推薦

    亞馬遜推新,阿里達(dá)摩院退出,融資規(guī)模大幅下滑后量子計算還是好生意嗎?

    電子發(fā)燒友網(wǎng)報道(文/吳子鵬)在亞馬遜的“AWS re:Invent 2023”活動中,其云計算部門AWS宣布推出兩款新的自研
    的頭像 發(fā)表于 11-30 00:12 ?2920次閱讀
    <b class='flag-5'>亞馬遜</b>推新,阿里達(dá)摩院退出,融資規(guī)模大幅下滑后量子計算還是好生意嗎?

    亞馬遜云科技與甲骨文合作推出新服務(wù)

    近日,亞馬遜云科技(Amazon Web Services,簡稱AWS)與甲骨文(Oracle)宣布了一項重大合作,共同推出了Oracle Database@Amazon Web Se
    的頭像 發(fā)表于 10-08 14:57 ?275次閱讀

    英特爾與亞馬遜AWS深化合作,共謀數(shù)十億美元定制芯片計劃

    英特爾與亞馬遜云計算巨頭AWS宣布了一項重大的長期戰(zhàn)略合作協(xié)議,該協(xié)議涉及數(shù)十億美元的投資,旨在通過定制芯片設(shè)計加速人工智能(AI)應(yīng)用并優(yōu)
    的頭像 發(fā)表于 09-18 16:31 ?740次閱讀

    亞馬遜AWS自研AI芯片崛起,挑戰(zhàn)英偉達(dá)

    近期,據(jù)路透社獨家報道披露,在德克薩斯州奧斯汀市一處緊密防守的芯片實驗室中,六位來自亞馬遜AWS的工程師正在對一種尚未公開透露名稱及詳細(xì)參數(shù)的新型服務(wù)器展開深入測試。這一關(guān)鍵事件引人注目,因為我們
    的頭像 發(fā)表于 07-27 14:33 ?943次閱讀

    亞馬遜AWS稱未停止任何英偉達(dá)芯片訂單

    針對近期關(guān)于“亞馬遜云計算部門暫停訂購英偉達(dá)Hopper芯片”的報道,亞馬遜AWS部門近日給出了明確回應(yīng)。AWS發(fā)言人表示,公司并未停止任何
    的頭像 發(fā)表于 05-22 11:39 ?480次閱讀

    亞馬遜推出電商AI工具

    亞馬遜近日宣布推出了一項創(chuàng)新的電商AI工具,該工具旨在幫助賣家們更加高效地創(chuàng)建產(chǎn)品詳情頁面。據(jù)了解,這一AI新功能具備強(qiáng)大的自動化能力,能夠
    的頭像 發(fā)表于 03-21 11:45 ?697次閱讀

    亞馬遜AWS將投資超50億美元在墨西哥建立數(shù)據(jù)中心集群

    亞馬遜網(wǎng)絡(luò)服務(wù)(AWS)墨西哥公司近日宣布,隨著企業(yè)對新技術(shù)的廣泛采用和云服務(wù)需求的日益增長,公司計劃投資超過50億美元在墨西哥建立一個全新的數(shù)據(jù)中心集群。該決策標(biāo)志著
    的頭像 發(fā)表于 02-28 10:31 ?397次閱讀

    亞馬遜推出生成式AI購物助手Rufus

    亞馬遜公司宣布推出全新的生成式AI工具,旨在幫助改善客戶的在線購物體驗。這款AI助手被命名為Ru
    的頭像 發(fā)表于 02-03 13:53 ?637次閱讀

    亞馬遜AWSTrainium2 AI架構(gòu)

    AWS最新推出Trainium2 AI訓(xùn)練引擎在re:Invent 2023主機(jī)上首次亮相,引起廣泛關(guān)注,通過與
    發(fā)表于 12-14 11:48 ?306次閱讀
    <b class='flag-5'>亞馬遜</b><b class='flag-5'>AWS</b>的<b class='flag-5'>Trainium</b>2 <b class='flag-5'>AI</b>架構(gòu)

    深度解讀亞馬遜AI芯片核心技術(shù)

    Trainium1 芯片于 2020 年 12 月發(fā)布,并以兩個不同的實例(Trn1 和 Trn1n)發(fā)貨。我們當(dāng)時對 Trainium1 和2021 年 12 月的這些實例進(jìn)行了盡可能多的分析,坦率地說,
    發(fā)表于 12-06 10:04 ?712次閱讀
    深度解讀<b class='flag-5'>亞馬遜</b><b class='flag-5'>AI</b><b class='flag-5'>芯片</b>核心技術(shù)

    亞馬遜再發(fā)兩款自研芯片,訓(xùn)練芯片時隔三年迎來更新

    電子發(fā)燒友網(wǎng)報道(文/周凱揚)在今年的AWS re:Invent上,云服務(wù)巨頭亞馬遜公開了兩款全新的自研芯片,一是基于Arm架構(gòu)的新一代Gravition CPU,Gravition4
    的頭像 發(fā)表于 11-30 00:09 ?1471次閱讀

    NVIDIA 為部分大型亞馬遜 Titan 基礎(chǔ)模型提供訓(xùn)練支持

    本文將介紹亞馬遜如何使用 NVIDIA NeMo 框架、GPU 以及亞馬遜云科技的 EFA 來訓(xùn)練其 最大的新一代大語言模型(LLM)。 大語言模型的一切都很龐大——巨型模型是在數(shù)千顆 NVIDIA
    的頭像 發(fā)表于 11-29 21:15 ?482次閱讀
    NVIDIA 為部分大型<b class='flag-5'>亞馬遜</b> Titan 基礎(chǔ)模型提供<b class='flag-5'>訓(xùn)練</b>支持

    AWS推出AWS設(shè)計的AWS Trainium2芯片系列

    一年多來,我們一直期待Amazon Web Services在今年的re:Invent大會上為其本土服務(wù)器推出 Graviton4 處理器。
    的頭像 發(fā)表于 11-29 17:30 ?1071次閱讀
    <b class='flag-5'>AWS</b><b class='flag-5'>推出</b>由<b class='flag-5'>AWS</b>設(shè)計的<b class='flag-5'>AWS</b> <b class='flag-5'>Trainium</b>2<b class='flag-5'>芯片</b>系列

    亞馬遜云科技推出8門全新的免費課程,幫助成年人提升AI和生成式AI技能

    提供免費人工智能(AI)技能培訓(xùn)和教育資源。亞馬遜云科技計劃通過推出新的人工智能課程和學(xué)習(xí)計劃以及擴(kuò)展現(xiàn)有項目來兌現(xiàn)這一承諾。作為該目標(biāo)的一部分,亞馬遜云科技
    的頭像 發(fā)表于 11-24 13:54 ?464次閱讀

    亞馬遜宣布AI就緒”新計劃,到2025年向200萬人提供免費AI技能培訓(xùn)

    新的人工智能課程和學(xué)習(xí)計劃以及擴(kuò)展現(xiàn)有項目來兌現(xiàn)這一承諾。作為該目標(biāo)的一部分,亞馬遜宣布推出8門全新的免費課程,幫助成年人提升AI和生成式
    發(fā)表于 11-22 13:41 ?226次閱讀