0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

英特爾推云端AI芯片 擬聯(lián)手國內(nèi)廠商開發(fā)AI服務(wù)器

科創(chuàng)板日報(bào) ? 來源:科創(chuàng)板日報(bào) ? 2023-07-13 11:41 ? 次閱讀

英特爾在中國推出云端AI訓(xùn)練芯片Habana Gaudi2,該芯片可滿足大規(guī)模語言模型、多模態(tài)模型及生成式AI模型的需求。

7月11日,英特爾在中國市場推出云端AI訓(xùn)練芯片——Habana Gaudi2。該芯片可滿足大規(guī)模語言模型、多模態(tài)模型及生成式AI模型的需求。據(jù)現(xiàn)場介紹,該芯片性能在一些關(guān)鍵指標(biāo)上勝過英偉達(dá)A100。

據(jù)了解,該Gaudi2處理器及Gaudi2夾層卡HL-225B,以第一代Gaudi高性能架構(gòu)為基礎(chǔ),具有24個(gè)可編程Tensor處理器核心(TPCs)。

每顆芯片集成了21個(gè)專用于內(nèi)部互聯(lián)的100Gbps(RoCEv2 RDMA以太網(wǎng)接口,配備配置96GB HBM高速內(nèi)存及2.4TB/秒的總內(nèi)存帶寬,滿足大規(guī)模語言模型、多模態(tài)模型及生成式AI模型的需求。

據(jù)現(xiàn)場介紹,英特爾Gaudi2運(yùn)行ResNet-50的每瓦性能約是英偉達(dá)A100的2倍,運(yùn)行1760億參數(shù)BLOOMZ模型的每瓦性能約達(dá)A100的1.6倍。

在發(fā)布會(huì)上,浪潮信息高級副總裁、AI和HPC總經(jīng)理劉軍現(xiàn)場發(fā)布搭載Gaudi2的新一代AI服務(wù)器NF5698G7。

目前,英特爾已與浪潮信息合作,打造基于Gaudi2深度學(xué)習(xí)加速器的AI服務(wù)器NF5698G7。該服務(wù)器集成了8顆Gaudi2加速卡HL-225B,還包含雙路第四代英特爾至強(qiáng)可擴(kuò)展處理器,支持AMX/DSA等AI加速引擎。當(dāng)日,該款A(yù)I服務(wù)器也正式發(fā)布。

浪潮信息高級產(chǎn)品經(jīng)理王磊強(qiáng)調(diào),NF5698G7是專為面向生成式AI市場開發(fā)的新一代AI服務(wù)器,支持8顆OAM高速互聯(lián)的Gaudi2加速器,將為AI客戶提供大模型訓(xùn)練和推理能力。

新華三集團(tuán)計(jì)算存儲(chǔ)產(chǎn)品線副總裁劉宏程表示,基于英特爾Gaudi2 AI加速器,新華三正與英特爾合作,開發(fā)適合大模型訓(xùn)練和推理的高性能AI服務(wù)器。

同時(shí),超聚變數(shù)字技術(shù)有限公司算力基礎(chǔ)設(shè)施領(lǐng)域總裁唐啟明指出,超聚變將與英特爾,共同推出基于Gaudi2的全新產(chǎn)品與解決方案。

此前,英特爾中國區(qū)董事長王銳在接受《科創(chuàng)板日報(bào)》記者采訪時(shí)指出,ChatGPT浪潮帶來計(jì)算需求的大幅度提升,目前正與包括百度、阿里等在內(nèi)的中國的客戶開展共同研究。王銳透露,不管是高性能的計(jì)算還是分布式的計(jì)算,都已經(jīng)進(jìn)行了布局。

一位英特爾技術(shù)專家《科創(chuàng)板日報(bào)》記者分享了英特爾在大模型領(lǐng)域的布局情況。在訓(xùn)練層面,針對CPU、GPU、IPU、Habana等異構(gòu)計(jì)算,英特爾用oneAPI以及XPU平臺來提供更多的選擇。在推理方面,第四代Sapphire Rapids發(fā)布后,基于AMX加速器,可在行業(yè)中解決80%以上的客戶推理需求。同時(shí),也充分利用CPU,包括用于訓(xùn)練的Ponte Vecchio,和用于推理的Arctic Sound等。

伴隨著大模型的熱潮,云計(jì)算的商業(yè)模式正朝著MaaS(模型即服務(wù))的方向演進(jìn),其所帶來的算力需求也值得關(guān)注。

“它的理念是利用預(yù)訓(xùn)練模型,對行業(yè)數(shù)據(jù)進(jìn)行訓(xùn)練,從而形成針對特定場景的、面向各行業(yè)的細(xì)分模型。我們知道通用模型的參數(shù)量非常大,例如GPT-3可達(dá)到1750億,部署這些模型會(huì)比較麻煩,因此,可能需要對大模型進(jìn)行蒸餾和壓縮,形成行業(yè)可部署的模型?!鄙鲜黾夹g(shù)專家稱。

此外,把大模型進(jìn)行私有化部署是不少行業(yè)的潛在需求。“很多細(xì)分行業(yè)不接受SaaS服務(wù),尤其金融等行業(yè)。因此,英特爾正在探討如何把這個(gè)模型小型化之后,在本土落地做私有化部署,使其真正在行業(yè)落地?!?/p>

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 英特爾
    +關(guān)注

    關(guān)注

    60

    文章

    9826

    瀏覽量

    171148
  • 云計(jì)算
    +關(guān)注

    關(guān)注

    39

    文章

    7678

    瀏覽量

    137032
  • AI芯片
    +關(guān)注

    關(guān)注

    17

    文章

    1846

    瀏覽量

    34803
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    2225

    瀏覽量

    2262

原文標(biāo)題:欲與英偉達(dá)決高下?英特爾推云端AI芯片 擬聯(lián)手國內(nèi)廠商開發(fā)AI服務(wù)器

文章出處:【微信號:chinastarmarket,微信公眾號:科創(chuàng)板日報(bào)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    Inflection AI攜手英特爾推出企業(yè)級AI系統(tǒng)

    近日,AI初創(chuàng)企業(yè)Inflection AI英特爾聯(lián)合宣布了一項(xiàng)重大合作——推出基于英特爾Gaudi 3 AI加速
    的頭像 發(fā)表于 10-09 16:40 ?298次閱讀

    英特爾調(diào)降明年AI服務(wù)器芯片出貨目標(biāo)

    近日,有消息稱英特爾為應(yīng)對內(nèi)部策略調(diào)整及終端需求變化,已對其旗下AI服務(wù)器芯片Gaudi 3的明年出貨目標(biāo)進(jìn)行了大幅調(diào)整。
    的頭像 發(fā)表于 10-08 15:38 ?193次閱讀

    IBM Cloud將部署英特爾Gaudi 3 AI芯片

    近日,科技巨頭IBM與英特爾宣布了一項(xiàng)重大合作計(jì)劃,雙方將共同在IBM Cloud平臺上部署英特爾最新的Gaudi 3 AI芯片,預(yù)計(jì)該服務(wù)
    的頭像 發(fā)表于 09-03 15:52 ?315次閱讀

    軟銀與英特爾AI芯片合作計(jì)劃告吹

    近日,科技界傳來消息,軟銀集團(tuán)與英特爾公司關(guān)于共同開發(fā)人工智能(AI芯片的合作計(jì)劃以失敗告終。據(jù)悉,雙方曾計(jì)劃攜手生產(chǎn)AI
    的頭像 發(fā)表于 08-16 17:46 ?861次閱讀

    軟銀與英特爾AI芯片合作談判破裂,合作計(jì)劃告終

    8月15日最新消息,英國《金融時(shí)報(bào)》披露,軟銀集團(tuán)與英特爾之間的秘密會(huì)談未能如愿達(dá)成,原本旨在聯(lián)手開發(fā)能夠與英偉達(dá)一較高下的AI芯片項(xiàng)目宣告
    的頭像 發(fā)表于 08-15 16:04 ?457次閱讀

    從運(yùn)動(dòng)員到開發(fā)者: 英特爾以開放式AI系統(tǒng)應(yīng)對多重挑戰(zhàn)

    打造的生成式AI(GenAI)檢索增強(qiáng)生成(RAG)解決方案。該成果深度展示了英特爾如何通過基于英特爾?至強(qiáng)?處理英特爾??Gaudi
    的頭像 發(fā)表于 07-25 09:28 ?227次閱讀
    從運(yùn)動(dòng)員到<b class='flag-5'>開發(fā)</b>者: <b class='flag-5'>英特爾</b>以開放式<b class='flag-5'>AI</b>系統(tǒng)應(yīng)對多重挑戰(zhàn)

    英特爾CEO:AI時(shí)代英特爾動(dòng)力不減

    英特爾CEO帕特·基辛格堅(jiān)信,在AI技術(shù)的飛速發(fā)展之下,英特爾的處理仍能保持其核心地位?;粮窆_表示,摩爾定律仍然有效,而英特爾在處理
    的頭像 發(fā)表于 06-06 10:04 ?339次閱讀

    英特爾推出中國市場“特供版芯片”Gaudi 3

    英特爾計(jì)劃在中國市場推出“特供版”Gaudi 3 AI芯片,這一決策主要是基于美國對于AI芯片的出口管制政策。
    的頭像 發(fā)表于 04-16 14:48 ?485次閱讀

    英特爾宣布AI PC加速計(jì)劃新增兩項(xiàng)AI舉措

    首先,“AI PC 開發(fā)者計(jì)劃”面向軟件研發(fā)人員和獨(dú)立軟件開發(fā)商,為他們提供便捷的開發(fā)環(huán)境,助力加速大規(guī)模運(yùn)用新型 AI技術(shù)。此計(jì)劃包含一系
    的頭像 發(fā)表于 03-27 16:03 ?316次閱讀

    第五代英特爾至強(qiáng)處理,AI特化的通用服務(wù)器CPU

    ? 電子發(fā)燒友網(wǎng)報(bào)道(文/周凱揚(yáng))隨著AI已經(jīng)成了數(shù)據(jù)中心與服務(wù)器市場的主流應(yīng)用,就連通用服務(wù)器CPU,也開始著重加強(qiáng)AI計(jì)算能力。為此,英特爾
    的頭像 發(fā)表于 03-18 08:14 ?4027次閱讀
    第五代<b class='flag-5'>英特爾</b>至強(qiáng)處理<b class='flag-5'>器</b>,<b class='flag-5'>AI</b>特化的通用<b class='flag-5'>服務(wù)器</b>CPU

    英特爾:2025年將為1億AI PC提供核心處理

    英特爾客戶端計(jì)算部門副總David Feng指出,預(yù)計(jì)今年供應(yīng)4000萬臺AI PC芯片,并于2025年底增加至6000萬臺,即占據(jù)2025年全球個(gè)人電腦市場預(yù)計(jì)總量的20%以上。在AI
    的頭像 發(fā)表于 02-29 09:43 ?564次閱讀

    英特爾宣布進(jìn)軍汽車AI芯片市場

    英特爾將發(fā)布推出了一系列AI軟件定義汽車系統(tǒng)芯片(SDV SoC),在車用芯片市場與高通和英偉達(dá)展開競爭。
    的頭像 發(fā)表于 01-12 11:33 ?782次閱讀

    AI 無處不在,英特爾酷睿Ultra 和第五代英特爾至強(qiáng)可擴(kuò)展處理正式發(fā)布

    英特爾 ?酷睿?Ultra處理和第五代英特爾 ? 至強(qiáng) ? 可擴(kuò)展處理支持的AI產(chǎn)品亮相,展現(xiàn)了英特
    的頭像 發(fā)表于 12-16 16:05 ?650次閱讀
    <b class='flag-5'>AI</b> 無處不在,<b class='flag-5'>英特爾</b>酷睿Ultra 和第五代<b class='flag-5'>英特爾</b>至強(qiáng)可擴(kuò)展處理<b class='flag-5'>器</b>正式發(fā)布

    英特爾放大招:AI芯片服務(wù)器齊登場

    與此同時(shí),英特爾用于筆記本電腦和臺式電腦的酷睿Ultra處理將讓個(gè)人電腦擁有直接運(yùn)行人工智能應(yīng)用的功能??犷ltra內(nèi)置AI加速引擎,即被稱為NPU的神經(jīng)網(wǎng)絡(luò)處理單元,可更快地運(yùn)行AI
    的頭像 發(fā)表于 12-15 17:10 ?784次閱讀
    <b class='flag-5'>英特爾</b>放大招:<b class='flag-5'>AI</b><b class='flag-5'>芯片</b>和<b class='flag-5'>服務(wù)器</b>齊登場

    英特爾新處理,掀AI PC戰(zhàn)火

    隨著ai時(shí)代的到來,英特爾正在構(gòu)想新的酷睿Ultra處理(代號Meteor Lake),這是英特爾的第一個(gè)基于npu的處理,旨在在pc上
    的頭像 發(fā)表于 12-11 11:26 ?880次閱讀