AI芯片大戰(zhàn)已經(jīng)轉(zhuǎn)向新的戰(zhàn)場。
通過提供訓練AI模型這一極其復雜的工作所必需的芯片,英偉達將自身打造成了一家市值達2萬億美元的公司。隨著該行業(yè)的快速發(fā)展,更大的機遇將是銷售讓這些模型在訓練后運行的芯片,為生成式AI工具迅速擴大的公司和個人使用者提供大量文本和圖像。
眼下,這種轉(zhuǎn)變正在為英偉達的火爆銷售錦上添花。該公司首席財務官Colette Kress上周表示,在去年收入超過470億美元的英偉達數(shù)據(jù)中心業(yè)務中,逾40%是用于部署AI系統(tǒng),而非訓練AI模型。這一比例是首個顯示轉(zhuǎn)變正在進行的重要跡象。
Kress的評論緩解了一些人關(guān)于轉(zhuǎn)向部署AI系統(tǒng)的芯片會威脅到英偉達地位的擔憂,這些擔憂源于與那些讓英偉達成為AI熱潮領頭羊的芯片相比,AI系統(tǒng)進行的所謂 “推理”工作可以用性能較低、成本更低的芯片來完成。
“有一種看法認為,英偉達在推理功能領域的份額將低于訓練功能領域,”Melius Research的分析師Ben Reitzes在客戶報告中說?!笆聦嵡闆r有助于揭示英偉達從即將到來的推理爆炸中獲益的能力?!?/p>
英偉達的許多競爭對手都認為,隨著推理功能芯片變得越來越重要,它們在AI市場上會獲得更好的發(fā)展機會。
英特爾認為,隨著客戶著眼于降低AI模型的運營成本,英特爾的芯片將越來越具有吸引力。英特爾擅長制造的芯片類型已經(jīng)廣泛應用于推理功能,而英偉達的尖端且更昂貴的H100 AI芯片在執(zhí)行推理工作方面則并未發(fā)揮至關(guān)重要的作用。
英特爾首席執(zhí)行官帕特·基辛格(Pat Gelsinger)在去年12月的一次采訪中表示:“推理芯片的經(jīng)濟效益在于,不需要去構(gòu)建4萬美元的H100環(huán)境,因為那太耗電,并且需要搭配新的管理和安全模型以及新的IT基礎設施。”他說,“如果我能在標準的(英特爾芯片)上運行那些模型,那就簡單好辦了?!?/p>
美國銀行的分析師Vivek Arya說,從英偉達上周三公布的財報來看,透露出的最重要信息可能就是行業(yè)向推理芯片的轉(zhuǎn)變。英偉達的財季業(yè)績超出了華爾街的預期,推動該股在上周攀升8.5%,令公司估值達到約2萬億美元。
Arya說,對AI模型訓練的投資激增后,隨著重點轉(zhuǎn)向從AI模型中創(chuàng)收,芯片推理功能的重要性將上升。與英偉達主導的AI訓練功能相比,推理芯片可能更具競爭力。
推理相關(guān)業(yè)務的增長速度可能比早先預期的要快。今年年初,瑞銀分析師估計,90%的芯片需求來自訓練,到明年推理將僅占市場的20%。這些分析師在一份報告中說,英偉達約40%的數(shù)據(jù)中心收入來自推理,這個數(shù)字超出了他們的預期。
英偉達上周三的財報顯示,該公司在AI芯片市場的份額尚未受到真正挑戰(zhàn)。目前英偉達的AI芯片市場份額超過80%。在可預見的未來,英偉達用于訓練AI系統(tǒng)的芯片預計仍將保持較高需求。
在訓練AI系統(tǒng)的過程中,公司通過其模型運行海量數(shù)據(jù),教它們預測語言,從而生成類似于人類的表達。這項工作對算力要求很高,而英偉達的GPU非常適合這項工作。
除了英特爾和Advanced Micro Devices等英偉達的老牌競爭對手外,一些AI芯片初創(chuàng)公司也可能會隨著推理功能日漸重要而嶄露頭角。
初創(chuàng)公司SambaNova將AI芯片和軟件結(jié)合在一起,可以進行推理和訓練?!拔覀兛吹轿覀兊耐评碛美诒ㄊ皆鲩L,”該公司首席執(zhí)行官SambaNova表示,“人們開始意識到,80%以上的成本將用于推理,我需要尋找替代解決方案?!?/p>
由前谷歌AI芯片工程師Jonathan Ross創(chuàng)立的初創(chuàng)公司Groq近幾個月來的吸引力激增,此前該公司主頁上的一個演示展示了其推理芯片如何快速地從一個大語言模型中生成響應。Ross說,該公司現(xiàn)有計劃是今年部署4.2萬塊自家芯片,明年將部署100萬塊,但公司正在考慮將今年的部署數(shù)量增加到22萬塊,明年增加到150萬塊。
Ross說,推動該公司考慮改變計劃的一個因素是,一些最先進的AI系統(tǒng)正在進行調(diào)整,以便在不重新訓練的情況下做出更好的響應,這會將更多的計算工作推向推理。Ross說,與英偉達或其他芯片公司的產(chǎn)品相比,Groq的專業(yè)芯片運行速度快得多、成本也低得多。
“對于推理,你能部署什么取決于成本,”Ross表示?!坝泻芏嗄P涂梢栽诠雀杞邮苡行в柧殻渲写蠹s80%都沒有得到部署,原因是投入生產(chǎn)的成本太高?!?/p>
包括Meta、微軟、Alphabet旗下谷歌和亞馬遜公司在內(nèi)的科技巨頭一直在努力開發(fā)內(nèi)部推理芯片,因為它們意識到即將到來的轉(zhuǎn)變以及能夠以更低成本進行推理的好處。
以亞馬遜為例,該公司云計算部門數(shù)據(jù)和機器學習副總裁Swami Sivasubramanian去年表示,亞馬遜從2018年起就開始研發(fā)推理芯片,推理占其Alexa智能助手運算成本的40%。
英偉達則希望在向推理過渡的過程中保持領先地位。去年,英偉達即將推出的一款芯片在一次重要的AI推理基準測試中取得了行業(yè)領先的成績,延續(xù)了該公司多年來在該競爭中的優(yōu)勢地位。
2023年12月,AMD發(fā)布了新的AI芯片,稱其推理性能優(yōu)于英偉達的芯片,隨后英偉達在一篇博文中回擊了這一說法。英偉達稱,AMD提到了其芯片有更好的推理性能,但是AMD的測試沒有使用優(yōu)化軟件,而如果在使用優(yōu)化軟件的同等測試條件下,英偉達芯片的推理速度將會是AMD的兩倍。
審核編輯:黃飛
評論
查看更多