0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AMD的翻身仗

SEMIEXPO半導(dǎo)體 ? 來源:SEMIEXPO半導(dǎo)體 ? 2023-07-13 16:58 ? 次閱讀

今年6月,AMD發(fā)布了一款專門針對AI需求的最新芯片:Instinct MI300。

MI300將CPU、GPU和內(nèi)存封裝在了一起,晶體管數(shù)量高達(dá)1460億個,接近英偉達(dá)H100的兩倍。其搭載的HBM(高帶寬內(nèi)存)密度也達(dá)到了H100的2.4倍。也就是說,MI300在理論上可以運(yùn)行比H100更大的AI模型。

受益于AI訓(xùn)練的增長,GPU需求肉眼可見的從游戲市場向高性能計算領(lǐng)域傾斜,就連剛開啟GPU產(chǎn)品線的英特爾,也迫不及待的PPT首發(fā)了面向高性能計算場景的Falcon Shores架構(gòu)芯片。

伴隨英偉達(dá)一路沖向萬億美元市值,資本市場對GPU行業(yè)老二的期待值也達(dá)到了頂峰。今年以來,AMD股價累計上漲已經(jīng)超過90%。

英特爾的Falcon Shores,預(yù)計2024年推出

然而MI300發(fā)布會結(jié)束,AMD股價下跌3.6%,反倒是英偉達(dá)上漲3.9%。資本市場表達(dá)好惡,向來是這么冷酷無情。

原因可能在于,AMD沒有在發(fā)布會中透露這款芯片的客戶,這也是市場對英偉達(dá)以外的AI芯片最大的擔(dān)心。

長期以來,AMD在GPU市場一直被英偉達(dá)按在地上反復(fù)摩擦,Instinct產(chǎn)品線其實(shí)已經(jīng)迭代了好幾年,但相比英偉達(dá)的連戰(zhàn)連捷,AMD在高性能計算領(lǐng)域的存在感一直比較稀薄。

AI訓(xùn)練打開的市場空間,一度被市場視為AMD與英偉達(dá)拉進(jìn)距離的機(jī)會,但事情似乎沒那么簡單。

離不開CPU,但離得開英特爾

雖說在AI訓(xùn)練上,更擅長大規(guī)模并行計算的GPU承擔(dān)了大部分計算工作,而整個系統(tǒng)仍需要CPU進(jìn)行調(diào)度和統(tǒng)籌。也就是說,盡管GPU的需求量大幅度增加,但CPU仍是必需品。

作為一家同時擁有CPU和GPU設(shè)計能力的芯片公司,AMD被看好也不意外。更何況過去幾年,AMD在CPU市場連戰(zhàn)連捷。

AMD現(xiàn)任CEO蘇姿豐在2014年接手,時值推土機(jī)架構(gòu)性能孱弱,讓英特爾心安理得的擠牙膏。而在賣掉Imageon后,AMD和拒絕為蘋果設(shè)計iPhone芯片的英特爾一起,完美錯過了智能手機(jī)的浪潮,公司一片風(fēng)雨飄搖。

面臨多條戰(zhàn)線的失血,蘇姿豐只能將有限的資源集中在核心的CPU業(yè)務(wù)上,從蘋果請回了架構(gòu)大師吉姆·凱勒,開始Zen架構(gòu)處理器的研發(fā)。

2017年,Zen架構(gòu)處理器橫空出世,把擠牙膏上癮的英特爾打了個措手不及。2019年,Zen處理器更換為臺積電7nm工藝,此時英特爾10nm工藝姍姍來遲。

雖然英特爾還占據(jù)著大部分市場份額,但AMD的反攻速度實(shí)在太快,尤其是在服務(wù)器市場,幾乎是從0殺到了接近20%的市占率。

2023年Q1,AMD的x86處理器市場份額達(dá)到了34.6%這一歷史峰值[2],這也是AMD市值超過英特爾的重要背景。

d7488aec-1fcc-11ee-962d-dac502259ad0.png

今年5月,全球超級計算機(jī)Top500強(qiáng)公布:前500強(qiáng)中,使用AMD CPU進(jìn)行驅(qū)動的超算達(dá)到121臺,使用英特爾CPU的超算則從2016年的454臺下降至360臺,雖然看著不少,但其中很多是英特爾10年前的家底——至強(qiáng)(Xeon)處理器[3]。

但同一時期,AMD與英偉達(dá)差距也越來越大。

難以逾越的CUDA

英偉達(dá)不僅是一流的硬件公司,更是一流的軟件公司。

雖然在理論性能上,MI300的一些參數(shù)甚至領(lǐng)先于英偉達(dá),但市場對英偉達(dá)對手們最大的擔(dān)心往往在于,就算硬件性能可以跟英偉達(dá)比肩,但是軟件解決方案仍難以與英偉達(dá)的CUDA對抗。

2006年,英偉達(dá)推出了CUDA平臺,讓開發(fā)者能夠給予GPU進(jìn)行編程和開發(fā),最終形成了一個龐大穩(wěn)固的生態(tài)。在推出CUDA之前,全球能用GPU進(jìn)行編程的不足100人,目前CUDA的使用者超過400萬。

每一個成功的硬件公司背后,往往都有一個更強(qiáng)大的軟件團(tuán)隊(duì),蘋果和英偉達(dá)都是如此。即便是***制造商ASML也不例外,他們的官方網(wǎng)站上有這樣一段話:

您可能將ASML視為一家硬件公司,但實(shí)際上我們擁有世界上最大、最具開創(chuàng)性的軟件社區(qū)之一。如果沒有我們開發(fā)的軟件,我們的客戶就不可能制造出10納米或更小的尺寸的芯片。

想要芯片真正在具體場景的滿足各種需求,就需要開發(fā)者對硬件進(jìn)行編程以實(shí)現(xiàn)各種功能。如果說硬件編程的過程相當(dāng)于進(jìn)行各種復(fù)雜計算,那么CUDA就是提供給使用者的一部計算器。

無論對英偉達(dá)的刀法多么懷恨在心,都不能否認(rèn)黃仁勛對通用計算和人工智能的超前押注。

AMD顯然深知軟件和生態(tài)的重要性,但對標(biāo)CUDA的ROCm在2016年推出時,就已經(jīng)比英偉達(dá)晚了十年。

直到2023年4月,ROCm都僅支持Linux平臺;而CUDA自問世以來,就提供Windows和Linux兩個版本,后期還為蘋果用戶增設(shè)Mac OS版本。

相比英偉達(dá)不遺余力的推廣和洗腦,AMD在生態(tài)建設(shè)上也顯得投入不足,據(jù)說早年英偉達(dá)對項(xiàng)目的GPU試用申請幾乎是有求必應(yīng),動不動就去高校實(shí)驗(yàn)室發(fā)顯卡。深度學(xué)習(xí)大神杰夫·辛頓帶著學(xué)生訓(xùn)練AlexNet模型,就用了三塊GTX 580。

另外,AMD的軟件能力也令人不安——AMD在今年6月發(fā)布了一份EPYC 7002 “Rome”服務(wù)器芯片指南,承認(rèn)由于時鐘倒計時器存在 BUG,導(dǎo)致第二代EPYC芯片運(yùn)行1044天后,會出現(xiàn)內(nèi)核卡死。如果有服務(wù)器使用這款芯片,需要每隔2.93年重新啟動一次。

原因也不難理解,直到推出ROCm的2016年,AMD甚至還沒擺脫虧損。在這期間,AMD只能把有限的資源都聚焦在CPU的研發(fā)上,無法為GPU部門投入太多資源,更不要說ROCm的軟件團(tuán)隊(duì)了。

而當(dāng)AMD在CPU市場收復(fù)失地,希望依靠AI卷土重來時,英偉達(dá)已經(jīng)慢慢補(bǔ)齊了短板。

英偉達(dá)的反攻

2020年9月,英偉達(dá)宣布準(zhǔn)備以400億美元的價格準(zhǔn)備收購移動CPU架構(gòu)商Arm,其背后意圖人盡皆知:一方面是整合移動端資源,另一方面則是入局CPU。

正如前文所說,盡管AI時代需要更多的GPU,但CPU仍不可或缺。當(dāng)CPU與GPU共同在服務(wù)器中的工作時,實(shí)際場景更像是一個大學(xué)生(CPU)帶領(lǐng)一群小學(xué)生(GPU)組隊(duì)完成各種任務(wù)。這個時候,配合就顯得尤為重要。

因此,英偉達(dá)之所以自己做CPU,并非完全因?yàn)橛⑻貭柣駻MD,而是從自身產(chǎn)品需求出發(fā),使CPU和GPU緊密耦合,以發(fā)揮最大性能。比如CPU和GPU中,需要用到盡可能相似技術(shù)的一致內(nèi)存,以保證數(shù)據(jù)之間的無縫共享[8]。

雖然收購基本沒有成功的可能性,但英偉達(dá)依然按部就班的招兵買馬。2021年4月,黃仁勛在自家廚房里宣布,英偉達(dá)即將推出首款5nm制程工藝CPU Grace,基于Arm架構(gòu),面向超大型 AI 模型的和高性能計算。

緊接著就是具體工作的有序展開:英偉達(dá)首先選定了根據(jù)地以色列,那里有全球第三多的納斯達(dá)克上市公司(僅次于美國和中國);然后對外招聘600名硬件工程師、軟件工程師和芯片設(shè)計師,搭建CPU研發(fā)團(tuán)隊(duì)[7]。

最后,英偉達(dá)挖來了英特爾在以色列的CPU架構(gòu)專家Rafi Marom,后者曾參與10nm制程的Tiger Lake和Alder lake芯片開發(fā)工作。

在2022年3月的GTC大會上,英偉達(dá)對外宣布Grace CPU性能:擁有144個Arm內(nèi)核和1TB/s的內(nèi)存帶寬,性能較當(dāng)前最先進(jìn)的DGX A100搭載的雙CPU相比高1.5倍以上。

不過,原本預(yù)計在今年上半年可以開始供貨的Grace芯片,目前已推遲至下半年。

APU

InstinctMI300本質(zhì)上是一顆“APU”,這是AMD早在2009年提出的一個概念——將CPU和GPU集成在一起,使得二者高速互聯(lián),實(shí)現(xiàn)1+1>2的效果。

在2006年收購了GPU公司ATI后,AMD成為了當(dāng)時唯一同時擁有CPU和GPU設(shè)計能力的芯片公司,而且在兩個市場都是行業(yè)老二——但壞消息是,市場主流玩家也就兩個。

在這種局面下,AMD希望借助APU打開市場局面。2011年,第一代APU推出后,AMD持續(xù)宣傳APU是“x86架構(gòu)三十年來的最大革命”,并向投資者強(qiáng)調(diào),這款產(chǎn)品存在著“強(qiáng)勁且被壓抑”的需求。

市場最初也對APU概念充滿期待,結(jié)果2012年Q3財報出爐,AMD收入下滑25%,順便減記了1億美元的庫存——APU需求量并不高,芯片根本賣不出去[1]。緊接著,公司股價跌到1.86美元的歷史性低點(diǎn),蘇姿豐臨危受命,開始掌舵風(fēng)雨飄搖中的AMD。

APU的優(yōu)勢在于,由于CPU和GPU集成在了一起,數(shù)據(jù)傳輸效率得到了大幅度提高。蘋果的M1 Ultra也采用了類似的“把幾個小芯片拼成一塊大芯片”的思路,換來了更強(qiáng)的數(shù)據(jù)吞吐能力。

但在2009年,APU的理念顯得過于超前。

一方面,APU涉及芯片的先進(jìn)封裝技術(shù),在當(dāng)時既不成熟,成本也難以控制。另一方面,APU在需求高度多元化的消費(fèi)市場很難行得通。

比如10種型號的CPU和GPU,理論上有100種組合方案,這就導(dǎo)致做10種方案無法滿足市場需求,做100種方案難以收回生產(chǎn)成本。

因此在很長一段時間里,APU只能在PS4游戲機(jī)這類高度標(biāo)準(zhǔn)化的產(chǎn)品上才能找到市場。但深度學(xué)習(xí)的大爆發(fā)改變了這一點(diǎn)。

相比游戲和渲染,AI訓(xùn)練對算力和數(shù)據(jù)吞吐效率的需求成百上千倍的增加,目前針對AI市場推出的芯片產(chǎn)品,除了算力的堆砌,往往都采用3D堆疊和先進(jìn)封裝等方式,增加數(shù)據(jù)傳輸?shù)男?,這與APU的優(yōu)勢不謀而合。

英特爾尚未正式發(fā)布的Falcon Shores,同樣采用了將CPU、GPU、內(nèi)存封裝在一起的思路,只不過英特爾將其稱為“XPU”。

但目前來看,最接近這個目標(biāo)的反而是英偉達(dá)的Grace Hopper芯片。

英偉達(dá)的Grace Hopper將CPU和GPU集成在了一起

尾聲

在2009年APU的概念被提出時,AMD正經(jīng)歷公司歷史上的最低谷,APU多少有些畢功一役的憋大招成分。

但也正是因?yàn)樘幱诘凸龋瑢?dǎo)致AMD無法拿出足夠的資金與技術(shù)支持,讓APU的革命性理念真正落地,最終只變成了簡單的CPU+GPU的組合。

從商業(yè)角度看,最適合在2009年搞點(diǎn)革命性產(chǎn)品的反而是富可敵國的英特爾,但英特爾當(dāng)時在干什么呢——心安理得的擠牙膏,同時拒絕為iPhone設(shè)計芯片。

這似乎是高科技公司常常會出現(xiàn)的狀況——在鼎盛年代忽視新的技術(shù)浪潮,在低谷期如夢方醒倉促憋大招。

事實(shí)上,英特爾還嘗試過“聯(lián)A抗N”——2017年,英特爾宣布將在自家CPU上集成AMD的GPU,合作推出新的芯片。

結(jié)果沒過多久,英特爾就挖走了AMD的核心技術(shù)負(fù)責(zé)人之一:圖形主管Raja Koduri,為英特爾開發(fā)高端獨(dú)立GPU。





審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    19032

    瀏覽量

    228446
  • amd
    amd
    +關(guān)注

    關(guān)注

    25

    文章

    5402

    瀏覽量

    133703
  • 英特爾
    +關(guān)注

    關(guān)注

    60

    文章

    9816

    瀏覽量

    171114
  • AI芯片
    +關(guān)注

    關(guān)注

    17

    文章

    1842

    瀏覽量

    34790

原文標(biāo)題:AMD的翻身仗

文章出處:【微信號:Smart6500781,微信公眾號:SEMIEXPO半導(dǎo)體】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    蘋果翻身:AI功能現(xiàn)身,免費(fèi)的ChatGPT,怒了的馬斯克

    主屏幕自定義、visionOS、iPadOS 18、macOS 15等,這場活動帶來了諸多更新。其中,“王炸”要數(shù)Apple Intelligence個人化智能系統(tǒng),這也被業(yè)內(nèi)認(rèn)為是蘋果至關(guān)重要的一場“翻身仗”。 蘋果AI功能面世:跨APP聯(lián)動、支持第三方應(yīng)用 2024年,AI的競爭進(jìn)入新的階段
    的頭像 發(fā)表于 06-12 09:06 ?2932次閱讀
    蘋果<b class='flag-5'>翻身</b>之<b class='flag-5'>仗</b>:AI功能現(xiàn)身,免費(fèi)的ChatGPT,怒了的馬斯克

    AMD Vivado Design Suite 2024.1全新推出

    AMD Vivado Design Suite 2024.1 可立即下載。最新版本支持全新 AMD MicroBlaze V 軟核處理器,并針對 QoR 和 Dynamic Function
    的頭像 發(fā)表于 09-18 09:41 ?358次閱讀

    如何維修一張電腦顯卡型號是amd的rx580 燒壞的部位?

    大家好!我在維修一張電腦顯卡型號是amd的rx580 燒壞的部位是一個電感情況如下圖 我覺得應(yīng)該用飛線方法補(bǔ)焊盤再接電感 但是一直找不到1伏的兩個相連的元器件
    發(fā)表于 09-13 03:07

    ALINX出席AMD Partner Summit

    日前, AMD 在其總部所在地——美國加州圣何塞舉辦了合作伙伴峰會。此次 AMD Partner Summit 將 AMD 的 Premier Partner Summit(首要合作伙伴峰會)及 ATP Summit(官方授權(quán)培
    的頭像 發(fā)表于 08-29 14:38 ?381次閱讀

    使用STM32F407ZGT6的設(shè)備無法連接到AMD處理器的電腦上,怎么處理?

    使用貴公司的STM32芯片,型號:STM32F407ZGT6。CAN總線轉(zhuǎn)串口,可以正常連接到英特爾處理器的電腦上;但是無法連接到AMD處理器的電腦上。請問怎么處理? 連接到AMD處理器的電腦上,串口顯示如下:
    發(fā)表于 07-23 07:58

    AMD推出全新AMD銳龍和EPYC處理器,擴(kuò)大數(shù)據(jù)中心和PC領(lǐng)域領(lǐng)先地位

    ——下一代?AMD EPYC?處理器將擴(kuò)大數(shù)據(jù)中心?CPU?的領(lǐng)先地位 ——全新?AMD?銳龍?AI 300?系列筆記本電腦和?AMD?銳龍?9000?系列臺式機(jī)處理器為?Copilot+ PC
    的頭像 發(fā)表于 06-04 19:21 ?913次閱讀
    <b class='flag-5'>AMD</b>推出全新<b class='flag-5'>AMD</b>銳龍和EPYC處理器,擴(kuò)大數(shù)據(jù)中心和PC領(lǐng)域領(lǐng)先地位

    AMD HYPR-RX支持AMD幀生成技術(shù),助力即刻提升游戲性能

    AMD Fluid Motion Frames(AFMF)—AMD幀生成技術(shù),助力AMD Radeon用戶在數(shù)千款DirectX 11和DirectX 12游戲中,使用幀插值技術(shù)來提高幀速率,以帶來出色的游戲性能
    的頭像 發(fā)表于 03-15 11:35 ?4250次閱讀
    <b class='flag-5'>AMD</b> HYPR-RX支持<b class='flag-5'>AMD</b>幀生成技術(shù),助力即刻提升游戲性能

    AMD宣布AMD Radeon RX 7900 GRE顯卡全球發(fā)售

    今天,AMD宣布AMD Radeon RX 7900 GRE顯卡在全球同步上市發(fā)售,該顯卡致力于為玩家提供高刷新率的2K游戲及更佳的流媒體體驗(yàn)。
    的頭像 發(fā)表于 03-07 10:25 ?851次閱讀

    AMD市值首次突破3000億美元

    AMD的市值首次突破了3000億美元,這一里程碑式的成就得益于該公司股價的大幅上漲。上周四,AMD的股價上漲了9.1%,使得其市值首次突破了3000億美元。相較于去年10月的低點(diǎn),AMD的股價已經(jīng)上漲了一倍多。
    的頭像 發(fā)表于 03-04 11:25 ?782次閱讀

    AMD收盤市值站上3100億美元

    AMD收盤市值站上3100億美元 受益人工智能的熱炒,相關(guān)的科技股股價大幅上漲,周四晚間美股AMD股價大幅上漲9%,AMD收盤時市值站上3100億美元。 截止周四收盤,AMD股價高達(dá)1
    的頭像 發(fā)表于 03-01 14:18 ?492次閱讀

    ARM股價4日暴漲1.3倍 孫正義靠Arm打了一場翻身仗

    ARM股價4日暴漲1.3倍 孫正義靠Arm打了一場翻身仗 在2月7日至2月12日間的短短三個交易日內(nèi),Arm股價上漲逾90%。在Arm公布了2024財年第三財季財報數(shù)據(jù)后,ARM股價4日暴漲1.3倍
    的頭像 發(fā)表于 02-18 15:22 ?1176次閱讀

    值得入手的AMD Radeon 顯卡推薦—— AMD Radeon RX 7900 XT

    結(jié)合5nm和6nm工藝節(jié)點(diǎn),采用先進(jìn)的小芯片(Chiplets)設(shè)計,全新的計算單元和第二代AMD高速緩存技術(shù),相比AMD RDNA 2架構(gòu)的每瓦性能提高54%;
    的頭像 發(fā)表于 01-04 16:27 ?1135次閱讀
    值得入手的<b class='flag-5'>AMD</b> Radeon 顯卡推薦—— <b class='flag-5'>AMD</b> Radeon RX 7900 XT

    AMD Radeon RX 7000系列移動顯卡介紹

    AMD Radeon RX 7000系列移動顯卡是專門為移動游戲平臺和高級內(nèi)容創(chuàng)建打造的卓越筆記本電腦顯卡,采用統(tǒng)一的AMD RDNA 3計算單元,支持人工智能加速的視頻編碼和硬件加速AV1編碼
    的頭像 發(fā)表于 12-12 11:19 ?1322次閱讀

    AMD Instinct加速器、AMD EPYC處理器為Microsoft帶來全新AI和計算能力

    AMD Instinct加速器將為針對AI進(jìn)行優(yōu)化的全新Microsoft Azure虛擬機(jī)系列提供動力 — — 第四代AMD EPYC處理器現(xiàn)在還被用于運(yùn)行新一代通用、內(nèi)存密集型和計算優(yōu)化型
    的頭像 發(fā)表于 12-04 13:54 ?546次閱讀

    使用 PCIE 更新 AMD ZYNQ? 的 QSPI Flash 參考設(shè)計

    簡介 AMD ZYNQ? 7000 的 S_AXI 端口提供了外設(shè)訪問 PS 內(nèi)部外設(shè)控制器的接口,這其中包括 4 個 S_AXI_HP 端口以及兩個 S_AXI_GP 端口。一般來說,可以訪問
    發(fā)表于 11-30 18:49