0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

超算硝煙再起,CPU+GPU還能玩出新花樣?

21克888 ? 來源:電子發(fā)燒友網 ? 作者:周凱揚 ? 2022-02-24 09:33 ? 次閱讀
從去年11月公布的最新TOP500超算系統(tǒng)排名上,我們可以看出AMD已經開始蠶食原本屬于英特爾的份額,而且速度不容小覷。而英偉達則因為在GPU上的頭號交椅地位,成了堅持所有堅持CPU+GPU架構超算的首選。

非但如此,英偉達開始在ARM生態(tài)上有所動作,推出了Grace這樣的高性能CPU,并被瑞士超算中心的超級計算機系統(tǒng)阿爾卑斯所用。然而近來的一系列動向表明,超算市場并不會就此維持定局。

英特爾:GPU和異構開始猛追

英特爾耕耘了這么多年HPC和超算市場,自然不會白白認輸,尤其是自己的圖形部門正在崛起的情況下。于是,就在上周的投資者大會上,英特爾公布了全新的HPC-AI超算策略,以CPU+GPU融合在同一個Xeon插槽的設計,由此推出全新的XPU,代號名為FalconShores。

FalconShores將融合通用x86處理器核心和高度并行計算的Xe-HPC GPU核心,并結合英特爾自研的高帶寬共享內存。根據(jù)英特爾的說法,這種CPU+GPU+通用內存的架構可以將單個插槽的計算密度提升5倍,與現(xiàn)有的設計相比,可將性能功耗比提升5倍以上。
FalconShoresXPU / 英特爾

這對于英特爾目前的戰(zhàn)略來說,基本上可以說是必選的一條技術路線??紤]到英特爾在先進封裝技術上并未止步,工藝節(jié)點也開始跟上主流代工廠的節(jié)奏,異構計算的設計已經在英特爾近期推出的諸多產品中得到了驗證,通用內存也已經在業(yè)界成了改善延遲提高帶寬的常用手段之一。況且英特爾已經在其Sapphire Rapids Xeon服務器處理器上用到了HBM2e這類高帶寬內存,F(xiàn)alconShores中自研的高帶寬內存會有何等性能確實令人好奇。

FalconShores的另一大優(yōu)勢在與靈活的核心配比,根據(jù)工作負載來調整x86核心與Xe核心。英特爾在會上不斷給出十萬億億級的概念,這樣的性能在FalconShores的性能下似乎是可行的,不過這一XPU正式進入超算市場的時間不會太快,而是要等到2024年,借助那時的埃米級工藝和Foveros封裝技術才能實現(xiàn)。

英偉達:不放棄ARM,也不放棄互聯(lián)

前陣子英偉達收購ARM失敗的消息傳來,不少人認為英偉達會就此放棄這塊蛋糕,然而英偉達CEO黃仁勛卻表示他們并不會就此放棄ARM生態(tài),未來將繼續(xù)推出Grace這樣基于ARM架構的CPU。之所以能有如此的底氣,在于英偉達那20年的ARM架構授權。

目前擁有ARM架構授權的企業(yè)屈指可數(shù),更不用說64位的授權,并將其用于HPC市場了。英偉達如今這種ARM CPU+GPU的路線,看似是在搶英特爾和AMD的生意,但面向的市場其實又有所不同。
GraceCPU /英偉達

Grace雖然性能不差,但與這些x86 CPU在通用計算上相比還是略遜一籌,況且也不是所有研究機構或超算中心都會像日本一樣,構建富岳或紫藤花這種規(guī)模的ARM超算。英偉達追求的并不是在通用計算上超過其他兩家數(shù)十年的積累,而是專注于AI算力。訓練自然語言處理模型、利用GPU加速深度學習,這才是英偉達的優(yōu)勢所在。

這時問題來了,為何超算不選擇其它通用CPU或其它的GPU產品呢?這樣既能兼顧通用計算性能,也能用的GPU的加速性能。這是因為英偉達準備了專用于自家CPU和GPU的互聯(lián)技術NVLink。過去僅有GPU產品的英偉達僅僅將NVLink技術用于GPU之間的互聯(lián),如今在Grace出現(xiàn)后,NVLink4.0可以為GraceCPU和英偉達GPU牽線搭橋。

更不用說英偉達已經在2020年收購了Mellanox,要知道在最新的TOP500超算中,除了使用常規(guī)的25/100G以太網互聯(lián)外,基本都用到了Mellanox的互聯(lián)技術。英偉達與Mellanox的結合,直接覆蓋了三分之二的頂級超算系統(tǒng)。未來的NVLink有了Mellanox的幫忙更是難以匹敵,所以并不是英偉達擔心競品的出現(xiàn),而是其性能表現(xiàn)之強,讓你不得不選擇他們旗下的產品。

小結

英特爾在超算上的發(fā)力歸根結底還是靠XeHPC這樣的GPU核心,但作為GPU新秀的英特爾短時間還是無法撼動英偉達在超算上的地位。而英偉達的ARM計劃未來如何演進也令人十分期待,畢竟這一產品線不像其消費級GPU,還未有任何路線圖公布。但喜人的一點是,超算從百億億級過渡到十萬億億級的過程中,勢必會有更多的創(chuàng)新方案出現(xiàn)。
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • cpu
    cpu
    +關注

    關注

    68

    文章

    10769

    瀏覽量

    210425
  • gpu
    gpu
    +關注

    關注

    27

    文章

    4631

    瀏覽量

    128440
  • 超算
    +關注

    關注

    1

    文章

    114

    瀏覽量

    9032
收藏 人收藏

    評論

    相關推薦

    【「力芯片 | 高性能 CPU/GPU/NPU 微架構分析」閱讀體驗】--全書概覽

    本帖最后由 1653149838.791300 于 2024-10-16 22:19 編輯 感謝平臺提供的書籍,厚厚的一本,很有分量,感謝作者的傾力付出成書。 本書主要講力芯片CPU
    發(fā)表于 10-15 22:08

    名單公布!【書籍評測活動NO.43】 力芯片 | 高性能 CPU/GPU/NPU 微架構分析

    這個想法被否決了,因為投入較大、難以落地,且客戶對力的認同遠不及今天這種高度。 這幾年間其實我們聯(lián)系甚少,但是作者一直沒有脫離對芯片的應用和關注。特別是目睹GPU從消費電子轉向力芯片,目睹
    發(fā)表于 09-02 10:09

    商用清潔賽道,普渡清潔機器人如何玩出新花樣?

    商用清潔賽道,普渡清潔機器人如何玩出新花樣? 前言 每次技術革命,都將對傳統(tǒng)模式帶來顛覆性改變。 目前,我國產業(yè)結構正進入快速升級階段,智能制造春潮涌動,各行各業(yè)正在經歷一輪智能化轉型升級的變革
    的頭像 發(fā)表于 08-14 10:21 ?329次閱讀

    力服務器為什么選擇GPU

    隨著人工智能技術的快速普及,力需求日益增長。智中心的服務器作為支撐大規(guī)模數(shù)據(jù)處理和計算的核心設備,其性能優(yōu)化顯得尤為關鍵。而GPU服務器也進入了大眾的視野,成為高性能計算的首選。那么,為什么
    的頭像 發(fā)表于 07-25 08:28 ?389次閱讀
    <b class='flag-5'>算</b>力服務器為什么選擇<b class='flag-5'>GPU</b>

    AI服務器異構計算深度解讀

    AI服務器按芯片類型可分為CPU+GPU、CPU+FPGA、CPU+ASIC等組合形式,CPU+GPU是目前國內的主要選擇(占比91.9%)。
    發(fā)表于 04-12 12:27 ?508次閱讀
    AI服務器異構計算深度解讀

    “捷智”正式入駐國家互聯(lián)網平臺

    ABSTRACT摘要2024年4月2日,本公司旗下力服務品牌“捷智”正式入駐國家互聯(lián)網平臺,開設云gpu旗艦店。我們將借助國家
    的頭像 發(fā)表于 04-12 08:26 ?405次閱讀
    “捷智<b class='flag-5'>算</b>”正式入駐國家<b class='flag-5'>超</b><b class='flag-5'>算</b>互聯(lián)網平臺

    gpu是什么和cpu的區(qū)別

    GPUCPU是兩種常見的計算機處理器,它們在結構和功能上有很大的區(qū)別。在這篇文章中,我們將探討GPUCPU的區(qū)別,并詳細介紹它們的原理、應用領域和性能特點。 一、概述 1.1
    的頭像 發(fā)表于 02-20 11:24 ?1.8w次閱讀

    OpenAI發(fā)布首個文生視頻模型Sora

    開發(fā)出熱門聊天機器人ChatGPT后,OpenAI繼續(xù)在生成式人工智能上玩出新花樣
    的頭像 發(fā)表于 02-19 13:56 ?932次閱讀

    為什么GPUCPU更快?

    GPUCPU更快的原因并行處理能力:GPU可以同時處理多個任務和數(shù)據(jù),而CPU通常只能一次處理一項任務。這是因為GPU的架構使得它可以同時
    的頭像 發(fā)表于 01-26 08:30 ?2019次閱讀
    為什么<b class='flag-5'>GPU</b>比<b class='flag-5'>CPU</b>更快?

    GPU是顯卡嗎 cpugpu哪個力強

    GPU(圖形處理器)是顯卡(顯像處理器)的一種,它是一種專門用于圖形計算的處理器。顯卡是計算機中的一個重要組件,負責處理和渲染圖形,使它們能夠在顯示屏上顯示出來。GPUCPU在計算原理和結構上有
    的頭像 發(fā)表于 01-10 15:45 ?4796次閱讀

    一款單芯片UWB IC,讓汽車超寬帶應用玩出新花樣!

    恩智浦官網精彩導覽 NCJ29D6單芯片UWB 下一代的汽車UWB解決方案會是什么樣?從恩智浦新近推出的Trimension NCJ29D6超寬帶IC身上,你一定能夠找到答案。這個完全集成的汽車單芯片UWB系列,結合了下一代安全精確的實時定位功能和短程雷達功能,可通過單個系統(tǒng)解決多個用例,包括安全汽車門禁、兒童存在檢測、入侵警報、手勢識別等。進入NCJ29D6官網,了解詳情—— Trimension NCJ29D6產品官網 Trimension NCJ29D6是一款完全集成的單芯片脈沖無線超寬帶低能耗收發(fā)器
    的頭像 發(fā)表于 12-15 16:25 ?869次閱讀
    一款單芯片UWB IC,讓汽車超寬帶應用<b class='flag-5'>玩出新花樣</b>!

    淺談DPU和CPUGPU的關系

    CPU的一大部分力卸載給GPU之后,人們發(fā)現(xiàn)可以把很多其他功能也外包出去,于是又有了智能網卡,或者叫做DPU。
    發(fā)表于 12-14 11:44 ?750次閱讀
    淺談DPU和<b class='flag-5'>CPU</b>、<b class='flag-5'>GPU</b>的關系

    大模型驅動AI服務器行業(yè)報告

    AI服務器按芯片類型可分為CPU+GPU、CPU+FPGA、CPU+ASIC等組合形式,CPU+GPU是目前國內的主要選擇(占比91.9%);AI服務器的成本主要來自
    發(fā)表于 11-28 09:18 ?216次閱讀
    大模型<b class='flag-5'>算</b>驅動AI服務器行業(yè)報告

    散熱設計玩出新花樣,功率半導體器件再也不怕‘發(fā)燒’了!

    功率半導體器件是電子電力轉換領域的核心元器件,廣泛應用于變頻、整流、逆變、放大等電路。封裝工藝對于功率半導體器件的性能、可靠性和成本具有重要影響。本文將介紹功率半導體器件的典型封裝工藝,包括引腳插入、塑封、散熱設計等關鍵環(huán)節(jié)。
    的頭像 發(fā)表于 11-23 11:12 ?634次閱讀
    散熱設計<b class='flag-5'>玩出新花樣</b>,功率半導體器件再也不怕‘發(fā)燒’了!

    CPUGPU和內存知識科普

    本文內容包括CPU、內存和GPU知識,本期重點更新GPUCPU部分知識。比如:GPU更新包括架構演進,最新產品A100、選型策略、架構分析
    的頭像 發(fā)表于 11-13 11:47 ?1733次閱讀
    <b class='flag-5'>CPU</b>、<b class='flag-5'>GPU</b>和內存知識科普