電子發(fā)燒友原創(chuàng) 章鷹
“美國的高端GPU對中國禁售,即使是英偉達面對中國市場供應(yīng)的A800,也是一卡難求。現(xiàn)在一些互聯(lián)網(wǎng)大廠已經(jīng)在搶英偉達2024年產(chǎn)品了,本來供需矛盾就在,今年加上ChatGPT為代表的生成式 AI 應(yīng)用引發(fā)新一輪算力需求,導(dǎo)致供需矛盾特別突出?!便尻馗呒壆a(chǎn)品總監(jiān)周彬表示。
數(shù)字時代爆發(fā)的技術(shù)變革,使得智能化加速。根據(jù) IDC 數(shù)據(jù),2023年全球高性能 AI 服務(wù)器市場規(guī)模預(yù)計達 248 億美元,年增率預(yù)計高達 27%。國產(chǎn)GPU有哪些突破?國產(chǎn)圖形處理器廠商沐曦最新帶來了哪些旗艦產(chǎn)品?本文為你詳細報道。
國產(chǎn)GPU現(xiàn)狀不容樂觀! 沐曦發(fā)力通用GPU芯片
“目前在人工智能的負載,CPU+GPU的異構(gòu)計算引領(lǐng)計算新趨勢。CPU負責(zé)邏輯控制,GPU來專職做計算;另一方面,GPU本身的迭代速度比CPU快很多。根據(jù)調(diào)研機構(gòu)IDC的數(shù)據(jù),GPU作為現(xiàn)如今通用算力的核心基礎(chǔ)設(shè)施承接了約90%的算力供應(yīng)。” 沐曦高級產(chǎn)品總監(jiān)周彬分析說,“現(xiàn)在的市場格局,基本上英偉達一家占據(jù)86%的市場份額,再加上AMD、英特爾,總計占據(jù)99%的市場,目前國產(chǎn)GPU的市場份額基本上可以忽略不計?!?br />
國產(chǎn)GPU迫在眉睫,突破之路也是任重道遠。沐曦集成電路成立于2020年9月,致力于研發(fā)具有自主知識產(chǎn)權(quán)的國產(chǎn)高性能GPU芯片及其應(yīng)用生態(tài),設(shè)計的GPU芯片將廣泛應(yīng)用于數(shù)據(jù)中心、AI以及其他需要高性能計算的行業(yè)。
“沐曦集成電路聚焦打造世界一流的GPU芯片和計算平臺,這是軟硬件的集合。英偉達最強的是GPU芯片和CUDA生態(tài)平臺結(jié)合?!?周彬指出,“沐曦自主研發(fā)了三大產(chǎn)品線,包括曦思N系列,曦云C系列和曦彩G三大系列高性能通用計算GPU及方案。曦思N系列面向AI推理,可以適用于智慧城市和視頻分析,還有視頻轉(zhuǎn)碼場景;曦云C系列是面向AI訓(xùn)練的產(chǎn)品線,面向大小模型的AI推理;曦彩G系列產(chǎn)品是帶有渲染功能的,GPU面向數(shù)據(jù)中心的大規(guī)模云端渲染,還有未來元宇宙應(yīng)用場景?!?br />
沐曦首款人工智能推理GPU曦思N100量產(chǎn)
沐曦高級產(chǎn)品總監(jiān)周彬介紹,2022年,沐熙集成電路推出了曦思N100,現(xiàn)在處于規(guī)?;慨a(chǎn)和大規(guī)模出貨狀態(tài)。
圖:曦思N100 來自沐熙官方微信
曦思N100是沐曦面向人工智能推理場景推出的高效能GPU產(chǎn)品,內(nèi)置 MXN100 異構(gòu) GPGPU 處理器以及 HBM2E 顯存,單卡算力達 160TOPS(INT8)和 80TFLOPS(FP16),能夠提供最高 128 路編碼和 96 路解碼的視頻處理能力,兼容 HEVC、H.264、AV1、AVS2 等多種視頻格式,最高支持 8K 分辨率。
同時,曦思N100配備了沐曦自主研發(fā)的MXMACA軟件棧,支持多種主流框架的網(wǎng)絡(luò)模型,其中包括簡單易用的MacaRT推理引擎、開箱即用的Model Zoo和應(yīng)用實例,同時也對主流軟件生態(tài)如FFMPEG、OpenCV等進行了兼容支持,實現(xiàn)了各類應(yīng)用場景和業(yè)務(wù)模型的快速遷移。支持應(yīng)用于智慧城市、智慧安防、智慧交通、云計算、智能視頻處理等場景。
沐曦首款面向AI訓(xùn)練和通用計算芯片曦云C500流片
周彬透露,沐曦首款面向人工智能訓(xùn)練及通用計算的旗艦產(chǎn)品曦云C500在今年6月流片,這款芯片提供強大高精度及多精度混合算力,配備大規(guī)格高帶寬顯存,片間互聯(lián)MetaXLink無縫鏈接多GPU系統(tǒng),自主研發(fā)的MXMACA軟件??杉嫒葜髁鱃PU生態(tài),能夠全面滿足大模型推理和訓(xùn)練需求。
曦云MXC500芯片已于2023年6月13日完成基礎(chǔ)測試,預(yù)計將于今年年底實現(xiàn)量產(chǎn)。
圖:曦云C500 來自沐曦官方微信
曦云C500單卡算力高達30TFlops FP32,單卡64GB HBM2E高帶寬顯存,帶寬1.8TB/s,這張卡還配備自研MetaXlink高速接口,適合于大模型訓(xùn)練。4卡既可以支持65B大模型推理,8卡可以支持130B模型推理。采用通用 GPU 架構(gòu),兼容 CUDA,預(yù)計年底規(guī)模出貨。
-
gpu
+關(guān)注
關(guān)注
27文章
4627瀏覽量
128439
發(fā)布評論請先 登錄
相關(guān)推薦
評論