0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

美光DDR5內(nèi)存配合第四代AMD EPYC處理器,提升高性能計(jì)算工作負(fù)載

Micron美光科技 ? 來(lái)源:Micron美光科技 ? 作者:美光科技 ? 2022-12-20 09:49 ? 次閱讀

美光與 AMD 聯(lián)手為客戶及數(shù)據(jù)中心平臺(tái)提供一流的用戶體驗(yàn)。雙方在奧斯汀建立聯(lián)合服務(wù)器實(shí)驗(yàn)室,以減少服務(wù)器內(nèi)存驗(yàn)證時(shí)間,在產(chǎn)品驗(yàn)證和發(fā)布期間共同進(jìn)行工作負(fù)載測(cè)試。

目前美光適用于數(shù)據(jù)中心的 DDR5 內(nèi)存和第四代 AMD EPYCTMTM (霄龍)處理器均已出貨,我們對(duì)其進(jìn)行了一些常見的高性能計(jì)算(HPC)工作負(fù)載基準(zhǔn)測(cè)試。

長(zhǎng)期以來(lái),超級(jí)計(jì)算機(jī)承擔(dān)著高性能計(jì)算工作負(fù)載。此類大規(guī)模的數(shù)據(jù)密集型工作負(fù)載需要運(yùn)行 TB 級(jí)的數(shù)據(jù)量以進(jìn)行數(shù)百萬(wàn)個(gè)并行操作,以解決人類世界的難題,如天氣和氣候預(yù)測(cè);地震建模;化學(xué)、物理和生物分析等。

隨著計(jì)算機(jī)架構(gòu)的進(jìn)步,此類工作負(fù)載往往托管在超大型“可橫向擴(kuò)展”的高性能服務(wù)器集群中。這些服務(wù)器集群需要集合最強(qiáng)大的算力、架構(gòu)、內(nèi)存和存儲(chǔ)基礎(chǔ)設(shè)施,以滿足關(guān)鍵工作負(fù)載對(duì)可擴(kuò)展性、低延遲和高性能的需求。然而隨著服務(wù)器 CPU 的性能和吞吐量不斷增長(zhǎng),DDR4 無(wú)法提供足夠的內(nèi)存帶寬,來(lái)滿足不斷增長(zhǎng)的高性能內(nèi)核。

c0d216ba-7f82-11ed-8abf-dac502259ad0.png

為緩解這一瓶頸,美光 DDR5 內(nèi)存與采用了 Zen 4 服務(wù)器架構(gòu)的第四代 AMD EPYC 處理器強(qiáng)強(qiáng)聯(lián)合,使服務(wù)器 CPU 能夠更好地匹配內(nèi)存產(chǎn)品,滿足數(shù)據(jù)密集型工作負(fù)載對(duì)性能和效率的需求。美光 DDR5 內(nèi)存可幫助企業(yè)從本地和云端數(shù)據(jù)中更快獲取洞察。我們對(duì)最新的 AMD Zen 4 96 核 CPU 和美光 DDR5 進(jìn)行了行業(yè)內(nèi)高性能計(jì)算工作負(fù)載基準(zhǔn)測(cè)試,所有結(jié)果均顯示性能提升了兩倍。

美光 DDR5 搭配第四代 AMD EPYC 處理器

在 STREAM 測(cè)試中實(shí)現(xiàn)內(nèi)存帶寬翻倍

STREAM1 是常見的基準(zhǔn)測(cè)試工具,用于測(cè)量高性能計(jì)算機(jī)的內(nèi)存帶寬,可捕獲高性能計(jì)算系統(tǒng)的峰值內(nèi)存帶寬。

該工作負(fù)載使用的軟件堆棧

● Alma 9 Linux kernel 5.14

● STREAM.f,2021 年 11 月 29 日發(fā)布版本

c10bf81c-7f82-11ed-8abf-dac502259ad0.png

測(cè)試設(shè)置

● DDR4 系統(tǒng)搭配第三代 64 核 3.7 GHz AMD EPYC 處理器;DDR4 3200 MHz 系統(tǒng)2的 RDIMM 內(nèi)存槽插滿,共 64GB

● DDR5 系統(tǒng)搭配第四代 96 核 3.7 GHz AMD EPYC 處理器;DDR5 4800 MHz 系統(tǒng)3的 RDIMM 內(nèi)存槽插滿,共 64GB

測(cè)試結(jié)果

● DDR5 系統(tǒng)每插槽內(nèi)存帶寬翻倍,達(dá)到 378 GB/s

● 該結(jié)果意味著客戶能運(yùn)行更大規(guī)模的人工智能/機(jī)器學(xué)習(xí) (AI/ML) 項(xiàng)目,或利用 DDR5 增加的內(nèi)存帶寬進(jìn)行更多高性能計(jì)算。

c135cbf6-7f82-11ed-8abf-dac502259ad0.jpg

美光 DDR5

助力天氣研究和預(yù)報(bào) (WRF)4 速度提升2倍

此次測(cè)試使用的高性能計(jì)算工作負(fù)載代碼針對(duì)天氣和氣候。WRF 模型在一些支持高性能浮點(diǎn)處理、高內(nèi)存帶寬、低延遲網(wǎng)絡(luò)等傳統(tǒng)高性能計(jì)算架構(gòu)中表現(xiàn)良好,測(cè)試對(duì)象為橫向分辨率為 2.5 公里的美國(guó)大陸地區(qū) (CONUS)。

該工作負(fù)載使用的軟件堆棧

● Alma 9 Linux kernel 5.14

● WRF 2.3.5 & 4.3.3

● Open MPI v4.1.1

測(cè)試設(shè)置

● DDR4 系統(tǒng)搭配第三代 64 核 3.7 GHz AMD EPYC 處理器;DDR4 3200 MHz 系統(tǒng)2的 RDIMM 內(nèi)存槽插滿,共 64GB

● DDR5 系統(tǒng)搭配第四代 96 核 3.7 GHz AMD EPYC 處理器;DDR5 4800 MHz 系統(tǒng)3的 RDIMM 內(nèi)存槽插滿,共 64GB

測(cè)試結(jié)果

● 美光 DDR5 搭配第四代 AMD EPYC 處理器,可實(shí)現(xiàn) 1.3567 時(shí)間步/秒 VS DDR4 系統(tǒng)的 2.8533 時(shí)間步/秒

● 速度更快意味著可使用更大的數(shù)據(jù)庫(kù)或運(yùn)行更多模型以進(jìn)行天氣預(yù)測(cè),進(jìn)而改善預(yù)測(cè)的準(zhǔn)確度。

美光 DDR5

助力 OpenFOAM5 速度提升2倍

OpenFOAM 是一種計(jì)算流體動(dòng)力學(xué) (CFD) 的開源高性能計(jì)算工作負(fù)載,廣泛應(yīng)用于多個(gè)行業(yè),有助于縮短開發(fā)時(shí)間并降低成本。從消費(fèi)類產(chǎn)品設(shè)計(jì)到航空航天設(shè)計(jì),OpenFOAM 能夠模擬不同應(yīng)用中的物理互動(dòng),包括摩托車風(fēng)擋湍流。

在該模擬中,OpenFOAM 能夠計(jì)算摩托車和騎手周圍的穩(wěn)定氣流。OpenFOAM 能夠根據(jù)用戶指定的進(jìn)程數(shù)進(jìn)行負(fù)載均衡計(jì)算,以此將網(wǎng)格分解成多個(gè)部分并分配給不同的進(jìn)程求解。求解完成后,再將網(wǎng)格和解重新組合為單個(gè)域。

該工作負(fù)載使用的軟件堆棧

● OpenFOAM CFD 軟件?(版本8),其中摩托車網(wǎng)格尺寸為:600 x 240 x 240

● Alma 9 Linux kernel 5.14

● Open MPI v4.1.1

測(cè)試設(shè)置

● DDR4 系統(tǒng)搭配第三代 64 核 3.7 GHz AMD EPYC 處理器;DDR4 3200 MHz 系統(tǒng)2的 RDIMM 內(nèi)存槽插滿,共 64GB

● DDR5 系統(tǒng)搭配第四代 96 核 3.7 GHz AMD EPYC 處理器;DDR5 4800 MHz 系統(tǒng)3的 RDIMM 內(nèi)存槽插滿,共 64GB

測(cè)試結(jié)果

測(cè)試結(jié)果表明美光 DDR5 產(chǎn)品組合將 OpenFOAM 性能提高了 2.4 倍。OpenFOAM 為五大高性能計(jì)算軟件平臺(tái)之一,擁有大型開源社區(qū)。該軟件廣泛應(yīng)用于大學(xué)和研發(fā)中心,可利用高帶寬內(nèi)存和擁有密集內(nèi)核的高性能 CPU,實(shí)現(xiàn)高度的并行操作。

美光 DDR5

助力分子動(dòng)力學(xué)6 速度提升2倍

CP2K 是一款開源量子化學(xué)工具,適用于許多應(yīng)用,包括固態(tài)生物系統(tǒng)模擬。CP2K 能夠?yàn)椴煌慕7椒ㄌ峁┩ㄓ玫目蚣?。此次測(cè)試對(duì)象為水 (H2O) 的密度泛函理論 (DFT),模擬盒子中共包含 6,144 個(gè)原子(2,048 個(gè)水分子)。

該工作負(fù)載使用的軟件堆棧

● H2O-DFT-LS.NREP4 及 H2O-DFT-LS

● Alma 9 Linux kernel 5.14

測(cè)試設(shè)置

● DDR4 系統(tǒng)搭配第三代64 核 3.7 GHz AMD EPYC 處理器;DDR4 3200 MHz 系統(tǒng)2的 RDIMM 內(nèi)存槽插滿,共 64GB

● DDR5 系統(tǒng)搭配第四代 96 核 3.7 GHz AMD EPYC 處理器;DDR5 4800 MHz 系統(tǒng)3的 RDIMM 內(nèi)存槽插滿,共 64GB

測(cè)試結(jié)果

測(cè)試結(jié)果表明美光 DDR5 產(chǎn)品組合將分子動(dòng)力學(xué)性能提高了 2.1 倍。隨著內(nèi)核數(shù)和內(nèi)存帶寬增加,此類工作負(fù)載的性能也顯著提升。

結(jié)

目前我們只針對(duì)少量高性能計(jì)算工作負(fù)載進(jìn)行了測(cè)試,因此以上只是我們的初步成果。將高性能高帶寬內(nèi)存與最新的服務(wù)器處理器(如第四代 AMD EPYC 處理器)相結(jié)合,可為高性能計(jì)算客戶創(chuàng)造新的可能。我們期待更多企業(yè)數(shù)據(jù)中心和云服務(wù)商,能夠在新平臺(tái)上應(yīng)用美光 DDR5 產(chǎn)品,解鎖更高的性能與能效。

1 我們?cè)?STREAM 基準(zhǔn)測(cè)試中配置了 25 億個(gè)向量的STREAM Benchmark——運(yùn)行在一臺(tái)單 AMD CPU 系統(tǒng)上

2 AMD DDR4 系統(tǒng)為一臺(tái) 64 核 AMD EPYC 7763 處理器, DDR4-3200 MHz 的 RDIMM 內(nèi)存槽插滿,共 64GB

3 AMD DDR5 系統(tǒng)為一臺(tái) 96 核 AMD EPYC 9654 處理器, DDR5-4800 MHz 的 RDIMM 內(nèi)存槽插滿,共 64GB

4 橫向分辨率為 12.5 公里 CONUS 的 WRF 在 DDR4 系統(tǒng)上的運(yùn)行時(shí)間為 929 秒,在 DDR5 系統(tǒng)上的運(yùn)行時(shí)間為 287 秒(均包括存儲(chǔ)器的輸入/輸出時(shí)間)。該測(cè)試中 WRF 配置為 2.5 公里 CONUS,測(cè)試結(jié)果為 1.3567 時(shí)間步/ 秒, 相比之下 DDR4 的運(yùn)行時(shí)間為 2.8533 時(shí)間步/秒。

5 針對(duì) OpenFOAM,我們運(yùn)行了三種變體:

5a:1004040 runtimes,DDR4 系統(tǒng)運(yùn)行時(shí)間為 1,144 秒,DDR5 系統(tǒng)運(yùn)行時(shí)間為 478 秒

5b:1084646 runtimes,DDR4 系統(tǒng)運(yùn)行時(shí)間為 1,633 秒,DDR5 系統(tǒng)運(yùn)行時(shí)間為 698 秒

5c:1305252 runtimes,DDR4 系統(tǒng)運(yùn)行時(shí)間為 2,522秒,DDR5 系統(tǒng)運(yùn)行時(shí)間為 1,091 秒

6 分子動(dòng)力學(xué)工作負(fù)載在 DDR4 系統(tǒng)上的運(yùn)行時(shí)間為 2,519 秒,在 DDR5 系統(tǒng)上的運(yùn)行時(shí)間為 1,242 秒

本文作者

Krishna Yalamanchi

Krishna 擔(dān)任美光生態(tài)系統(tǒng)高級(jí)開發(fā)經(jīng)理,專注于研發(fā) DDR5 和 CXL 解決方案。他曾在英特爾 IT 部門任職,領(lǐng)導(dǎo) SAP HANA 的遷移工作,通過(guò)與SI、OEM 和云服務(wù)提供商共同搭建的合作伙伴生態(tài)系統(tǒng),推出了用于 SAP 工作負(fù)載的第三代與第四代 Intel Xeon 處理器。

本文作者

Sudharshan Vazhkudai

Sudharshan S. Vazhkudai 博士擔(dān)任美光系統(tǒng)架構(gòu)和工作負(fù)載分析總監(jiān)。他領(lǐng)導(dǎo)一支位于奧斯汀和印度海得拉巴的團(tuán)隊(duì),致力于研究?jī)?nèi)存和存儲(chǔ)(DDR、CXL、HBM 和 NVME)產(chǎn)品中層次結(jié)構(gòu)的可組合性,并優(yōu)化與數(shù)據(jù)中心工作負(fù)載相關(guān)的系統(tǒng)架構(gòu)。

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    19038

    瀏覽量

    228482
  • amd
    amd
    +關(guān)注

    關(guān)注

    25

    文章

    5402

    瀏覽量

    133710
  • 美光
    +關(guān)注

    關(guān)注

    5

    文章

    706

    瀏覽量

    51379
  • DDR5
    +關(guān)注

    關(guān)注

    1

    文章

    412

    瀏覽量

    24059

原文標(biāo)題:美光 DDR5 內(nèi)存配合第四代 AMD EPYC 處理器,提升高性能計(jì)算工作負(fù)載

文章出處:【微信號(hào):gh_195c6bf0b140,微信公眾號(hào):Micron美光科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    AMD 面向嵌入式系統(tǒng)推出高能效 EPYC 嵌入式 8004 系列

    AMD 憑借其 EPYC? 嵌入式處理器不斷樹立行業(yè)標(biāo)準(zhǔn),為網(wǎng)絡(luò)、存儲(chǔ)和工業(yè)應(yīng)用提供卓越的性能、效率、連接與創(chuàng)新。今天,我們正以第四代
    發(fā)表于 10-11 13:58 ?612次閱讀

    亞馬遜網(wǎng)絡(luò)服務(wù)即將推出第四代Graviton處理器

    7月10日,雅虎財(cái)經(jīng)獨(dú)家報(bào)道了亞馬遜網(wǎng)絡(luò)服務(wù)(AWS)即將推出的重大技術(shù)進(jìn)展——其第四代Graviton處理器,即Graviton4芯片。這一重要信息由AWS的計(jì)算與人工智能產(chǎn)品管理總監(jiān)拉胡爾·庫(kù)爾卡尼在德克薩斯州奧斯汀的亞馬遜
    的頭像 發(fā)表于 07-10 15:51 ?518次閱讀

    AMD EPYC 9554處理滿足高頻率、多線程所需

    ,第四代AMD EPYC處理器家族已日臻完善,產(chǎn)品覆蓋了通用和企業(yè)計(jì)算,技術(shù)計(jì)算,云原生
    的頭像 發(fā)表于 06-29 15:26 ?991次閱讀

    Rambus通過(guò)全新PMIC系列支持多基于 DDR5高性能服務(wù)

    提供業(yè)界領(lǐng)先的 DDR5 服務(wù) PMIC,滿足AI及其他高級(jí)工作負(fù)載對(duì)最高性能與容量內(nèi)存模塊的
    的頭像 發(fā)表于 06-20 15:13 ?761次閱讀

    capsense第四代和第五在感應(yīng)模式上的具體區(qū)別是什么?

    據(jù)我所知,第五capsense相比第四代將電容(包括自電容+互電容技術(shù))和電感觸摸技術(shù)集成到了一起,snr信噪比是上一的十多倍,同時(shí)功耗僅是上一的十分之一。但是這張圖在感應(yīng)模式
    發(fā)表于 05-23 06:24

    國(guó)民技術(shù)第四代可信計(jì)算芯片NS350投入量產(chǎn)

    國(guó)民技術(shù)近日正式推出了其第四代可信計(jì)算芯片NS350 v32/v33系列,并已開始量產(chǎn)供貨。這款芯片是高性能、高安全性的TCM 2.0安全芯片,能夠滿足PC、服務(wù)平臺(tái)和嵌入式系統(tǒng)等不
    的頭像 發(fā)表于 05-13 15:17 ?1120次閱讀

    國(guó)民技術(shù)第四代可信計(jì)算芯片NS350正式投入量產(chǎn)

    2024年4月18日,國(guó)民技術(shù)第四代可信計(jì)算芯片NS350v32/v33系列產(chǎn)品正式發(fā)布并開始量產(chǎn)供貨。NS350v32/v33是一款高安全、高性能、超值可信密碼模塊2.0(TCM2.0)安全芯片
    的頭像 發(fā)表于 04-19 08:24 ?673次閱讀
    國(guó)民技術(shù)<b class='flag-5'>第四代</b>可信<b class='flag-5'>計(jì)算</b>芯片NS350正式投入量產(chǎn)

    AMD EPYC處理器:AI推理能力究竟有多強(qiáng)?

    如今,AMD EPYC處理器已經(jīng)成為最常被選擇用于AI推理的服務(wù)平臺(tái),尤其是第四代Genoa EPYC
    發(fā)表于 03-15 09:47 ?384次閱讀

    AMD第四代EPYC(霄龍)系列處理器介紹

    與上一AMD EPYC 7763處理器相比,AMD EPYC 9534
    發(fā)表于 01-29 12:25 ?1661次閱讀

    瀾起科技發(fā)布DDR5第四子代寄存時(shí)鐘驅(qū)動(dòng)芯片

    瀾起科技,這一在內(nèi)存技術(shù)領(lǐng)域具有領(lǐng)先地位的公司,近日發(fā)布了一款引人注目的新產(chǎn)品——DDR5第四子代寄存時(shí)鐘驅(qū)動(dòng)芯片(DDR5 RCD04)
    的頭像 發(fā)表于 01-07 16:28 ?828次閱讀

    Rambus 通過(guò)業(yè)界首款第四代 DDR5 RCD 提升數(shù)據(jù)中心服務(wù)性能

    第四季度開始向主要 DDR5 內(nèi)存模塊 (RDIMM) 制造商提供樣品。Rambus 第四代 RCD 將數(shù)據(jù)傳輸速率提高到 7200 MT/s,設(shè)立了新的
    的頭像 發(fā)表于 12-28 11:21 ?476次閱讀

    AMD EPYC 8004系列處理器實(shí)現(xiàn)卓越性能

    算力時(shí)代,需求多種多樣,企業(yè)需要針對(duì)不同業(yè)務(wù)場(chǎng)景,匹配多元化算力,從而獲得更高的效率。作為芯片制造商,AMD的產(chǎn)品路線圖與行業(yè)需求密切相關(guān),隨著第四代 AMD EPYC
    的頭像 發(fā)表于 12-04 15:07 ?712次閱讀
    <b class='flag-5'>AMD</b> <b class='flag-5'>EPYC</b> 8004系列<b class='flag-5'>處理器</b>實(shí)現(xiàn)卓越<b class='flag-5'>性能</b>

    AMD Instinct加速、AMD EPYC處理器為Microsoft帶來(lái)全新AI和計(jì)算能力

    AMD Instinct加速將為針對(duì)AI進(jìn)行優(yōu)化的全新Microsoft Azure虛擬機(jī)系列提供動(dòng)力 — — 第四代AMD EPYC
    的頭像 發(fā)表于 12-04 13:54 ?550次閱讀

    AMD EPYC 9554處理器參數(shù)分析

    AMD EPYC 9554處理器?是第四代AMD EPYC
    發(fā)表于 11-20 16:36 ?1456次閱讀
    <b class='flag-5'>AMD</b> <b class='flag-5'>EPYC</b> 9554<b class='flag-5'>處理器</b>參數(shù)分析

    AMD擴(kuò)展其第三AMD EPYC處理器家族并推出6款全新產(chǎn)品

    CPU套件滿足那些希望充分利用現(xiàn)有平臺(tái)經(jīng)濟(jì)效益的企業(yè)完成通用IT計(jì)算和主流計(jì)算的需求。完整的第三AMD EPYC CPU家族是對(duì)最新
    的頭像 發(fā)表于 11-11 10:37 ?1242次閱讀