0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

什么是CXL協(xié)議

jf_78858299 ? 來源:Hack電子 ? 作者:Hack電子 ? 2023-02-21 15:06 ? 次閱讀

2001年,英特爾公布了第三代I/O技術(shù)——3GIO技術(shù)(后更名為PCI Express,即PCIe),以高性能、高擴(kuò)展性、高可靠性及出色的兼容性取代了包括AGP和PCI在內(nèi)所有的內(nèi)部總線并且不斷升格。例如,2019年5月底公布的PCIe 5.0,其以32Gb/s的單通道帶寬與32GT/s(Giga Transmission per second)每通道數(shù)據(jù)傳輸速率,滿足了現(xiàn)今絕大多數(shù)的需求。但應(yīng)對數(shù)據(jù)TB級增長、異構(gòu)計算大行其道的當(dāng)下,PCIe在內(nèi)存使用效率、延遲和數(shù)據(jù)吞吐量等方面,已經(jīng)面臨壓力。

二十年后,在如今這個數(shù)據(jù)爆炸式增長,異構(gòu)計算大行其道的當(dāng)下,曾經(jīng)的“未來之星“PCI-e 已經(jīng)開始出現(xiàn)后繼無人的現(xiàn)象,無法成為 CPUGPU、FPGA 以及其他 AI 計算設(shè)備之間溝通的橋梁。為了達(dá)到最佳的計算效果,我們越來越期待一種以內(nèi)存為中心的、富有變革性的新技術(shù)出現(xiàn),基于PCI-e協(xié)議的CXL技術(shù)便在此環(huán)境下出世。

2019年,英特爾推出的CXL技術(shù)似乎殺出了重圍。短短幾年時間,CXL便成為業(yè)界公認(rèn)的先進(jìn)設(shè)備互聯(lián)標(biāo)準(zhǔn),其最為強(qiáng)勁的競爭對手Gen-Z、OpenCAPI都紛紛退出了競爭,并將Gen-Z協(xié)議、OpenCAPI協(xié)議轉(zhuǎn)讓給CXL。

1、**什么是CXL?**

CXL全稱為Compute Express Link,作為一種全新的開放式互聯(lián)技術(shù)標(biāo)準(zhǔn),其能夠讓CPU與GPU、FPGA或其他加速器之間實現(xiàn)高速高效的互聯(lián),從而滿足高性能異構(gòu)計算的要求,并且其維護(hù)CPU內(nèi)存空間和連接設(shè)備內(nèi)存之間的一致性??傮w而言,其優(yōu)勢高度概括在極高兼容性和內(nèi)存一致性兩方面上。

** 2、CXL 協(xié)議**

CXL 標(biāo)準(zhǔn)定義了 3 個協(xié)議,這些協(xié)議在通過標(biāo)準(zhǔn) PCIe 5.0 PHY 以 32 GT/s 傳輸之前一起動態(tài)復(fù)用:

CXL.io 協(xié)議本質(zhì)上是經(jīng)過一定改進(jìn)的 PCIe 5.0 協(xié)議,用于初始化、鏈接、設(shè)備發(fā)現(xiàn)和列舉以及寄存器訪問。它為 I/O 設(shè)備提供了非一致的加載/存儲接口。

CXL.cache 協(xié)議定義了主機(jī)和設(shè)備之間的交互,允許連接的 CXL 設(shè)備使用請求和響應(yīng)方法以極低的延遲高效地緩存主機(jī)內(nèi)存。

CXL.mem 協(xié)議提供了主機(jī)處理器,可以使用加載和存儲命令訪問設(shè)備連接的內(nèi)存,此時主機(jī) CPU 充當(dāng)主設(shè)備,CXL 設(shè)備充當(dāng)從屬設(shè)備,并且可以支持易失性和持久性存儲器架構(gòu)。

如圖 1 所示,CXL.cache 和 CXL.mem 合并且共享一個公共鏈路和事務(wù)層,而 CXL.io 有自己的鏈路和事務(wù)層。

圖片

三個協(xié)議產(chǎn)生的數(shù)據(jù)都通過仲裁和多路復(fù)用 (ARB/MUX) 模塊一起動態(tài)復(fù)用,然后被移交到 PCIe 5.0 PHY,進(jìn)而以 32GT/s 的速度進(jìn)行傳輸。ARB/MUX 在 CXL 鏈路層(CXL.io 和 CXL.cache/mem)發(fā)出的請求之間進(jìn)行仲裁,并根據(jù)仲裁結(jié)果復(fù)用數(shù)據(jù),仲裁結(jié)果使用加權(quán)循環(huán)仲裁,權(quán)重由主機(jī)設(shè)置。ARB/MUX 還處理鏈路層發(fā)出的功耗狀態(tài)轉(zhuǎn)換請求,向物理層創(chuàng)建實現(xiàn)有序降耗操作的單個請求。

CXL 通過固定寬度的 528 位微片傳輸數(shù)據(jù),該微片由四個 16 字節(jié)時隙組成,并添加了兩個字節(jié) CRC:(4 x 16 + 2 = 66 字節(jié)= 528 位)。插槽采用多種格式定義,可專用于 CXL.cache 協(xié)議或 CXL.mem 協(xié)議。片頭定義了插槽格式,并攜帶允許事務(wù)層將數(shù)據(jù)正確路由到預(yù)期協(xié)議的信息。

由于 CXL 使用 PCIe 5.0 PHY 和電氣元件,它可以有效地插入到任何可以通過 Flex Bus 使用 PCIe 5.0 的系統(tǒng)中。Flex Bus 是一個靈活的高速端口,可以靜態(tài)配置為支持 PCIe 或 CXL。圖 2 舉例顯示了 Flex Bus 鏈路。這種方法使 CXL 系統(tǒng)能夠利用 PCIe 重定時器;但是,目前 CXL 僅定義為直連 CPU 鏈路,因此無法利用 PCIe 交換機(jī)。隨著標(biāo)準(zhǔn)的逐步完善,交換功能可能會被添加到標(biāo)準(zhǔn)中;如果是這樣,則需要創(chuàng)建新的 CXL 交換機(jī)。

圖片

3、CXL 設(shè)備類型

CXL.io 協(xié)議用于初始化和鏈接,所以必須獲得所有 CXL 設(shè)備的支持,如果 CXL.io 協(xié)議發(fā)生故障,鏈接就無法運行。其他兩個協(xié)議的不同組合產(chǎn)生了總共三種被定義并受 CXL 標(biāo)準(zhǔn)支持的獨特 CXL 設(shè)備類型。

圖 3 顯示了三種已定義的 CXL 設(shè)備類型及其相應(yīng)的協(xié)議、典型應(yīng)用以及支持的存儲器訪問類型。

圖片

對于 2 型設(shè)備,CXL 定義了兩個一致性“偏置”,用于控制 CXL 對主機(jī)和設(shè)備連接存儲器之間的一致性數(shù)據(jù)的處理方式。偏置模式指主機(jī)偏置和設(shè)備偏置,并且操作模式可以根據(jù)需要發(fā)生改變,從而在鏈路操作期間優(yōu)化給定任務(wù)的性能。

2 型設(shè)備(例如,加速器)處理提交給主機(jī)的工作時間及其后續(xù)完成之間的數(shù)據(jù)時,設(shè)備偏置模式用于確保設(shè)備可以直接訪問其設(shè)備連接的存儲器,而無需與主機(jī)的一致性引擎通信。因此,設(shè)備可保證主機(jī)沒有緩存線路。這為設(shè)備提供了最優(yōu)的延遲性能,使得設(shè)備偏置成為加速器執(zhí)行工作的主要操作模式。主機(jī)處于設(shè)備偏置模式時,主機(jī)仍然可以訪問設(shè)備連接的存儲器,但性能卻不是最優(yōu)。

主機(jī)偏置模式優(yōu)先考慮從主機(jī)到設(shè)備連接存儲器的一致性訪問。該模式通常在工作提交期間使用,此時數(shù)據(jù)會從主機(jī)寫入設(shè)備連接的存儲器,而且在主機(jī)將數(shù)據(jù)從設(shè)備連接的存儲器中導(dǎo)出后,可使用該模式完成工作。在主機(jī)偏置模式下,設(shè)備連接的存儲器對于設(shè)備而言就像主機(jī)連接的存儲器一樣,如果設(shè)備需要訪問,就通過一條發(fā)送到主機(jī)的請求進(jìn)行處理。

可以使用軟件或硬件,通過軟件輔助和硬件自治這兩種受支持的模式管理機(jī)制來控制偏置模式。加速器或其他 2 型設(shè)備可以選擇偏置模式,如果兩種模式均未選擇,則系統(tǒng)默認(rèn)為主機(jī)偏置模式,這樣就必須通過主機(jī)路由對設(shè)備連接存儲器進(jìn)行所有訪問。偏置模式可以使用 4KB 頁面的顆粒度進(jìn)行更改,并通過 2 型設(shè)備中執(zhí)行的偏置表進(jìn)行跟蹤。

CXL 標(biāo)準(zhǔn)的一個重要特征是一致性協(xié)議是不對稱的。Home 緩存代理僅停留在主機(jī)中。因此,主機(jī)控制存儲器的緩存,從而解決連接的 CXL 設(shè)備請求的給定地址的整個系統(tǒng)的一致性問題。這完全不同于正在使用的現(xiàn)有專有和公開的一致性協(xié)議,特別是那些用于 CPU 到 CPU 連接的協(xié)議,因為它們通常是對稱的,會使得所有互連設(shè)備都變得對等。

雖然這樣有一些優(yōu)點,但是對稱的高速緩存一致性協(xié)議更加復(fù)雜,并且所有設(shè)備都必須處理由此產(chǎn)生的復(fù)雜性。具有不同架構(gòu)的設(shè)備可以采用不同的方法來實現(xiàn)在微架構(gòu)級別優(yōu)化的一致性,而這一情況可能會為實現(xiàn)廣泛的行業(yè)采用增加難度。通過使用主機(jī)控制的非對稱方法,可以將不同的 CPU 和加速器輕松納入新興 CXL 生態(tài)系統(tǒng)。

** 4、CXL的未來**

可以設(shè)想在具有內(nèi)存一致性的大型系統(tǒng)中同時使用多個協(xié)議來處理 CPU 到 CPU、CPU 到連接設(shè)備以及更長距離的機(jī)箱到機(jī)箱要求。目前,CXL 致力于為服務(wù)器提供經(jīng)過優(yōu)化的解決方案。CXL 固有的不對稱性意味著它可能不適用于 CPU 到 CPU 或加速器到加速器的連接。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • FPGA
    +關(guān)注

    關(guān)注

    1624

    文章

    21539

    瀏覽量

    600533
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    10772

    瀏覽量

    210451
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    27

    文章

    4632

    瀏覽量

    128448
收藏 人收藏

    評論

    相關(guān)推薦

    關(guān)于Gen-Z語義存儲(memory-semantic)體系架構(gòu)探討

    NVM Express和新興Compute Express Link(CXL協(xié)議。 Gen-Z使用語義存儲通信,以最小開銷在不同組件的內(nèi)存之間傳送數(shù)據(jù),它不僅使存儲器件互連,也使處理器和加速器互連,加速器可以減輕CPU的處理壓力,越來越受到存儲和人工智能等應(yīng)用的青睞。G
    的頭像 發(fā)表于 10-23 15:38 ?6517次閱讀

    如何創(chuàng)建最佳的網(wǎng)絡(luò)和架構(gòu) 一文解析Gen-Z架構(gòu)

    NVM Express和新興Compute Express Link(CXL協(xié)議。 Gen-Z使用語義存儲通信,以最小開銷在不同組件的內(nèi)存之間傳送數(shù)據(jù),它不僅使存儲器件互連,也使處理器和加速器互連,加速器可以減輕CPU的處理壓力,越來越受到存儲和人工智能等應(yīng)用的青睞。G
    的頭像 發(fā)表于 02-05 16:03 ?4622次閱讀
    如何創(chuàng)建最佳的網(wǎng)絡(luò)和架構(gòu) 一文解析Gen-Z架構(gòu)

    一窺CXL協(xié)議

    現(xiàn)在已經(jīng)有幾十家的會員。目前CXL協(xié)議共有個版本,分別是1.0,1.1,2.0和剛剛發(fā)布的3.0,協(xié)議規(guī)范可以在官網(wǎng)上下載。關(guān)于CXL協(xié)議
    發(fā)表于 09-09 15:03

    CXL事務(wù)層的結(jié)構(gòu)是由哪些部分組成的

    3.1 CXL.ioCXL.io為IO設(shè)備提供非一致性的load/strore接口。事務(wù)類型、事務(wù)數(shù)據(jù)包格式、信用流量控制、虛擬通道管理、事務(wù)順序的規(guī)則等遵循PCIe協(xié)議。CXL.io的事務(wù)層如下
    發(fā)表于 10-08 15:21

    CXL內(nèi)存協(xié)議介紹

    3.3.1 介紹CXL內(nèi)存協(xié)議被稱作CXL.mem。CXL.mem定義了CPU和內(nèi)存之間的傳輸接口。該協(xié)議可用于多個不同的內(nèi)存連接選項,包括
    發(fā)表于 11-01 15:08

    DirectCXL內(nèi)存分解原型設(shè)計實現(xiàn)

    鑒于KAIST的HPC根源,將DirectCXL原型放在一起的研究人員專注于使用遠(yuǎn)程直接內(nèi)存訪問(RDMA)協(xié)議CXL內(nèi)存池與跨系統(tǒng)直接內(nèi)存訪問進(jìn)行比較。他們使用了一個非常老式的Mellanox
    發(fā)表于 11-15 11:14

    一文詳解CXL鏈路層格式的定義

    。其次,它允許立即指示病毒,并降低病毒分布路徑和數(shù)據(jù)路徑之間的競爭條件的風(fēng)險。協(xié)議在這里講的不多,不是很清楚。等到第12章的RAS,再來看看CXL如何處理“中毒”情況。插播一句,RAS
    發(fā)表于 02-21 14:27

    DesignWare CXL為SoC提供優(yōu)化的多芯片IP堆棧

    ● DesignWare CXL IP 支持 AMBA CXS 協(xié)議,以實現(xiàn)與可擴(kuò)展 Arm Neoverse 相干網(wǎng)狀網(wǎng)絡(luò)的無縫集成 ● 新思科技 CXL IP 以 32GT/s 的速度運行,數(shù)據(jù)
    的頭像 發(fā)表于 10-27 16:40 ?1605次閱讀

    Saniffer開放實驗室?guī)齑娌⑻峁y試工具

    分析儀 1.1 PCIe Gen 5 x16協(xié)議分析儀 ??? //* SerialTek/Ellisys,支持CXL協(xié)議分析,最高配置,288G BUFFER, 無需設(shè)置
    的頭像 發(fā)表于 02-02 10:43 ?2582次閱讀

    瀾起科技發(fā)布全球首款CXL? 內(nèi)存擴(kuò)展控制器芯片

    MXC芯片是一款CXL DRAM內(nèi)存控制器,屬于CXL協(xié)議所定義的第三種設(shè)備類型。該芯片支持JEDEC DDR4和DDR5標(biāo)準(zhǔn),同時也符合CXL 2.0規(guī)范,支持PCIe 5.0的速率
    的頭像 發(fā)表于 05-06 10:46 ?2582次閱讀

    一文讀懂CXL協(xié)議

    CXL全稱為Compute Express Link,作為一種全新的開放式互聯(lián)技術(shù)標(biāo)準(zhǔn),其能夠讓CPU與GPU、FPGA或其他加速器之間實現(xiàn)高速高效的互聯(lián),從而滿足高性能異構(gòu)計算的要求,并且其維護(hù)CPU內(nèi)存空間和連接設(shè)備內(nèi)存之間的一致性。總體而言,其優(yōu)勢高度概括在極高兼容性和內(nèi)存一致性兩方面上。
    的頭像 發(fā)表于 02-11 11:01 ?2170次閱讀

    CXL協(xié)議和標(biāo)準(zhǔn)介紹, CXL2.0和3.0有什么新功能?

    CXL通過一個叫做CXL 聯(lián)盟的開放行業(yè)標(biāo)準(zhǔn)組織開發(fā)技術(shù)規(guī)范,促進(jìn)新興使用模型的性能突破,同時支持?jǐn)?shù)據(jù)中心加速器和其他高速增強(qiáng)功能的開放生態(tài)系統(tǒng)。
    發(fā)表于 03-15 11:30 ?4715次閱讀

    SMART Modular 世邁科技推出高性能服務(wù)器專用全新CXL? 內(nèi)存擴(kuò)充卡系列

    CXL?)內(nèi)存擴(kuò)充卡(AIC)系列,可支持業(yè)界標(biāo)準(zhǔn) DDR5 內(nèi)存模塊。這也是同類產(chǎn)品中第一款采用CXL?協(xié)議的高密度內(nèi)存模塊擴(kuò)充卡。 SMART 4-DIMM和8-DIMM擴(kuò)充卡讓服務(wù)器和數(shù)據(jù)中心架構(gòu)
    的頭像 發(fā)表于 04-25 10:30 ?394次閱讀

    打造異構(gòu)計算新標(biāo)桿!國數(shù)集聯(lián)發(fā)布首款CXL混合資源池參考設(shè)計

    參考設(shè)計是首個支持異構(gòu)計算架構(gòu)的CXL硬件設(shè)備,標(biāo)志著CXL技術(shù)在數(shù)據(jù)中心領(lǐng)域迎來異構(gòu)計算新階段。 ? 國數(shù)集聯(lián)基于FPGA與自主研發(fā)的CXL協(xié)議IP的先進(jìn)特性,可實現(xiàn)CPU、GPU、
    的頭像 發(fā)表于 08-06 14:19 ?244次閱讀
    打造異構(gòu)計算新標(biāo)桿!國數(shù)集聯(lián)發(fā)布首款<b class='flag-5'>CXL</b>混合資源池參考設(shè)計

    如何利用CXL協(xié)議實現(xiàn)高效能的計算架構(gòu)

    構(gòu)建一個可橫向擴(kuò)展的可組合分離架構(gòu)。眾所周知,CXL協(xié)議涵蓋了type1、type2、type3三種設(shè)備類型,而目前學(xué)術(shù)界和工業(yè)界的研究主要集中在如何利用CXL技術(shù)擴(kuò)展系統(tǒng)的內(nèi)存容量。
    的頭像 發(fā)表于 09-03 09:14 ?296次閱讀
    如何利用<b class='flag-5'>CXL</b><b class='flag-5'>協(xié)議</b>實現(xiàn)高效能的計算架構(gòu)