0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何破解PCIe 6.0帶來芯片設(shè)計(jì)新挑戰(zhàn)?

架構(gòu)師技術(shù)聯(lián)盟 ? 來源:半導(dǎo)體行業(yè)觀察 ? 2023-02-03 10:23 ? 次閱讀

PCI Express (PCIe) 6.0規(guī)范實(shí)現(xiàn)了64GT/s鏈路速度,還帶來了包括帶寬翻倍在內(nèi)的多項(xiàng)重大改變,這也為SoC設(shè)計(jì)帶來了諸多新變化和挑戰(zhàn)。對(duì)于HPC、AI和存儲(chǔ)SoC開發(fā)者來說,如何理解并應(yīng)對(duì)這些變化帶來的設(shè)計(jì)挑戰(zhàn)變得至關(guān)重要。

本文將就上述問題和方案作詳細(xì)介紹及探討。

PCIe 6.0的重大新變化

變化一:PCIe 6.0電器性發(fā)生根本性的機(jī)制改變

為了實(shí)現(xiàn)64GT/s的鏈路速度,PCIe 6.0采用脈沖幅度調(diào)制4級(jí) (PAM4) 信號(hào),在與32GT/s PCIe相同的單元間隔(UI)中提供4個(gè)幅度級(jí)別(2 位)。圖1顯示了三眼眼圖與此前的單眼眼圖的對(duì)比。

07a59ecc-a341-11ed-bfe3-dac502259ad0.png

圖 1:與NRZ信號(hào)相比,PCIe 6.0 PAM-4信號(hào)是三眼眼圖

與NRZ相比,轉(zhuǎn)換到PAM4信號(hào)編碼引入了更高的誤碼率(BER)。為緩解這種情況,6.0規(guī)范在以 64GT/s 運(yùn)行時(shí)實(shí)現(xiàn)了許多新功能。例如,當(dāng)將新的4級(jí)電壓眼圖映射到數(shù)字值時(shí),格雷編碼可以最小化每個(gè) UI 內(nèi)的錯(cuò)誤,并且發(fā)送器應(yīng)用預(yù)編碼來最小化迸發(fā)錯(cuò)誤;PCIe 6.0還采用前向糾錯(cuò)(FEC)機(jī)制來降低較高的誤碼率。這些對(duì) PCIe 協(xié)議和控制器設(shè)計(jì)都具有重大影響。

變化二:新一代協(xié)議的引入

PCIe 6.0 引入了全新的“FLIT 模式”,其中數(shù)據(jù)包被組織在固定大小的流控制單元中,而不是過去規(guī)范版本中的可變大小。這種模式簡(jiǎn)化了控制器級(jí)別的數(shù)據(jù)管理,帶來了更高的帶寬效率、更低的延遲和更小的控制器占用空間。當(dāng)以 64GT/s 的速率運(yùn)算時(shí),F(xiàn)LIT 模式使用未編碼數(shù)據(jù)(稱為“1b1b 編碼”),而 128/130 編碼用于 8GT/s 至 32GT/s 的鏈路速度,經(jīng)典8b10b編碼用于2.5GT/s 和 5GT/s 的鏈路速度。

與具有相同配置的 32GT/s PCIe 控制器相比,64GT/s PCIe 6.0 控制器所需的硅面積顯著增加;支持1b1b編碼不僅增加了第三物理層路徑(位于 8b10b 和 128b130b 頂部),還增加了數(shù)據(jù)鏈路層中的邏輯;FLIT模式中使用的新優(yōu)化標(biāo)頭,也進(jìn)一步增加了邏輯門數(shù),超過了 32GT/s 解決方案。

變化三:PIPE數(shù)據(jù)路徑寬度增加,每個(gè)時(shí)鐘周期有多個(gè)數(shù)據(jù)包

為了保持與上一代相同的最大時(shí)鐘頻率,64GT/s下PIPE數(shù)據(jù)路徑寬度增加了一倍,即需要1024位數(shù)據(jù)路徑的16通道設(shè)計(jì),這為芯片設(shè)計(jì)帶來了新的問題。

要知道,大于128位的數(shù)據(jù)路徑寬度,可能會(huì)導(dǎo)致SoC需要在每個(gè)時(shí)鐘周期處理多個(gè)PCIe 數(shù)據(jù)包。最小的PCIe事務(wù)層數(shù)據(jù)包 (TLP) 可以被視為 3 個(gè) DWORD(12 字節(jié))加上 4 字節(jié) LCRC,總共 16 個(gè)字節(jié)(128 位)。在 8GT/s 時(shí),使用PCIe PHY的 500MHz 16 位 PIPE 接口最為常見,這意味著8通道及以下(16 位/通道 * 8 通道 = 128 位)的鏈路寬度會(huì)在每個(gè)時(shí)鐘最多傳輸一個(gè)完整的數(shù)據(jù)包。但是,16通道(16位/通道 * 16通道 = 256位)在每個(gè)時(shí)鐘周期就需要傳輸兩個(gè)完整的數(shù)據(jù)包。

如表1顯示,隨著鏈路速度的提高,每個(gè)時(shí)鐘的完整數(shù)據(jù)包的數(shù)量相應(yīng)增加,從而影響越來越多的設(shè)計(jì)。

07c7a684-a341-11ed-bfe3-dac502259ad0.png

表 1:數(shù)據(jù)路徑寬度隨鏈路速度增加,導(dǎo)致更多配置超過128位閾值

PCIe 6.0的優(yōu)化設(shè)計(jì)

1松弛排序

PCIe排序規(guī)則需要Posted事務(wù),例如內(nèi)存寫入保持有序,除非數(shù)據(jù)包標(biāo)頭中設(shè)置了松弛排序 (RO) 或 ID 排序 (IDO) 屬性。使用RO集的Posted事務(wù)可以傳遞任何先前 Posted 事務(wù),而使用IDO集的事務(wù)只能使用不同的請(qǐng)求者ID傳遞先前事務(wù)。

以下四個(gè)示例展示了這兩種屬性對(duì)于實(shí)現(xiàn)完整的PCIe 64GT/s 性能的重要性。他們均利用4個(gè)PCIe內(nèi)存的序列寫入256字節(jié)中的每一個(gè),表示將1KB 有效載荷遞送到地址1000,然后是4個(gè)字節(jié)的PCIe內(nèi)存寫入,表示將“成功完成”指示遞送到地址7500。表中的每一行代表一個(gè)時(shí)間段,而三列(從左到右)表示事務(wù)到達(dá)PCIe引腳、應(yīng)用程序接口和 SoC 內(nèi)存。在所有 4 次內(nèi)存寫入之前,“成功完成”指示到達(dá)內(nèi)存的任何場(chǎng)景都反映出失敗,因?yàn)檐浖谑盏街甘竞罅⒓纯蛇M(jìn)行數(shù)據(jù)處理,因此在交付正確的數(shù)據(jù)之前處理。

示例1:只要其中一個(gè)應(yīng)用程序接口的帶寬至少等于 PCIe 帶寬,該接口就可以正常工作。

07db2cf4-a341-11ed-bfe3-dac502259ad0.png

表2:?jiǎn)我蝗俾蕬?yīng)用程序接口可正確傳輸數(shù)據(jù)

示例2:雙接口通常會(huì)出現(xiàn)故障,因?yàn)闊o法保證SoC中兩個(gè)通往內(nèi)存的獨(dú)立路徑之間的到達(dá)順序。

07fda63a-a341-11ed-bfe3-dac502259ad0.png

表3:顯示雙半速率應(yīng)用程序接口失敗,原因是“成功完成”指示早于所有數(shù)據(jù)到達(dá)

示例3:將強(qiáng)排序流量強(qiáng)制到單個(gè)接口可避免出現(xiàn)無序到達(dá),但由于無法使用全部?jī)?nèi)部帶寬,因此很快落后于 PCIe 鏈路。

081149f6-a341-11ed-bfe3-dac502259ad0.png

表4:由于無法全速傳輸數(shù)據(jù),所示的雙半速應(yīng)用程序接口失敗

示例4:當(dāng)鏈路伙伴把數(shù)據(jù)有效載荷數(shù)據(jù)包標(biāo)記為 RO 且把成功完成數(shù)據(jù)包標(biāo)記為強(qiáng)排序時(shí),兩個(gè)半速率接口可以成功傳輸。請(qǐng)注意,當(dāng) RO 有效載荷數(shù)據(jù)無序到達(dá)時(shí),非 RO 寫入 7500 不被允許傳遞有效載荷寫入,因此在發(fā)送所有先前寫入之前,不會(huì)將其發(fā)送到應(yīng)用接口。

08536b56-a341-11ed-bfe3-dac502259ad0.png

表 5:顯示雙半速應(yīng)用程序接口通過對(duì)有效載荷數(shù)據(jù)使用松弛排序成功

SoC 設(shè)計(jì)人員可以在其出站數(shù)據(jù)流中設(shè)置RO屬性,并顯著提高PCIe鏈路性能。IDO排序?qū)傩栽谠S多情況下都具有類似的優(yōu)勢(shì),大多數(shù) PCIe 實(shí)現(xiàn)都可以將其應(yīng)用于其傳輸?shù)拿總€(gè)數(shù)據(jù)包。

具有IDO集的數(shù)據(jù)包僅被允許傳輸具有不同請(qǐng)求者 ID 的先前事務(wù),這意味著數(shù)據(jù)包來自 PCIe 鏈路上的不同邏輯代理。大多數(shù)端點(diǎn)實(shí)現(xiàn)(單功能和多功能)都對(duì)與往返于其他 PCIe 端點(diǎn)的流量相關(guān)的數(shù)據(jù)排序漠不關(guān)心,因?yàn)樗鼈兺ǔV慌cRC通信。同樣,大多數(shù)RC通常不會(huì)在多個(gè)端點(diǎn)之間混合相同的流量流,因此在這兩種情況下,都沒有與其他設(shè)備的請(qǐng)求者 ID 相關(guān)的排序問題。與此類似,大多數(shù)多功能端點(diǎn)對(duì)功能之間的數(shù)據(jù)排序也不關(guān)心,因此也不必?fù)?dān)心自己的請(qǐng)求者ID之間的排序。因此,大多數(shù)實(shí)施已經(jīng)可以為他們發(fā)起的所有事務(wù)設(shè)置IDO。

2增加應(yīng)用程序接口

除了上文討論的因素外,當(dāng)數(shù)據(jù)包小于接口寬度時(shí),利用多個(gè)較窄的應(yīng)用程序接口可顯著提高整體性能。圖 2 顯示了新思科技 PCI Express 6.0 控制器IP上64GT/s Flit模式下在發(fā)送連續(xù)的 Posted TLP流方面的傳輸鏈路利用率。對(duì)于更大的數(shù)據(jù)路徑寬度,顯然需要更大的數(shù)據(jù)包來通過單個(gè)應(yīng)用程序接口保持完全的鏈路利用率,1024 位接口需要 128 字節(jié)的有效負(fù)載。

086c2452-a341-11ed-bfe3-dac502259ad0.png

圖 2:在 64GT/s FLIT 模式下,利用單個(gè)應(yīng)用程序接口進(jìn)行傳輸?shù)母鞣N有效荷載大小和數(shù)據(jù)路徑寬度的鏈路利用率

相反,當(dāng)新思科技控制器配置為兩個(gè)應(yīng)用接口并運(yùn)行相同的流量模式時(shí),就會(huì)有明顯的改進(jìn),現(xiàn)在64字節(jié)的有效負(fù)載即使在 1024 位數(shù)據(jù)路徑中也能產(chǎn)生完全的鏈路利用率,如圖 3 所示。

086c2452-a341-11ed-bfe3-dac502259ad0.png

圖 3:在 64GT/s FLIT 模式下,通過兩個(gè)應(yīng)用接口配置進(jìn)行傳輸?shù)母鞣N有效載荷大小和數(shù)據(jù)路徑寬度的鏈路利用率

3解決小數(shù)據(jù)包效率低下

雖然大多數(shù)設(shè)備幾乎無法控制其流量模式,但小數(shù)據(jù)包可以實(shí)現(xiàn)更少帶寬。新思科技 CoreConsultant 使用最大有效負(fù)載大小和往返時(shí)間 (RTT) 等參數(shù)來配置 PCIe 6.0 控制器中的緩沖區(qū)大小、突出 PCIe 標(biāo)簽數(shù)量和其他關(guān)鍵參數(shù)。

圖3和圖4顯示了從新思科技的 64GT/s x4 控制器的仿真中獲得的數(shù)據(jù)。該控制器配置為 512 字節(jié)最大有效載荷大小和 1000nS RTT 掃描,覆蓋一系列有效載荷大小和 RTT 值。如果在同一范圍內(nèi)重復(fù)相同的掃描,但任意一個(gè)參數(shù)降低,則當(dāng)掃描通過優(yōu)化范圍后,性能會(huì)降低。

089e2c0e-a341-11ed-bfe3-dac502259ad0.png

圖 3:小尺寸 Posted 數(shù)據(jù)包效率低下

08f4d522-a341-11ed-bfe3-dac502259ad0.png

圖 4:小尺寸Non-Posted數(shù)據(jù)包效率低下,在一系列往返時(shí)間范圍內(nèi)掃描

總結(jié)

實(shí)施 64GT/s PCIe 接口的 SoC 設(shè)計(jì)人員應(yīng)確保其支持松弛排序?qū)傩裕从行лd荷而非相關(guān)控制上的RO,以及所有數(shù)據(jù)包上的IDO,除非應(yīng)用程序有異常要求。這是在整個(gè) 64GT/s 生態(tài)系統(tǒng)中實(shí)現(xiàn)高性能的關(guān)鍵部分。

為x4和更寬鏈路實(shí)施64GT/s PCIe的設(shè)計(jì)人員需要注意每個(gè)時(shí)鐘周期的多個(gè)數(shù)據(jù)包,并應(yīng)根據(jù)其典型流量大小考慮多個(gè)應(yīng)用接口。

所有64GT/s實(shí)施者都應(yīng)為1GHz(或更快)的設(shè)計(jì)實(shí)現(xiàn)做好準(zhǔn)備,并且應(yīng)確保通過硅前性能模擬檢查其假設(shè)。

對(duì)于上述這些優(yōu)化設(shè)計(jì)辦法,新思科技提供完整的PCIe 6.0解決方案(包括控制器、PHY 和 VIP)。這些解決方案支持松弛排序?qū)傩?、PAM-4 信號(hào)、FLIT 模式、L0p 電源、高達(dá) 1024 位的架構(gòu)以及多個(gè)應(yīng)用程序接口選項(xiàng),有助于更輕松地過渡到64GT/s PCIe設(shè)計(jì)。

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 芯片
    +關(guān)注

    關(guān)注

    452

    文章

    49938

    瀏覽量

    419609
  • 控制器
    +關(guān)注

    關(guān)注

    112

    文章

    16028

    瀏覽量

    176639
  • soc
    soc
    +關(guān)注

    關(guān)注

    38

    文章

    4065

    瀏覽量

    217549
  • 芯片設(shè)計(jì)
    +關(guān)注

    關(guān)注

    15

    文章

    984

    瀏覽量

    54706
  • PCIe
    +關(guān)注

    關(guān)注

    15

    文章

    1174

    瀏覽量

    82248

原文標(biāo)題:如何破解PCIe 6.0帶來芯片設(shè)計(jì)新挑戰(zhàn)?

文章出處:【微信號(hào):架構(gòu)師技術(shù)聯(lián)盟,微信公眾號(hào):架構(gòu)師技術(shù)聯(lián)盟】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    PCIe 6.0元年,AI與HPC迎來新速度

    電子發(fā)燒友網(wǎng)報(bào)道(文/周凱揚(yáng))2022年1月,PCI-SIG發(fā)布了PCIe 6.0規(guī)范,正式拉開了接口帶寬大幅升級(jí)的序幕。然而,在規(guī)范公布的兩年時(shí)間里,也已經(jīng)更新了6.0.1和6.1版本,PCIe
    的頭像 發(fā)表于 01-31 09:02 ?2673次閱讀

    綠色制造帶來多種挑戰(zhàn) 破解工藝成本難題

    綠色制造帶來多種挑戰(zhàn) 破解工藝成本難題   電子產(chǎn)品生產(chǎn)禁用的有害物質(zhì)導(dǎo)致企業(yè)成本上升、加工難度加大以及產(chǎn)品質(zhì)量下降,這對(duì)電子元件
    發(fā)表于 11-12 17:11 ?1036次閱讀

    楷登電子發(fā)布PCIe 6.0規(guī)范Cadence IP

    應(yīng)用提供優(yōu)化的性能和吞吐量。面向 PCIe 6.0 的 Cadence IP 的早期采用者現(xiàn)在可以使用相應(yīng)的設(shè)計(jì)套件。 Cadence 的這款 5 納米 PCIe 6.0 PHY 測(cè)試
    的頭像 發(fā)表于 10-26 14:28 ?4292次閱讀

    PCIe 6.0的新變化與新挑戰(zhàn)

    2022年1月11日,PCI-SIG正式發(fā)布了PCI Express(PCIe) 6.0最終版本1.0,標(biāo)志著各大IP、芯片廠商可以開始著手設(shè)計(jì)、開發(fā)自己技術(shù)和產(chǎn)品了。從技術(shù)上來說,PCIe
    的頭像 發(fā)表于 04-13 13:50 ?4639次閱讀

    PCIe 6.0規(guī)范及它是如何從過去的規(guī)范演變而來的

    雖然與前幾代相比,PCIe 6.0 的變化很大,但業(yè)界對(duì)其采用有著強(qiáng)大而廣泛的支持。PCIe 在每個(gè)現(xiàn)代計(jì)算架構(gòu)中無處不在,您應(yīng)該期望 PCIe 6
    的頭像 發(fā)表于 06-01 17:15 ?2215次閱讀
    <b class='flag-5'>PCIe</b> <b class='flag-5'>6.0</b>規(guī)范及它是如何從過去的規(guī)范演變而來的

    干貨:PCIE6.0技術(shù)剖析

    關(guān)于PCIe6.0 你需要知道的都在這里 從正式發(fā)布至今,PCI Express(PCIe)發(fā)展迅速,已經(jīng)成為高性能計(jì)算、人工智能/機(jī)器學(xué)習(xí)(ML)加速器、網(wǎng)絡(luò)適配器和固態(tài)存儲(chǔ)等應(yīng)用不可或缺的一項(xiàng)
    的頭像 發(fā)表于 12-07 07:40 ?4457次閱讀

    面向高性能數(shù)據(jù)中心和人工智能SoC Rambus推出PCIe 6.0接口子系統(tǒng)

    全新的PAM4信令帶來PCIe 6.0兩大非常重要的改變。第一個(gè)改變就是采用前向糾錯(cuò)(FEC),支持固定大小數(shù)據(jù)包(FLITs)。第二個(gè)重要的變化就是在PCIe
    的頭像 發(fā)表于 12-19 13:57 ?733次閱讀

    如何破解PCIe 6.0帶來芯片設(shè)計(jì)新挑戰(zhàn)?

    設(shè)計(jì)帶來了諸多新變化和挑戰(zhàn)。對(duì)于HPC、AI和存儲(chǔ)SoC開發(fā)者來說,如何理解并應(yīng)對(duì)這些變化帶來的設(shè)計(jì)挑戰(zhàn)變得至關(guān)重要。 本文將就上述問題和方案作詳細(xì)介紹及探討。
    的頭像 發(fā)表于 01-19 16:50 ?844次閱讀

    PCIe 6.0入門之什么是 PCIe 6.0

    PCI Express? 6.0 (PCIe? 6.0) 規(guī)范由 PCI-SIG? 于 2022 年 1 月發(fā)布。最新一代的 PCIe 標(biāo)準(zhǔn)帶來
    的頭像 發(fā)表于 05-22 17:27 ?6163次閱讀
    <b class='flag-5'>PCIe</b> <b class='flag-5'>6.0</b>入門之什么是 <b class='flag-5'>PCIe</b> <b class='flag-5'>6.0</b>

    AI和數(shù)據(jù)中心:PCIe 6.0,你是懂加速的

    6.0在AI、HPC和數(shù)據(jù)中心中越來越受歡迎。PCIe 6.0運(yùn)行速度極快,達(dá)到64GT/s,是上一代的兩倍。目前,網(wǎng)絡(luò)服務(wù)器、固態(tài)驅(qū)動(dòng)器、交換機(jī)和AI加速器都已率先采用PCIe
    的頭像 發(fā)表于 07-12 17:50 ?1659次閱讀

    PCIe 6.0的優(yōu)化設(shè)計(jì)方案探討分析

    為了實(shí)現(xiàn)64GT/s的鏈路速度,PCIe 6.0采用脈沖幅度調(diào)制4級(jí) (PAM4) 信號(hào),在與32GT/s PCIe相同的單元間隔(UI)中提供4個(gè)幅度級(jí)別(2 位)。圖1顯示了三眼眼圖與此前的單眼眼圖的對(duì)比。
    發(fā)表于 08-05 09:33 ?871次閱讀
    <b class='flag-5'>PCIe</b> <b class='flag-5'>6.0</b>的優(yōu)化設(shè)計(jì)方案探討分析

    新思科技PCIe 6.0 IP與英特爾PCIe 6.0測(cè)試芯片實(shí)現(xiàn)互操作

    :SNPS)近日宣布,新思科技PCI Express(PCIe6.0 IP在端到端64GT/s的連接下,成功實(shí)現(xiàn)與英特爾PCIe 6.0測(cè)試芯片
    發(fā)表于 10-12 15:11 ?310次閱讀

    新思科技成功實(shí)現(xiàn)與英特爾PCIe 6.0測(cè)試芯片的互操作性

    新思科技PCIe 6.0 IP與英特爾 PCIe 6.0測(cè)試芯片實(shí)現(xiàn)互操作 在64GT/s 高速連接下成功驗(yàn)證互操作性,降低高性能計(jì)算SoC
    的頭像 發(fā)表于 10-16 09:22 ?739次閱讀

    下一代PCIe5.0 /6.0技術(shù)熱潮趨勢(shì)與測(cè)試挑戰(zhàn)

    迫切。 一、PCIe 5.0 /6.0技術(shù)升級(jí) 1)信號(hào)速率方面 從PCIe 3.0、4.0、5.0 到 6.0,數(shù)據(jù)速率翻倍遞增,6.0
    的頭像 發(fā)表于 03-06 10:35 ?883次閱讀
    下一代<b class='flag-5'>PCIe</b>5.0 /<b class='flag-5'>6.0</b>技術(shù)熱潮趨勢(shì)與測(cè)試<b class='flag-5'>挑戰(zhàn)</b>

    如何簡(jiǎn)化PCIe 6.0交換機(jī)的設(shè)計(jì)

    由于全球數(shù)據(jù)流量呈指數(shù)級(jí)增長(zhǎng),PCIe 6.0 交換機(jī)的市場(chǎng)需求也出現(xiàn)了激增。PCIe 6.0 交換機(jī)在高性能計(jì)算(HPC)系統(tǒng)(尤其是數(shù)據(jù)中心)中為需要大帶寬和超低延遲的應(yīng)用提供了重
    的頭像 發(fā)表于 07-05 09:45 ?379次閱讀
    如何簡(jiǎn)化<b class='flag-5'>PCIe</b> <b class='flag-5'>6.0</b>交換機(jī)的設(shè)計(jì)