0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

探索內(nèi)存交換的新出路

SSDFans ? 來源:SSDFans ? 2023-07-26 09:11 ? 次閱讀

背景

內(nèi)存交換技術(shù)是當(dāng)內(nèi)存緊缺的時候,將內(nèi)存中的頁面交換到交換設(shè)備中(如zRAM,SSD等)。隨著SSD的性能越來越好,越來越多的交換設(shè)備采用SSD。然而對于塊SSD來說,數(shù)據(jù)頻繁寫入更新會導(dǎo)致頻繁觸發(fā)垃圾回收(GC)進(jìn)行空閑空間的回收。而其中的有效數(shù)據(jù)搬移會導(dǎo)致額外的寫放大,因此垃圾回收的效率決定了對壽命的影響程度。Zoned Namespace (ZNS)是一種新型SSD存儲接口特性。一個ZNS SSD是由一系列邏輯可尋址zone(區(qū)域)組成,而每個區(qū)域物理上與SSD擦除粒度Block是對齊的。區(qū)域內(nèi)的讀可以是隨機(jī)的,但是寫必須是順序的。

動機(jī)

對于數(shù)據(jù)中心而言,交換性能十分關(guān)鍵。因此本文針對于交換邏輯和SSD行為之間的相互作用進(jìn)行分析,并得出4點重要發(fā)現(xiàn)。

發(fā)現(xiàn)1:塊SSD執(zhí)行GC時無法感知到已解除分配的交換槽(swap-slots)。

塊設(shè)備SSD通常使用TRIM命令來使設(shè)備感知到交換槽的釋放,然而對降低由于內(nèi)存交換導(dǎo)致的GC開銷效果并不明顯。這是因為對于傳統(tǒng)大粒度TRIM而言,連續(xù)512個邏輯地址頁面的TRIM比較難以達(dá)到,故而TRIM指令的下發(fā)很少,使得效果并不明顯;同時對于小粒度TRIM而言,由于TRIM本身帶有的開銷(如命令下發(fā),元數(shù)據(jù)加載修改開銷等),使得其效果也并不是很理想。圖1展示了實驗結(jié)果。

2c51db60-2b44-11ee-a368-dac502259ad0.png

圖1 TRIM對設(shè)備性能的影響

發(fā)現(xiàn)2:交換緩存無法感知到GC。

圖2展示了設(shè)備使用率對讀性能的影響。理論情況下不同設(shè)備使用率對讀性能應(yīng)該沒有影響,然而經(jīng)過測試發(fā)現(xiàn)當(dāng)設(shè)備使用率高的時候讀性能和寫放大系數(shù)發(fā)生了變化。這跟交換緩存實現(xiàn)的原理有關(guān)。當(dāng)設(shè)備使用率超過50%時,所有交換讀請求不會存放在交換緩存中,此時swap-slot會被釋放。當(dāng)內(nèi)存中逐出該數(shù)據(jù)時,則需要重新將數(shù)據(jù)寫入交換設(shè)備中。這樣設(shè)計的原因有二,一是避免swap-slot過多帶來的管理開銷,二是避免設(shè)備垃圾回收時搬移過多的數(shù)據(jù)量。圖3展示了交換緩存中截斷閾值對性能設(shè)壽命的影響。其中發(fā)現(xiàn)對讀負(fù)載,閾值越大表現(xiàn)越好,因為避免了數(shù)據(jù)的額外寫入;對讀寫混合負(fù)載,閾值越小表現(xiàn)越好,因為及時無效外存數(shù)據(jù)則會提升垃圾回收效率,提高性能。而對于靜態(tài)閾值無法很好地滿足不同工作負(fù)載的表現(xiàn)。

2c982480-2b44-11ee-a368-dac502259ad0.png

圖2 設(shè)備使用率對讀性能的影響

2cc8eb2e-2b44-11ee-a368-dac502259ad0.png

圖3 交換緩存截斷閾值對性能和壽命的影響

發(fā)現(xiàn)3:GC無法感知到頁面訪問特征。

對于TRIM而言,常見使用大粒度TRIM來降低開銷。然而對于傾斜度較大的負(fù)載,無效掉的數(shù)據(jù)往往無法十分連續(xù)。這會影響TRIM的下發(fā),從而影響GC效率。經(jīng)過測試發(fā)現(xiàn),采用均衡負(fù)載時,換出帶寬為480MB/s;然而對于傾斜負(fù)載(512-slots TRIM)時,換出帶寬為195MB/s,同時對于傾斜負(fù)載(8-slots TRIM)換出帶寬為324MB/s。因此針對不同頁面訪問特征,GC無法很好的感知到,導(dǎo)致整體性能下降。

發(fā)現(xiàn)4:GC無法感知到操作系統(tǒng)的性能隔離。

圖4顯示了不同進(jìn)程的換入帶寬。CG.A為純讀進(jìn)程,CG.B為讀寫混合進(jìn)程。通過圖中可以發(fā)現(xiàn),不同進(jìn)程之間的性能會被相互影響。而理想狀態(tài)下不同進(jìn)程之間的性能應(yīng)該不受到影響,如讀寫混合負(fù)載引發(fā)的GC不應(yīng)該影響純讀負(fù)載的性能。

2cd40e00-2b44-11ee-a368-dac502259ad0.png

圖4 進(jìn)程之間性能的相互影響

方法

為了解決上述的四個問題,ZNS SSD在本文中被使用。這是因為ZNS SSD隨著設(shè)備使用率的提升依然保持著穩(wěn)定的性能,如圖5所示。本文提出ZNSwap,其中有三個關(guān)鍵設(shè)計目標(biāo):1. 實現(xiàn)資源高效的主機(jī)端GC:降低主機(jī)端GC最為消耗資源的反向映射表的開銷。2. ZNGC-OS一體化:ZNGC可以直接獲取操作系統(tǒng)暴露的信息來優(yōu)化swap性能,避免TRIM的開銷。3. 交換數(shù)據(jù)放置策略:通過一系列接口實現(xiàn)每個核之間的性能隔離、冷熱數(shù)據(jù)間的性能隔離和進(jìn)程之間的性能隔離。

2d09d38c-2b44-11ee-a368-dac502259ad0.png

圖5 ZNS SSD隨著設(shè)備使用率的不同性能的變化

1. ZNGC:ZNGC中實現(xiàn)了反向映射的設(shè)計,通過在頁面的OOB區(qū)域中存儲結(jié)構(gòu)體來進(jìn)行反向映射,而非通過記錄地址轉(zhuǎn)換表,從而節(jié)省開銷。具體結(jié)構(gòu)體設(shè)計如圖6所示。

2d371450-2b44-11ee-a368-dac502259ad0.png

圖6 Linux反向映射設(shè)計,陰影部分為ZNGC反向映射時所需要用到的結(jié)構(gòu)體

2. ZNGC-swap一體化:其中包括四個部分內(nèi)容。a)物理zone(空間)信息:每個空間與swap-slots的映射相關(guān)聯(lián),映射存儲了每個swap-slot的狀態(tài)。這樣ZNGC和OS就可以立馬知道swap-slot的狀態(tài)轉(zhuǎn)變,不需要TRIM和截斷閾值來管理交換緩存。b)交換空間抽象:可以被用來swap-slot分配的活躍空間通過交換空間抽象進(jìn)行暴露,從而避免管理物理空間的復(fù)雜性。c)ZNSwap策略:提供一系列接口使得可以定制化空間分配策略和回收策略。d)接口:本文定義了三個標(biāo)準(zhǔn)api,核策略、冷熱策略和進(jìn)程策略,分別是對每個核的數(shù)據(jù)、冷熱數(shù)據(jù)和進(jìn)程數(shù)據(jù)進(jìn)行性能隔離。

2d5bf522-2b44-11ee-a368-dac502259ad0.png

圖7 ZNGC 策略接口

實驗結(jié)果

ZNGC-交換子系統(tǒng)收益:換出帶寬實驗結(jié)果如圖8所示。正如預(yù)期,隨著設(shè)備使用率的提升GC負(fù)擔(dān)越重。同時,該文章衡量了80%設(shè)備使用率時,CPU的最大開銷。發(fā)現(xiàn),ZNGC的CPU開銷小,同時交換性能表現(xiàn)更好。同時跟采用截斷閾值相比,ZNSwap可以達(dá)到圖3中的ideal。

2d8e0652-2b44-11ee-a368-dac502259ad0.png

圖8 換出帶寬和寫放大與設(shè)備使用率的關(guān)系

進(jìn)程交換性能隔離:同時運行兩個進(jìn)程,一個只讀,一個只寫,觀察兩個進(jìn)程的換入性能。結(jié)果如圖9所示。使用進(jìn)程策略,可以使得ZNswap在該條件下達(dá)到最優(yōu)帶寬。

2db61ba6-2b44-11ee-a368-dac502259ad0.png

圖9 進(jìn)程性能隔離實驗結(jié)果

總結(jié)

本篇文章針對基于塊SSD開啟內(nèi)存交換進(jìn)行分析后得出四個結(jié)論,塊SSD垃圾回收時所存在的缺陷。進(jìn)而提出使用ZNS SSD,并進(jìn)行內(nèi)存交換的優(yōu)化設(shè)計。具體包括資源搞笑的主機(jī)端GC、ZNGC-OS一體化和交換數(shù)據(jù)放置策略。通過最終的實驗結(jié)果可以得出,ZNswap可以得到較好的性能和較低的寫放大,同時也實現(xiàn)了較好的性能隔離。





審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 存儲器
    +關(guān)注

    關(guān)注

    38

    文章

    7403

    瀏覽量

    163393
  • 交換機(jī)
    +關(guān)注

    關(guān)注

    20

    文章

    2600

    瀏覽量

    98879
  • SSD
    SSD
    +關(guān)注

    關(guān)注

    20

    文章

    2812

    瀏覽量

    116993
  • SWAP
    +關(guān)注

    關(guān)注

    0

    文章

    51

    瀏覽量

    12755

原文標(biāo)題:?ZNSwap: 探索內(nèi)存交換的新出路

文章出處:【微信號:SSDFans,微信公眾號:SSDFans】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    PC不景氣,英特爾或要靠云計算和物聯(lián)網(wǎng)賺錢了

    PC產(chǎn)業(yè)不景氣,但英特爾找到了數(shù)據(jù)中心、物聯(lián)網(wǎng)服務(wù)等的新出路。
    發(fā)表于 10-15 08:36 ?628次閱讀

    LED照明新出路,智能化成賣點

    LED照明具有節(jié)能、環(huán)保、長壽、抗震、體積小、響應(yīng)速度快等優(yōu)點,其優(yōu)質(zhì)的性能吸引了數(shù)以萬計的LED小企業(yè)切入,除了傳統(tǒng)燈具商之外,國際照明廠商、LED顯示廠商紛紛在LED領(lǐng)域招兵買馬擺陣廝殺。
    發(fā)表于 05-23 16:16 ?1867次閱讀

    [分享]我們Hotmail.com認(rèn)為,恩格斯Hotmail Com這部著作的書名

    黑格爾那里被終結(jié)后出現(xiàn)的一條新出路或一個新出口。作為“出路”,費爾巴哈哲學(xué)已經(jīng)置身于德國古典哲學(xué)的范圍之外了。打個比方,如果德國古典哲學(xué)是一個“城堡”,那么費爾巴哈已經(jīng)“走出了”城堡。有人也許會反駁道
    發(fā)表于 08-15 15:52

    危機(jī)之后,看中國行業(yè)領(lǐng)頭羊指點本土手機(jī)技術(shù)提升新出路

    危機(jī)之后,看中國行業(yè)領(lǐng)頭羊指點本土手機(jī)技術(shù)提升新出路 經(jīng)濟(jì)危機(jī)爆發(fā)以后,歐美手機(jī)巨頭出貨量大幅下滑,中國本土廠商中興、華為以及部分
    發(fā)表于 11-05 08:43 ?790次閱讀

    交換機(jī)內(nèi)存

    交換機(jī)內(nèi)存         
    發(fā)表于 01-08 11:16 ?2697次閱讀

    固網(wǎng)寬帶存量空間還在緊縮,三大運營商探索智慧家庭新道路

    在面對固網(wǎng)寬帶市場不斷被壓縮的存量空間,三大運營商都早已經(jīng)探索出了智慧家庭時代的新出路。中國移將會打造數(shù)字家庭生態(tài)圈,中國電信已經(jīng)構(gòu)建起成型的智慧家庭生態(tài),中國聯(lián)通主推以視頻為引領(lǐng)的高帶寬內(nèi)容及應(yīng)用產(chǎn)品。
    發(fā)表于 11-30 14:04 ?5704次閱讀

    專訪鄭梁:富昌電子1688超級店走出電子元器件電商新出路

    隨著互聯(lián)網(wǎng)發(fā)展,電子元器件分銷行業(yè)正經(jīng)歷變革,分銷商們也在不斷探索新的出路,紛紛開辟自己的電商平臺。作為世界前三的電子元器件分銷商,富昌電子更是在推出自己全新的中國區(qū)官網(wǎng)之后,又和阿里巴巴超級店合作
    的頭像 發(fā)表于 08-21 10:30 ?6205次閱讀

    NFC技術(shù)或成新零售新出路

    隨著移動支付的普及,人們的衣食住行都可以通過一個手機(jī)解決,大大的提高了人們工作和出行的效率。
    的頭像 發(fā)表于 10-22 16:41 ?3218次閱讀

    光伏取暖能否成為光伏新出路?

    “531”新政出臺至今,光伏人可謂渡過了最煎熬的一段時間。憤懣、抱怨、指責(zé)、失望,當(dāng)然也有淡然與樂觀,各種情緒在從業(yè)者中彌漫。企業(yè)與產(chǎn)業(yè)層面,停產(chǎn)、欠薪、放假、降價……政策變化帶來的壓力與影響已加速顯現(xiàn)?!?31”帶來劇烈陣痛,也帶來反思,這次變化也必將成為光伏產(chǎn)業(yè)發(fā)展歷程中的重筆,深刻影響未來走向。 中國光伏市場可以用兩個詞來形容:艷陽高照、狂風(fēng)暴雨,未來希望仍是前者。
    的頭像 發(fā)表于 01-01 07:57 ?6261次閱讀

    自動駕駛可以在礦區(qū)運輸上做些什么

    伴隨著“無人運輸”的到來,司機(jī)的雙手雙腳即被解放,礦區(qū)運輸將迎來新出路。
    發(fā)表于 12-17 14:33 ?790次閱讀

    探索長三角產(chǎn)業(yè)數(shù)智化發(fā)展新出路

    致辭的最后,陳群偉誠摯邀請各位企業(yè)家走進(jìn)平湖、了解平湖、關(guān)注平湖、投資平湖、扎根平湖,共同續(xù)寫平湖“新故事”。平湖將一如既往為企業(yè)發(fā)展提供一流的政策、一流的配套以及一流的服務(wù),將始終致力于打造沒有最好、只有更好的營商環(huán)境。
    的頭像 發(fā)表于 04-22 09:47 ?1313次閱讀

    邊緣計算設(shè)備,手機(jī)循環(huán)經(jīng)濟(jì)的新出路

    據(jù)國家統(tǒng)計局公布的數(shù)據(jù),2020年,全國居民每百戶移動電話擁有量為253.8部。在中國信通院發(fā)布的最新報告中顯示,2021年前11個月,國內(nèi)市場手機(jī)總體出貨量累計3.17億部,同比增長12.8%,上市新機(jī)型累計427款,同比增長3.1%。 國內(nèi)手機(jī)市場出貨量,圖據(jù)中國信通院 供需兩旺造就了成熟的手機(jī)供應(yīng)鏈,在各家出貨量都有保障的前提下,為了刺激和吸引消費者,各大手機(jī)廠商在“搶首發(fā)”、“爭機(jī)皇”的大戰(zhàn)中卷了起來。 在他們都使用渾身解數(shù)推新的繁榮背
    的頭像 發(fā)表于 12-29 14:50 ?1326次閱讀
    邊緣計算設(shè)備,手機(jī)循環(huán)經(jīng)濟(jì)的<b class='flag-5'>新出路</b>

    如何解決內(nèi)存碎片與內(nèi)存交換效率慢的問題

    內(nèi)存分頁 分段的好處是能產(chǎn)生連續(xù)的內(nèi)存空間,但是會出現(xiàn)大量內(nèi)存碎片與內(nèi)存交換效率低的問題 先思考一下怎么解決這兩個問題,
    的頭像 發(fā)表于 10-09 16:57 ?906次閱讀
    如何解決<b class='flag-5'>內(nèi)存</b>碎片與<b class='flag-5'>內(nèi)存</b><b class='flag-5'>交換</b>效率慢的問題

    反射內(nèi)存交換機(jī)與普通交換機(jī)的區(qū)別

    反射內(nèi)存交換機(jī)與普通交換機(jī)在以下幾個方面存在明顯區(qū)別:工作原理和機(jī)制:反射內(nèi)存交換機(jī)基于反射內(nèi)存
    的頭像 發(fā)表于 09-05 09:57 ?333次閱讀
    反射<b class='flag-5'>內(nèi)存</b><b class='flag-5'>交換</b>機(jī)與普通<b class='flag-5'>交換</b>機(jī)的區(qū)別

    如何使用反射內(nèi)存交換機(jī)

    反射內(nèi)存交換機(jī)是一種用于實現(xiàn)高速數(shù)據(jù)共享和通信的關(guān)鍵設(shè)備,以下是關(guān)于如何使用反射內(nèi)存交換機(jī)的詳細(xì)介紹:一、前期準(zhǔn)備?在開始使用反射內(nèi)存
    發(fā)表于 09-14 09:23 ?0次下載