0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

讓Ceph存儲(chǔ)的性能飆升的原因竟然是因?yàn)樗?

存儲(chǔ)加速器 ? 來(lái)源:YXQ ? 2019-07-05 15:11 ? 次閱讀

?Ceph作為一款開(kāi)源的分布式存儲(chǔ)軟件解決方案,由于其功能豐富、社區(qū)活躍,在公有云和私有云環(huán)境中有著廣泛的應(yīng)用。

然而,由于Ceph的大規(guī)模分布式架構(gòu)原因,其IO路徑過(guò)長(zhǎng),使得其性能一直被業(yè)界所詬病。

現(xiàn)實(shí)中,Ceph更多用在備份和歸檔等性能要求不高的場(chǎng)景。在這種場(chǎng)景下,一般存儲(chǔ)介質(zhì)采用HDD,很少采用全閃存的配置。

伴隨著固態(tài)盤(SSD)價(jià)格的不斷走低,云提供商紛紛開(kāi)始著手為客戶打造具備卓越性能和高可靠性的全閃存存儲(chǔ)。

為此,他們迫切希望獲得基于 Ceph 的全閃存參考架構(gòu),并了解具體的性能表現(xiàn)和最佳優(yōu)化實(shí)踐。

英特爾?傲騰? 技術(shù)前所未有地集高吞吐量、低延遲、高服務(wù)質(zhì)量和高耐用性優(yōu)勢(shì)于一身,它由 3D XPoint? 內(nèi)存介質(zhì)和英特爾?軟件等組合而成。

這些構(gòu)建模塊相互配合,配合至強(qiáng)可擴(kuò)展處理器,在降低延遲和加速系統(tǒng)性能方面實(shí)現(xiàn)了具體提升,能夠全面滿足工作負(fù)載對(duì)于大容量和快速存儲(chǔ)的需求。

本篇文章將圍繞 Ceph 全閃存存儲(chǔ)系統(tǒng)參考架構(gòu)和基于英特爾?至強(qiáng)?可擴(kuò)展處理器的軟件優(yōu)化等方面,介紹Intel所取得的進(jìn)展。

在本文中,將重點(diǎn)為您介紹Ceph 參考架構(gòu)和性能結(jié)果,該架構(gòu)的配置包括 RADOS 塊設(shè)備(RBD)接口、英特爾?傲騰? 技術(shù)和英特爾?至強(qiáng)?可擴(kuò)展處理器產(chǎn)品家族(英特爾?至強(qiáng)?鉑金 8180 處理器和英特爾?至強(qiáng)?金牌 6140 處理器)。

我們先介紹采用英特爾?傲騰? 技術(shù)和英特爾?至強(qiáng)?可擴(kuò)展處理器的Ceph 全閃存陣列(AFA)參考架構(gòu),然后介紹典型工作負(fù)載的性能結(jié)果和系統(tǒng)特性。

Intel建議Ceph AFA采用英特爾?至強(qiáng)?鉑金 8180 處理器,它是英特爾?至強(qiáng)?可擴(kuò)展處理器產(chǎn)品家族中先進(jìn)的處理器。

建議使用英特爾?傲騰? 固態(tài)盤(SSD)作為BlueStore WAL(Write-Ahead Logging) 設(shè)備,使用基于 NAND 固態(tài)盤作為數(shù)據(jù)硬盤,并使用 Mellanox 40 GbE 網(wǎng)絡(luò)接口卡(NIC)作為高速以太網(wǎng)數(shù)據(jù)端口,具備最高性能(吞吐量和延遲)。它是 I/O 密集型工作負(fù)載的最佳選擇。

測(cè)試系統(tǒng)由5個(gè)Ceph存儲(chǔ)服務(wù)器和5個(gè)客戶端節(jié)點(diǎn)組成。

每個(gè)存儲(chǔ)節(jié)點(diǎn)配置Intel Xeon Platinum 8180處理器和384 GB內(nèi)存,使用1x Intel Optane SSD DC P4800X 375GB作為BlueStore WAL設(shè)備,4x Intel SSD DC P3520 2TB作為數(shù)據(jù)驅(qū)動(dòng)器,以及2x Mellanox 40 GbE NIC作為Ceph的獨(dú)立集群和公共網(wǎng)絡(luò)。

同時(shí),每個(gè)節(jié)點(diǎn)均使用 Ceph 12.2.2,并且每個(gè)英特爾?固態(tài)盤 DC P3520 系列運(yùn)行一個(gè)對(duì)象存儲(chǔ)守護(hù)程序(OSD)。用于測(cè)試的 RBD 池配置有 2 個(gè)副本。

對(duì)于客戶端,每個(gè)節(jié)點(diǎn)配置了英特爾?至強(qiáng)?鉑金 8180 處理器、384 GB 內(nèi)存和 1 個(gè) Mellanox 40GbE 網(wǎng)卡。

Intel設(shè)計(jì)了四種不同的工作負(fù)載來(lái)模擬云中典型的全閃存 Ceph 集群(基于帶 librbd 的 fio),其中包括 4K 隨機(jī)讀寫(xiě)和 64K 順序讀寫(xiě),以分別模擬隨機(jī)工作負(fù)載和順序工作負(fù)載。對(duì)于每個(gè)測(cè)試用例,IO 性能(IOPS 或帶寬)使用卷擴(kuò)展數(shù)量(最大擴(kuò)展到 100)來(lái)衡量,每個(gè)卷配置為 30 GB。

這些卷已預(yù)先分配,以消除 Ceph 精簡(jiǎn)配置機(jī)制的影響,獲得穩(wěn)定且可復(fù)制的結(jié)果。每次測(cè)試之前停止 OSD 頁(yè)高速緩存,以消除頁(yè)高速緩存的影響。在每個(gè)測(cè)試用例中,fio 配置了 300 秒的準(zhǔn)備時(shí)限和 300 秒的數(shù)據(jù)采集時(shí)限。

?

4K隨機(jī)寫(xiě)特性

用戶空間消耗的CPU利用率為37%,占CPU總利用率的75%。分析結(jié)果顯示Ceph OSD過(guò)程消耗了大部分CPU周期; CPU還有空間的可疑原因是軟件線程和鎖定模型實(shí)現(xiàn)限制了Ceph在單個(gè)節(jié)點(diǎn)上的擴(kuò)展能力,這仍然是下一步優(yōu)化工作。

4K隨機(jī)寫(xiě)入的系統(tǒng)指標(biāo)

?

4K隨機(jī)讀取特性

CPU利用率約為60%,其中IOWAIT約占15%,因此實(shí)際CPU消耗也約為45%;類似于隨機(jī)寫(xiě)例。OSD磁盤的讀取IOPS非常穩(wěn)定在80K,40 GBbE NIC帶寬約為2.1 GB/s。沒(méi)有觀察到明顯的硬件瓶頸;疑似軟件瓶頸類似于4K隨機(jī)寫(xiě)入案例,需要進(jìn)一步調(diào)查。

4K隨機(jī)讀取的系統(tǒng)指標(biāo)

64K順序?qū)懭胩匦?/strong>

順序?qū)懭氲腃PU利用率和內(nèi)存消耗非常低。由于OSD復(fù)制數(shù)為2,因此NIC數(shù)據(jù)的傳輸帶寬是接收帶寬的兩倍,傳輸帶寬包括兩個(gè)NIC的帶寬,一個(gè)用于公共網(wǎng)絡(luò),一個(gè)用于群集網(wǎng)絡(luò),每個(gè)NIC大約1.8 GB /每個(gè)端口。OSD磁盤AWAIT時(shí)間受到嚴(yán)重波動(dòng),最高磁盤延遲超過(guò)4秒,而磁盤IOPS非常穩(wěn)定。

64K順序?qū)懭氲南到y(tǒng)指標(biāo)

?

64K順序讀取特性

對(duì)于順序讀取案例,我們觀察到一個(gè)NIC的帶寬達(dá)到4.4 GB/s,約占總帶寬的88%。順序?qū)懭氲腃PU利用率和內(nèi)存消耗非常低。OSD磁盤讀取IOPS和延遲穩(wěn)定。

64K順序讀取的系統(tǒng)指標(biāo)

總體來(lái)看,基于英特爾Optane技術(shù)的Ceph AFA集群展示了出色的吞吐量和延遲。

64K順序讀寫(xiě)吞吐量分別為21,949 MB/s和8,714 MB/s(最大為40 GbE NIC)。4K隨機(jī)讀取吞吐量為2,453K IOPS,平均延遲為5.36 ms,而4K隨機(jī)寫(xiě)入吞吐量為500K IOPS,平均延遲為12.79 ms。

其實(shí)自從Ceph Giant發(fā)布以來(lái),英特爾一直與社區(qū),生態(tài)系統(tǒng)和合作伙伴密切合作,一直優(yōu)化Ceph的性能。下圖顯示了Ceph主要版本和不同Intel平臺(tái)上4K隨機(jī)寫(xiě)入工作負(fù)載的性能優(yōu)化歷史記錄。

憑借新的Ceph主要版本,后端存儲(chǔ),結(jié)合核心平臺(tái)變化和SSD升級(jí),單個(gè)節(jié)點(diǎn)的4K隨機(jī)寫(xiě)入性能提高了27倍(每個(gè)節(jié)點(diǎn)每秒輸入/輸出操作3,673次(IOPS)至每個(gè)節(jié)點(diǎn)100,052 IOPS)!

這使得使用Ceph構(gòu)建高性能存儲(chǔ)解決方案成為可能。

在本文中,我們?cè)谟⑻貭栔翉?qiáng)可擴(kuò)展處理器上看到了采用Ceph AFA參考架構(gòu)的英特爾Optane技術(shù)的性能結(jié)果。此配置展示了出色的吞吐量和延遲,除了延遲比傳統(tǒng)的高端存儲(chǔ)有些差距外,帶寬和IOPS都達(dá)到了高端存儲(chǔ)的水平。

對(duì)于讀取密集型工作負(fù)載,尤其是小塊讀,對(duì)CPU性能要求比較高,建議使用英特爾至強(qiáng)可擴(kuò)展處理器系列的頂級(jí)處理器,例如英特爾至強(qiáng)鉑金8000系列處理器。

與采用英特爾至強(qiáng)可擴(kuò)展處理器上的Ceph AFA集群的默認(rèn)配置的英特爾Optane技術(shù)相比,軟件調(diào)優(yōu)和優(yōu)化還為讀取和寫(xiě)入提供了高達(dá)19%的性能提升。

由于使用當(dāng)前的硬件配置可以觀察到硬件性能還有凈空,因此性能有望在不久的將來(lái)通過(guò)持續(xù)的Ceph優(yōu)化(如RDMA messenger,NVMe-focus對(duì)象存儲(chǔ),async-osd等)不斷改進(jìn)。

相信有了英特爾?至強(qiáng)?可擴(kuò)展處理器和傲騰?技術(shù)的支持,加上Ceph不斷優(yōu)化,未來(lái)Ceph的性能將會(huì)更好,Ceph也將越來(lái)越多用于主存儲(chǔ)場(chǎng)景,而不僅僅是目前聚焦的第二存儲(chǔ)場(chǎng)景。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 存儲(chǔ)器
    +關(guān)注

    關(guān)注

    38

    文章

    7408

    瀏覽量

    163416
  • Ceph
    +關(guān)注

    關(guān)注

    1

    文章

    22

    瀏覽量

    9390

原文標(biāo)題:讓Ceph存儲(chǔ)的性能飆升的原因竟然是因?yàn)樗?/p>

文章出處:【微信號(hào):TopStorage,微信公眾號(hào):存儲(chǔ)加速器】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    遠(yuǎn)程升級(jí)頻頻失???原因竟然是

    ?最近有客戶反饋在鄉(xiāng)村里頻繁出現(xiàn)掉線的情況。 趕緊排查原因! 通過(guò)換貨、換SIM卡對(duì)比排查測(cè)試,發(fā)現(xiàn)只有去年采購(gòu)的那批模塊在客戶環(huán)境附近會(huì)出現(xiàn)掉線的情況,而今年采購(gòu)的模塊批次就不會(huì)掉線。。。 繼續(xù)
    的頭像 發(fā)表于 10-14 07:07 ?59次閱讀
    遠(yuǎn)程升級(jí)頻頻失?。?b class='flag-5'>原因</b><b class='flag-5'>竟然是</b>…

    異常重啟怎么破?多方排查后,原因竟然是。。。

    ?又是異常重啟。。。人摸不到頭腦。 這幾天,看到客戶上報(bào)了重啟問(wèn)題,說(shuō)是查不出原因。 重啟現(xiàn)象是 ——有極個(gè)別設(shè)備在工作中不定時(shí)反復(fù)異常重啟,大部分設(shè)備正常;反復(fù)重啟設(shè)備,有時(shí)候又能持續(xù)正常工作
    的頭像 發(fā)表于 10-14 07:04 ?108次閱讀
    異常重啟怎么破?多方排查后,<b class='flag-5'>原因</b><b class='flag-5'>竟然是</b>。。。

    谷景科普一體成型貼片電感很燙是因?yàn)?/b>短路嗎

    谷景科普一體成型貼片電感很燙是因?yàn)?/b>短路嗎 編輯:谷景電子 一體成型貼片電感對(duì)于電子電路運(yùn)行的穩(wěn)定性是特別重要的,在電路中它可以抵抗電流的變化并存儲(chǔ)能量。但是,有時(shí)候在一些情況下會(huì)出現(xiàn)溫度過(guò)高的現(xiàn)象
    的頭像 發(fā)表于 08-16 09:18 ?230次閱讀

    基于DPU的Ceph存儲(chǔ)解決方案

    1. 方案背景和挑戰(zhàn) Ceph是一個(gè)高度可擴(kuò)展、高性能的開(kāi)源分布式存儲(chǔ)系統(tǒng),設(shè)計(jì)用于提供優(yōu)秀的對(duì)象存儲(chǔ)、塊存儲(chǔ)和文件
    的頭像 發(fā)表于 07-15 13:44 ?1215次閱讀
    基于DPU的<b class='flag-5'>Ceph</b><b class='flag-5'>存儲(chǔ)</b>解決方案

    晶體為什么會(huì)老化?原因竟然是....

    晶體
    TROQ創(chuàng)捷電子
    發(fā)布于 :2024年06月25日 08:52:52

    手機(jī)出問(wèn)題的元兇找到了!萬(wàn)萬(wàn)沒(méi)想到,竟然是因?yàn)?/b>!#esd# 保護(hù)器件

    保護(hù)器件半導(dǎo)體元器件
    薩瑞微電子
    發(fā)布于 :2024年04月15日 16:07:27

    使用tc397進(jìn)行收發(fā)的時(shí)候沒(méi)有響應(yīng)是因?yàn)?/b>什么?

    在使用 tc397 進(jìn)行收發(fā)的時(shí)候,發(fā)現(xiàn)沒(méi)有響應(yīng),代碼是根據(jù)示例代碼修改,通過(guò)邏輯分析儀和示波器進(jìn)行調(diào)試的 只修改了對(duì)應(yīng)的 tx,rx 引腳,請(qǐng)問(wèn)可能是因?yàn)?/b>什么原因
    發(fā)表于 03-05 07:45

    IBM積極推進(jìn)Ceph擴(kuò)展,以打造AI領(lǐng)域的底層數(shù)據(jù)存儲(chǔ)基石

    BM正著手?jǐn)U展Ceph的塊和文件存儲(chǔ)功能,希望將其定位為Storage Scale并行文件系統(tǒng)之下面向AI工作負(fù)載的后端數(shù)據(jù)存儲(chǔ)。
    發(fā)表于 02-20 16:15 ?330次閱讀

    N9H20 GPIO上電竟然是高電平,有沒(méi)有辦法解決?

    一直很納悶,GPIO上電竟然是高電平。有沒(méi)有辦法解決,是不是要改動(dòng)啟動(dòng)程序才能解決問(wèn)題?
    發(fā)表于 01-17 08:27

    請(qǐng)問(wèn)怎樣使用cephadm部署ceph集群呢?

    從紅帽ceph5開(kāi)始使用cephadm代替之前的ceph-ansible作為管理整個(gè)集群生命周期的工具,包括部署,管理,監(jiān)控。
    的頭像 發(fā)表于 01-16 09:32 ?1209次閱讀
    請(qǐng)問(wèn)怎樣使用cephadm部署<b class='flag-5'>ceph</b>集群呢?

    錫膏不上錫是因?yàn)?/b>活性不足嗎?

    眾所周知,有時(shí)候錫膏不上錫是因?yàn)?/b>活性不足,還有人會(huì)說(shuō)活性越多越好。有時(shí)候錫膏不掛錫是因?yàn)?/b>活性不足嗎。這樣的話,你會(huì)覺(jué)得錫膏的活性越高越好嗎?下一步由深圳錫膏廠家為大家分析一下:大家都知道錫膏中有許多
    的頭像 發(fā)表于 01-04 15:46 ?545次閱讀
    錫膏不上錫<b class='flag-5'>是因?yàn)?/b>活性不足嗎?

    鋰電池高溫存儲(chǔ)性能衰減原因

    鋰電池高溫存儲(chǔ)性能衰減原因? 鋰電池作為一種重要的能量存儲(chǔ)技術(shù),在手機(jī)、電動(dòng)車等眾多領(lǐng)域得到了廣泛應(yīng)用。然而,鋰電池在高溫環(huán)境下的存儲(chǔ)
    的頭像 發(fā)表于 12-08 16:05 ?1822次閱讀

    【飛騰派4G版免費(fèi)試用】第一篇:開(kāi)箱見(jiàn)面和資料下載

    ://www.phytium.com.cn/ 3、 找到飛騰派的主頁(yè) 4、 拉到最底端,能夠清晰的看到產(chǎn)品與資料的獲取。官網(wǎng)不能下載自己的資料,竟然是外部鏈接,這是我萬(wàn)萬(wàn)沒(méi)想到的?。ㄎ揖?b class='flag-5'>是因?yàn)?/b>這點(diǎn)才發(fā)表一個(gè)資料的下載
    發(fā)表于 12-05 14:10

    你不知道的FPC,的發(fā)展史竟然是這樣的!

    你不知道的FPC,的發(fā)展史竟然是這樣的!
    的頭像 發(fā)表于 11-15 10:48 ?958次閱讀

    stlink無(wú)法識(shí)別是因?yàn)?/b>什么?

    stlink無(wú)法識(shí)別是因?yàn)?/b>什么
    發(fā)表于 10-31 06:40