0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

挑戰(zhàn)存儲“不可能之三角”:用自研技術引領存儲性能突破

科技云報到 ? 來源:jf_60444065 ? 作者:jf_60444065 ? 2024-01-03 15:39 ? 次閱讀

科技云報道原創(chuàng)。

存儲,是數(shù)字化時代的“糧倉”。它承載著企業(yè)的海量數(shù)據(jù),是企業(yè)數(shù)字化轉型的基礎。

然而,隨著非結構化數(shù)據(jù)在生產業(yè)務中的廣泛應用,各行各業(yè)正在經歷數(shù)據(jù)量的爆炸式增長。雖然分布式存儲在大眾認知內具有高性價比和高擴展性,卻未被賦予高性能的標簽。

可以說,分布式存儲沒能完全解決存儲領域“大容量、高性能、高性價比不可能之三角”這一痛點。

分布式存儲的主要優(yōu)勢在于其出色的對象存儲能力,但在文件存儲的性能表現(xiàn)上,大小文件有所差異。

對于大文件的處理,由于技術壁壘較低,并且許多業(yè)界廠商已經針對此進行了深入研發(fā)和優(yōu)化,因此大文件的處理效果相對較好。

然而,分布式存儲對于小文件的處理卻受限于其開源的Ceph架構,需要處理大量小文件時,元數(shù)據(jù)管理、存儲空間和IO性能等能力跟不上,性能表現(xiàn)并不理想。

至于高性價比,這要求在低成本的同時提供更高的性能和更大的容量。以往業(yè)界認為,高性能一定伴隨著高成本,但實際上這是對高性能和高成本之間關系的誤解。

只有找不到合理有效的優(yōu)化手段或解決方案時,才可能需要通過增加硬件投入來提高性能。

那么,如何解決分布式存儲的“不可能之三角”?

這是一個值得深思的問題,也是一個不小的挑戰(zhàn)?,F(xiàn)在,在存儲賽道上,有一個“老道的新手”用自研技術,成功走到了大容量、高性能、高性價的交集里。

做分布式存儲易做好分布式存儲難

數(shù)字化浪潮洶涌向前,與之同行的是,存儲行業(yè)也要不斷地創(chuàng)新求變。

2018年前后,視頻、音頻等非結構化數(shù)據(jù)開始爆炸式增長,特別是在政府、醫(yī)療、媒體等領域存在大量的視頻數(shù)據(jù)存儲需求,對存儲海量數(shù)據(jù)、存儲系統(tǒng)的擴展性提出了新的要求,以集中式架構為主SAN、NAS傳統(tǒng)存儲瓶頸開始凸顯。

存儲市場需求的變化,也催化了新技術的爆發(fā)。這個時期,分布式存儲技術開始在各大廠商之間冒頭。

分布式存儲將數(shù)據(jù)分散存儲到多個存儲服務器上,并將這些分散的存儲資源構成一個虛擬的存儲設備,從而實現(xiàn)了存儲容量的擴展、性能的提升和成本的降低。

2020年,被視為分布式存儲爆發(fā)元年。根據(jù)IDC發(fā)布的《中國存儲市場季度追蹤報告》,2020年中國分布式存儲市場規(guī)模達到了37.2億美元,同比增長68.2%。

其中,企業(yè)級分布式存儲市場規(guī)模達到了33.8億美元,同比增長69.2%。

盡管分布式存儲已逐步進入生產領域,但市場的變化,仍在催生新的需求。

最初,市場的焦點主要在于“存下來”,即如何存儲日益增長的數(shù)據(jù),例如政府的智慧城市項目和醫(yī)療影像的長期存儲。

對于這類“第二存儲、備份歸檔”等邊緣數(shù)據(jù)場景,分布式存儲的低成本、高擴展性能夠很好地滿足。

隨著時間的推進,對存儲“高性能”的要求也日益提升,以滿足例如醫(yī)院的PACS閱片場景,實景三維場景,企業(yè)EDA場景等應用的需求。

這些應用不僅需要存儲海量數(shù)據(jù),還要求快速處理和分析這些數(shù)據(jù)。顯然,市場上普遍存在的“大容量但低性能”的分布式存儲已跟不上市場的需求。

近年來,隨著AI訓練、芯片等高精尖產業(yè)的快速發(fā)展,對存儲系統(tǒng)的“綜合性能”提出了更高的要求。

這些應用需要的不僅是海量的存儲容量,更要能夠處理混合負載,即高速的數(shù)據(jù)處理能力和對不同類型文件的支持。

事實上,在處理“混合負載”這一點上,目前分布式存儲產品普遍性能滿足不好。

混合負載的特點在于,既包括大文件(比如幾百兆甚至幾個G的視頻文件),也包括很多小文件(比如只有幾KB甚至更小的文本文件),當數(shù)據(jù)量達到一定規(guī)模,小文件的處理性能就成為性能瓶頸。

不難發(fā)現(xiàn),分布式存儲在一定程度上能夠解決傳統(tǒng)存儲在性能、擴展性方面的問題,但想要實現(xiàn)高性能的目標,依然非常困難??梢哉f,做分布式存儲容易,但做高性能的分布式存儲難。

分布式存儲想要解決“大容量、高性能、高性價比”的“不可能三角”難題,目前能夠完全作答的廠商并不多。

入局存儲賽道十年的深信服,正是其中的佼佼者。

堅持自研技術深信服挑戰(zhàn)存儲“不可能之三角”

2013年,深信服作為國內最早鉆研虛擬化技術的云計算廠商之一,憑借虛擬化技術的優(yōu)勢,開始摸索著切入存儲賽道,那時深信服內部稱之為“虛擬存儲”,顧名思義,扮演的角色是深信服桌面云和超融合存儲底座支撐。

彼時,經過超融合、桌面云的用戶“檢驗”之后的“虛擬存儲”,也日漸成熟。

隨著各行各業(yè)數(shù)據(jù)不斷增長,深信服看到了用戶在小文件場景面臨的困擾。2017年開始,深信服決定獨立發(fā)展存儲,加大投入,打造用戶真正需要的存儲底座。

在與傳統(tǒng)存儲廠商的競爭中,深信服搶占了先機:一方面,深信服精準把控了市場需求變化;另一方面,通過自研核心高性能架構,實現(xiàn)了彎道超車。

帶著對用戶需求的深刻洞察,從2020年開始,深信服EDS存儲將目光鎖定在了主存儲領域,專為“高性能大容量文件存儲”而生——能支持混合IO負載,兼具大小文件能力,瞄向高精尖場景。

2023年,深信服發(fā)布了EDS分布式存儲501高性能版本,這在存儲業(yè)界也意味著分布式存儲能堪當大任,承載核心生產業(yè)務。

在深信服看來,存儲“不可能之三角”的破題秘籍在于,充分發(fā)揮硬件存儲介質性能和提升軟件數(shù)據(jù)管理及處理能力,從而取得“高性能+大容量+高性價比”的平衡。

高性能和大容量一步到位

存儲設備的性能通常由其讀寫速度和承載數(shù)據(jù)量的能力來衡量,特別是在處理大量小文件時,讀寫速度和系統(tǒng)的穩(wěn)定性尤為重要。

在讀寫性能提升上,深信服EDS存儲設計的讀寫模式充分適應了SSD與HDD混合閃存介質的特性,以此充分激發(fā)硬件性能。同時,通過增加NVMe SSD即可實現(xiàn)容量的橫向擴展、性能的線性提升。

同樣大小的內存空間,深信服EDS存儲基于多活的元數(shù)據(jù)能力,可以充分發(fā)揮各節(jié)點的磁盤性能,讓元數(shù)據(jù)訪問效率提升 10 倍以上,可緩存的元數(shù)據(jù)規(guī)模是Ceph系產品的7倍,在 AI 訓練等場景下可以保持 90% 以上的元數(shù)據(jù)命中率。

不僅如此,深信服EDS存儲在IO整合、數(shù)據(jù)緩存與協(xié)議增強等核心技術方向上也構建了自己的核心能力,來提升海量小文件和大文件高吞吐場景的性能。

通過小文件的聚合和動態(tài)IO整合,深信服EDS存儲實現(xiàn)了性能層空間的最小化,并且在持續(xù)寫入文件的過程中,保障性能層不會被擊穿,始終保有充足的空間進行數(shù)值的排序與整合,通過這樣的動態(tài)整合來解決容量使用超過80%后導致的垃圾回收擠占而性能下降的問題。

對于延遲敏感型業(yè)務,深信服EDS存儲采用自適應三級緩存技術,縮短數(shù)據(jù)路徑將數(shù)據(jù)時延降至us級。

在協(xié)議增強上,相比于標準文件共享協(xié)議協(xié)議,深信服EDS存儲提升了2-3倍,進一步降低協(xié)議對性能的額外開銷,縮短時延和提升性能。

wKgaomWVDxeAe6d1AAGB0QHgBwo488.jpg

深信服EDS存儲性能和容量線性同步擴展

基于分布式存儲架構的天然優(yōu)勢,當用戶需要更大的存儲空間或者處理能力時,只需要添加更多的節(jié)點即可,無需改變已有的硬件或軟件結構,也無須面臨替換存儲陣列硬件的昂貴投入,獲得性能和容量的真正“自由”。

打破常規(guī):以更低成本驅動高性能和大容量

傳統(tǒng)陣列存儲如果要同時滿足大容量、高性能的需求,往往需要投入很高成本,高昂的磁盤陣列擴容擴展的費用也讓很多企業(yè)不堪重負。

而在深信服看來,同時獲得高性能和大容量可以用更經濟的方式,也不需要過度依賴昂貴、高端的硬件配置。

一方面,深信服EDS存儲實現(xiàn)了冷熱數(shù)據(jù)自動分層,熱數(shù)據(jù)存儲在NVMe 或SATA固態(tài)盤構建的高性能層,冷數(shù)據(jù)存儲在機械盤構建的大容量層,這樣能幫助用戶節(jié)省存儲的硬件成本。

另一方面,基于深舟數(shù)據(jù)管理平臺、EDSData Explorer等軟件,實現(xiàn)數(shù)據(jù)的高效壓縮和管理,64GB內存可以承載億級以上規(guī)模小文件的高速讀寫,幫助用戶合理規(guī)劃存儲的投入成本。

wKgZomWVDxiAecoYAAXfbrCVKmo520.jpg

深信服EDS存儲自研架構

通過硬件+軟件的組合式創(chuàng)新,深信服EDS分布式存儲在高性能、大容量、高性價比等方面都取得了顯著的提升,能夠滿足容量大且大小文件混合負載的應用場景,很好地解決了存儲“不可能之三角”。

對存儲而言,性能優(yōu)化可謂是一場沒有終點的馬拉松,持續(xù)在通用硬件上激發(fā)出更高、更穩(wěn)定的存儲性能,通過軟件實現(xiàn)更快的數(shù)據(jù)接入、數(shù)據(jù)管理,用戶便可以用更低的成本投入獲得可支撐核心業(yè)務運行的存儲產品。

自研分布式存儲系統(tǒng)的深信服,技術棧更加先進,加上軟硬件結合與適配,在性能、可靠性等方面出類拔萃,勝任高精尖領域的各種存儲需求。

一款產品好不好用客戶反饋是真正的試金石

一款好的存儲產品,不僅是實驗室里的高性能,更是用戶生產環(huán)境的實際需求的高性能。

上海某??漆t(yī)院的影像數(shù)據(jù)每年以15%的速度增長,深信服EDS存儲不僅滿足其擴容需求,而且還能輕松應對就診高峰期的高并發(fā)閱片,閱片端每秒可加載1000張CT影像。

這意味著,醫(yī)生可以在更短的時間內完成閱片,提高工作效率,為患者提供更優(yōu)質的醫(yī)療服務。

除了實實在在為醫(yī)院、醫(yī)療助力之外,深信服EDS存儲也應用在AI、芯片、測繪、媒體等多場景。

在芯片設計場景,深信服EDS存儲可以支撐更大規(guī)模的EDA仿真任務,激活100%活躍算力。這意味著,芯片設計企業(yè)可以更快地完成EDA仿真,縮短產品研發(fā)周期。

在測繪場景,EDS 501高性能版本每天可以處理70000張航片。

在航片導入場景,相比于其他廠商大文件吞吐能力提升2倍多;三維建模場景的小文件效率可接近于本地NVMe SSD,CASS3D在線打開海量小文件組成的三維成果數(shù)據(jù)耗時相比于某陣列NAS縮短8倍多。

結語

在高精尖領域的成功,深信服證明了EDS具有強大的市場適應性,這也為其在其他行業(yè)的發(fā)展奠定了良好的基礎。深信服之所以在這些場景中表現(xiàn)出強勁的性能,這得益于EDS的“業(yè)務優(yōu)先”理念。

深信服EDS存儲從不“唯數(shù)據(jù)論”,不盲目追求性能數(shù)據(jù)上的提升,而是落到真實的業(yè)務場景,針對業(yè)務特征進行性能優(yōu)化,為實際業(yè)務運行帶去更好的體驗。

同時,深信服EDS也不鼓吹“大而全”,而是聚焦在高性能文件存儲這一領域精益求精,力爭領導者。

深信服作為存儲領域“老道的新手”,在高性能存儲之路上,追求的不僅是將自身在云技術棧十多年積累的存儲技術用于EDS存儲,更重要的是深入到每個用戶的實際應用場景中,以生產業(yè)務的高性能需求為導向,真正實現(xiàn)用戶需求和技術優(yōu)勢的最佳結合。

【關于科技云報道】

專注于原創(chuàng)的企業(yè)級內容行家——科技云報道。成立于2015年,是前沿企業(yè)級IT領域Top10媒體。獲工信部權威認可,可信云、全球云計算大會官方指定傳播媒體之一。深入原創(chuàng)報道云計算、大數(shù)據(jù)、人工智能、區(qū)塊鏈等領域。

審核編輯 黃宇

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 存儲
    +關注

    關注

    13

    文章

    4180

    瀏覽量

    85505
  • 數(shù)字化
    +關注

    關注

    8

    文章

    8463

    瀏覽量

    61550
  • 分布式存儲
    +關注

    關注

    4

    文章

    166

    瀏覽量

    19484
收藏 人收藏

    評論

    相關推薦

    中國存儲三角逐步成形 急建廠力拼2018量產

    存儲產業(yè)在歷經價格血戰(zhàn)成了強鼎立的寡占市場,中國在市場、國安考量力求在存儲有所突圍,原先的紫光、武漢新芯從各自進擊到合體發(fā)展,另外兩組勢力在聯(lián)電、中芯老將輔佐下也積極展開布局,中國存儲
    發(fā)表于 11-15 10:59 ?944次閱讀

    三角符號

    誰知道這三角符號是干嘛的???突然蒙了~~
    發(fā)表于 07-21 22:23

    如何讓不可能成為可能?

    我們應當張開雙臂擁抱快節(jié)奏的技術變革,它推動科學技術的進步,讓人們更加緊密相連并感到安全自信,它改變了我們此前認為的不可能。這些成果的影響不再只孤立于一個狹窄的垂直市場,它滲透進了各行各業(yè),對現(xiàn)有
    發(fā)表于 10-15 06:12

    三角波發(fā)生器

    三角波發(fā)生器 該簡易三角
    發(fā)表于 09-17 16:41 ?2012次閱讀
    <b class='flag-5'>三角</b>波發(fā)生器

    使用斷星合三角隔延時的星三角啟動電路

    使用斷星合三角隔延時的星三角啟動電路
    發(fā)表于 02-27 10:24 ?4347次閱讀
    使用斷星合<b class='flag-5'>三角</b>隔延時的星<b class='flag-5'>三角</b>啟動電路

    相乘器實現(xiàn)三角

    相乘器實現(xiàn)三角波,好資料,可以下來看看
    發(fā)表于 01-10 21:35 ?10次下載

    什么是區(qū)塊鏈不可能三角為什么不可突破

    CAP定理證明了:當網絡存在分區(qū)時,提供可靠的原子一致性數(shù)據(jù)是不可能的,但是想要實現(xiàn)一致性、可用性、分區(qū)容錯性,個屬性中的兩個是可行的。在異步通信系統(tǒng)中,當沒有鎖提供時,如果出現(xiàn)消息丟失,即使允許過時的數(shù)據(jù)返回,提供一致性數(shù)據(jù)也是不可
    發(fā)表于 02-26 11:03 ?3163次閱讀
    什么是區(qū)塊鏈<b class='flag-5'>不可能</b><b class='flag-5'>三角</b>為什么<b class='flag-5'>不可</b><b class='flag-5'>突破</b>

    如何解決區(qū)塊鏈技術不可能三角的行業(yè)問題

    比特幣的區(qū)塊鏈技術就是追求的“不可能三角”里的“去中心化”和“安全性”。它的每一個節(jié)點都下載和儲存所有的交易數(shù)據(jù),但也同時帶來了巨大的儲存空間損耗和較長的校驗時間。比特幣每秒只能處理7筆交易,因此目前還是不能支持大規(guī)模的商用場景
    發(fā)表于 03-11 10:40 ?1411次閱讀

    如何解決公鏈面臨的不可能三角模型問題

    「底層公鏈 → 解決方案 → 行業(yè)應用」是區(qū)塊鏈業(yè)內公認的發(fā)展邏輯。作為底層技術,公鏈支撐整個行業(yè)的發(fā)展,決定區(qū)塊鏈應用生態(tài)的發(fā)展進程。然而,公鏈面臨「不可能三角模型」、「根特別多、沒長葉子的市場」等困境,極大的限制了區(qū)塊鏈
    發(fā)表于 07-19 10:58 ?2143次閱讀
    如何解決公鏈面臨的<b class='flag-5'>不可能</b><b class='flag-5'>三角</b>模型問題

    長鑫存儲亮相閃存技術峰會 引領中國DRAM技術突破

    作為中國DRAM產業(yè)的領導者,長鑫存儲正在加速從DRAM的技術追趕者向技術引領者轉變,自主研發(fā)的DRAM
    發(fā)表于 09-19 10:26 ?573次閱讀

    什么是區(qū)塊鏈中的不可能三角

    區(qū)塊鏈本質上是一個去中心化的分布式賬本數(shù)據(jù)庫,它也存在“不可能三角”。今天,我們就來講講“不可能三角”在區(qū)塊鏈世界是如何權衡和妥協(xié)的。
    發(fā)表于 12-13 08:59 ?8451次閱讀

    區(qū)塊鏈如何解決醫(yī)療數(shù)據(jù)中的不可能三角

    不可能三角”一詞,最早來自金融經濟領域,指的是資本自由流動、匯率穩(wěn)定和貨幣政策獨立性不可能兼得。
    發(fā)表于 01-17 10:26 ?1576次閱讀

    三角三角地圖

    我國LED產業(yè)發(fā)展緣2013年提出的“國家高技術研究發(fā)展計劃”(簡稱863計劃),我國LED產業(yè)發(fā)展起步晚于國外發(fā)達國家,最早由珠三角地區(qū)承接國外LED產業(yè)轉移和產業(yè)布局。以地域分布來看,中國
    的頭像 發(fā)表于 09-11 14:32 ?5921次閱讀
    長<b class='flag-5'>三角</b>珠<b class='flag-5'>三角</b>地圖

    三角測距是什么意思?三角測距原理圖解

    三角測距是什么意思?三角測距原理圖解 三角測距是什么意思? 三角測距法是一種低成本的激光雷達測距方案,三角測距是利用激光這把尺子,根據(jù)各種參
    的頭像 發(fā)表于 06-21 17:33 ?3.7w次閱讀
    <b class='flag-5'>三角</b>測距是什么意思?<b class='flag-5'>三角</b>測距原理圖解

    康盈半導體存儲新品閃耀elexcon 2024深圳展

    在elexcon 2024深圳國際電子展的璀璨舞臺上,國產存儲領域的佼佼者康盈半導體以“向芯而行,智儲無界”為主題,強勢推出存儲新品
    的頭像 發(fā)表于 08-29 15:58 ?249次閱讀