0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

專用數(shù)據(jù)壓縮引擎,提高數(shù)據(jù)中心效率

星星科技指導員 ? 來源:microchip ? 作者:microchip ? 2023-05-06 10:30 ? 次閱讀

壓縮并不是一個新概念,但隨著存儲需求的增長,它正成為數(shù)據(jù)中心中更重要的工具。目標當然是使用比原始數(shù)據(jù)更少的位對信息進行編碼,從而減小數(shù)據(jù)的大小。計算效率優(yōu)勢還體現(xiàn)在需要移動的數(shù)據(jù)更少。

有兩種不同類型的壓縮:

1. 有損,最適合 mp3、jpeg - 通常用于音頻視頻流應用

2. 無損,例如在 zip 文件中使用 - 其中所有數(shù)據(jù)必須可供應用程序使用

對于這兩種類型,都有多種壓縮技術(shù)可用。一些最常見的包括:

? 匹配查找:在這種技術(shù)中,算法在數(shù)據(jù)集中查找冗余,如重復的字節(jié)串,并存儲冗余數(shù)據(jù)的單個副本。通過將數(shù)據(jù)字符串的其他匹配項替換為對要讀取的存儲副本位置的引用來減少數(shù)據(jù)量。

?熵編碼:該技術(shù)在看似任意的數(shù)據(jù)序列中查找模式,并分配一個符號或編碼一個值來表示隨機數(shù)據(jù)集中的重復模式。通過將重復模式替換為單個值來減小數(shù)據(jù)的大小。

? 模型壓縮:這種先進的技術(shù)針對需要巨大計算能力和昂貴的高速 GPU 才能運行的機器學習模型和 AI 應用程序。為了在小型嵌入式系統(tǒng)上傳輸和處理復雜的神經(jīng)網(wǎng)絡(luò)算法,通過刪除冗余的神經(jīng)網(wǎng)絡(luò)連接或?qū)⑸窠?jīng)網(wǎng)絡(luò)權(quán)重和偏差捆綁到集群中來壓縮機器學習模型,從而減少要存儲的數(shù)據(jù)的總大小。

重復數(shù)據(jù)刪除或重復數(shù)據(jù)刪除(與匹配查找壓縮技術(shù)一樣)會刪除重復的數(shù)據(jù)副本,以便僅存儲一個副本。它通常用于存儲設(shè)備的上下文或數(shù)據(jù)中心的系統(tǒng)級別,您可以在其中找到存儲的共享文件的單個副本,并且每次由其他用戶使用該文件時,對該副本的引用數(shù)量都會遞增。dedup 的優(yōu)點是它可以對大型數(shù)據(jù)集(例如整個存儲集群)使用相同的匹配查找壓縮算法,并減少存儲需求。

poYBAGRVu6mANKiUAAB3scLI9uw106.png

許多存儲系統(tǒng)同時支持壓縮和重復數(shù)據(jù)刪除,以最大化存儲容量。除了節(jié)省存儲容量外,壓縮還可以提高系統(tǒng)性能。最基本的原則是通過寫入更少的數(shù)據(jù),數(shù)據(jù)總線利用率增加,從而提高寫入帶寬和性能。

壓縮率是未壓縮數(shù)據(jù)的大小除以壓縮數(shù)據(jù)的大小。未壓縮數(shù)據(jù)的壓縮率為 1。壓縮比越高,數(shù)據(jù)的壓縮程度就越高。這在使用昂貴閃存的SSD應用中非常重要,因為寫入數(shù)據(jù)所涉及的架構(gòu)必須擦除閃存單元才能重新編程,以及可用的程序和擦除周期數(shù)有限的介質(zhì)的性質(zhì)。在 Flash 操作中,擦除只能在塊級別進行,而編程是在頁面級別完成的,導致擦除和重寫的閃存部分比任何新數(shù)據(jù)所需的要大。閃存中不需要更新但正在擦除以允許傳入頁面寫入操作的部分必須存儲在其他位置,并且必須更新對此數(shù)據(jù)的所有引用以供將來訪問。SSD 上對閃存存儲的所有寫入的這種乘數(shù)效應增加了實際閃存寫入操作與來自主機的傳入數(shù)據(jù)寫入請求的比率。此比率最小值為 1,寫入放大比率越高,啟動的程序和擦除周期就越多,從而耗盡 SSD 的整體耐用性。通過壓縮數(shù)據(jù)的原始大小,可以將較小大小的數(shù)據(jù)集存儲在閃存中,寫入放大因子小于1,從而減少編程和擦除周期,并延長SSD的使用壽命。

基準壓縮率和性能的最常見的壓縮測試機構(gòu)或語料庫是卡爾加里語料庫,坎特伯雷語料庫和西里西亞語料庫。西里西亞是最新的,它利用涵蓋當今用例的更新數(shù)據(jù)集。附表說明了PCIe Gen-4 Flashtec NVMe3016企業(yè)級NVMe SSD控制器在測試下的性能。

壓縮比是通過專用壓縮引擎實現(xiàn)的,該引擎符合無損算法的 Deflate 壓縮數(shù)據(jù)格式規(guī)范 (RFC-1951),具有簡化的內(nèi)部格式 (zlib)。

? 數(shù)據(jù)格式基于塊,如果未對齊,則進行填充

? 壓縮和未壓縮的數(shù)據(jù)塊大小可配置為 32B-8KB,使用 SGL 時最高配置為 64KB

結(jié)合 SHA-256 哈希引擎、高 CPU 處理能力以及 NVMe3106 控制器的高級靈活可編程架構(gòu),用戶可以自定義其 SSD 固件,以使用各種硬件旋鈕實現(xiàn)最有效的壓縮方案,以滿足其應用需求。

作為企業(yè)級NVMe SSD控制器市場的行業(yè)領(lǐng)先支持解決方案,F(xiàn)lashtec NVMe3016 NVMe SSD控制器支持創(chuàng)新的存儲解決方案,基于高度靈活和可編程的控制器平臺,提供高性能,低成本和電源效率。硬件壓縮只是使 Flashtec? 產(chǎn)品成為未來數(shù)據(jù)中心企業(yè)級 NVMe SSD 的正確解決方案的眾多功能之一。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 控制器
    +關(guān)注

    關(guān)注

    112

    文章

    16033

    瀏覽量

    176656
  • SSD
    SSD
    +關(guān)注

    關(guān)注

    20

    文章

    2812

    瀏覽量

    116996
  • 數(shù)據(jù)中心
    +關(guān)注

    關(guān)注

    16

    文章

    4577

    瀏覽量

    71806
收藏 人收藏

    評論

    相關(guān)推薦

    如何提高數(shù)據(jù)中心電能使用效率?

    近年來,隨著數(shù)據(jù)中心的迅猛發(fā)展,數(shù)據(jù)中心的能耗問題也越來越突出,有關(guān)數(shù)據(jù)中心的能源管理和供配電設(shè)計已經(jīng)成為熱門問題,合理可靠的數(shù)據(jù)中心配電系統(tǒng)方案,是
    發(fā)表于 07-19 13:58 ?1478次閱讀
    如何<b class='flag-5'>提高</b><b class='flag-5'>數(shù)據(jù)中心</b>電能使用<b class='flag-5'>效率</b>?

    走向綠色數(shù)據(jù)中心的7種手段

    了冷卻單元的容量,從而提高了冷卻效率?! ?.控制冷卻:根據(jù)外部天氣來追蹤冷卻要求是個好主意。例如,在涼爽的日子,關(guān)閉一些冷卻器和壓縮機,并依靠外界的冷氣來有效降低數(shù)據(jù)中心的溫度。使用
    發(fā)表于 08-16 15:35

    基于FPGA的高性能無損數(shù)據(jù)壓縮IP

    LZOAccel-CLZO Data Compression CoreLZOAccel-C是一個無損數(shù)據(jù)壓縮引擎的FPGA硬件實現(xiàn),兼容LZO 2.10標準。Core接收未壓縮的輸入數(shù)據(jù)
    發(fā)表于 12-21 23:10

    數(shù)據(jù)中心市場的十大趨勢

    數(shù)據(jù)從本地服務(wù)器移動到服務(wù)提供商的云數(shù)據(jù)中心。這提高了基礎(chǔ)設(shè)施的靈活性,因為企業(yè)可以選擇專用或共享服務(wù)器、公有云或私有云以及混合服務(wù),以滿足其快速變化的需求。4.從數(shù)字轉(zhuǎn)變?yōu)槿萘勘M管
    發(fā)表于 12-31 22:23

    MapReduce數(shù)據(jù)壓縮的基本原則

    黑猴子的家:MapReduce數(shù)據(jù)壓縮
    發(fā)表于 05-24 12:45

    數(shù)據(jù)中心是什么

    數(shù)據(jù)中心是什么:數(shù)據(jù)中心是全球協(xié)作的特定設(shè)備網(wǎng)絡(luò),用來在因特網(wǎng)絡(luò)基礎(chǔ)設(shè)施上傳遞、加速、展示、計算、存儲數(shù)據(jù)信息。數(shù)據(jù)中心大部分電子元件都是由低直流電源驅(qū)動運行的。
    發(fā)表于 07-12 07:10

    如何去提高數(shù)據(jù)中心的運營效率

    提高數(shù)據(jù)中心的運營效率。針對數(shù)據(jù)中心的能耗即使當前的整個數(shù)據(jù)中心行業(yè)掀起了整合物理資源,并將部分的IT功能遷移到場外異地的新趨勢,但為
    發(fā)表于 09-09 06:14

    【ELT.ZIP】OpenHarmony啃論文俱樂部——多層存儲分級數(shù)據(jù)壓縮

    HCompress,它是一個分層數(shù)據(jù)壓縮引擎,可協(xié)調(diào)利用多層存儲和數(shù)據(jù)壓縮提高應用程序性能,下面我們即對其展開研究。應用Hcompress是圖像
    發(fā)表于 07-23 13:20

    【學習打卡】【ELT.ZIP】OpenHarmony啃論文俱樂部——多層存儲分級數(shù)據(jù)壓縮

    HCompress,它是一個分層數(shù)據(jù)壓縮引擎,可協(xié)調(diào)利用多層存儲和數(shù)據(jù)壓縮提高應用程序性能,下面我們即對其展開研究。應用Hcompress是圖像
    發(fā)表于 07-23 13:26

    數(shù)據(jù)壓縮技術(shù)

    一、數(shù)據(jù)壓縮的必要性二、多媒體數(shù)據(jù)壓縮的可能性三、壓縮方案應滿足的要求四、編碼方案分類五、數(shù)據(jù)壓縮(編碼)的主要步驟六、一些基本的壓縮技術(shù)七
    發(fā)表于 03-25 13:19 ?35次下載

    數(shù)據(jù)壓縮的重要性

    數(shù)據(jù)壓縮是指在不丟失有用信息的前提下,縮減數(shù)據(jù)量以減少存儲空間,提高其傳輸、存儲和處理效率,或按照一定的算法對數(shù)據(jù)進行重新組織,減少
    的頭像 發(fā)表于 02-28 10:45 ?1.4w次閱讀

    如何才能提高數(shù)據(jù)中心服務(wù)器的效率

    研究表明,雖然數(shù)據(jù)中心的能耗成本高昂,但服務(wù)器效率也越來越高。每個數(shù)據(jù)中心都擁有運行各種工作負載的大量服務(wù)器。無論是企業(yè)數(shù)據(jù)中心、托管數(shù)據(jù)中心
    發(fā)表于 06-01 08:00 ?1次下載
    如何才能<b class='flag-5'>提高</b><b class='flag-5'>數(shù)據(jù)中心</b>服務(wù)器的<b class='flag-5'>效率</b>

    這些措施將提高數(shù)據(jù)中心效率和性能

    關(guān)于數(shù)據(jù)中心的優(yōu)化和改進通常有很多建議,隨著對數(shù)據(jù)中心需求的不斷增長,很多數(shù)據(jù)中心運營商正在考慮如何提高數(shù)據(jù)中心設(shè)計、建設(shè)和運營的
    發(fā)表于 05-05 17:21 ?1429次閱讀

    有趣!史記:數(shù)據(jù)壓縮算法列傳

    簡單地說,如果沒有數(shù)據(jù)壓縮技術(shù),我們就沒法用 WinRAR 為 Email 中的附件瘦身;如果沒有數(shù)據(jù)壓縮技術(shù),市場上的數(shù)碼錄音筆就只能記錄不到20 分鐘的語音;如果沒有數(shù)據(jù)壓縮技術(shù)
    的頭像 發(fā)表于 11-11 15:21 ?702次閱讀

    高性能無損數(shù)據(jù)壓縮FPGA IP,LZO無損數(shù)據(jù)壓縮IP

    LZOAccel-C是一個無損數(shù)據(jù)壓縮引擎的FPGA硬件實現(xiàn),兼容LZO 2.10標準。 Core接收未壓縮的輸入數(shù)據(jù)塊,產(chǎn)生壓縮后的
    的頭像 發(fā)表于 01-25 13:39 ?409次閱讀
    高性能無損<b class='flag-5'>數(shù)據(jù)壓縮</b>FPGA IP,LZO無損<b class='flag-5'>數(shù)據(jù)壓縮</b>IP