0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

人工智能和深度學(xué)習(xí)的對象存儲挑戰(zhàn)

存儲D1net ? 來源:企業(yè)網(wǎng)D1Net ? 2020-06-13 11:06 ? 次閱讀

對象存儲非常適合長期備份和歸檔,如何將高性能對象存儲擴展到大規(guī)模、高容量的工作負載,人們對此需要進行了解。

對象存儲最有趣的方面之一是其用途的多樣性。盡管對象存儲通常用作歸檔存儲區(qū)、原有數(shù)據(jù)的目的地,以及文件服務(wù)器的替代品,但實際上有許多方法可以應(yīng)用對象存儲。隨著供應(yīng)商開始提供性能優(yōu)化的對象存儲,該技術(shù)已經(jīng)為用于一組全新的工作負載準備就緒。

高性能對象存儲不僅僅需要從基于硬盤的對象存儲系統(tǒng)切換到全閃存對象存儲。向全閃存介質(zhì)的遷移無疑會有所幫助,但是對象存儲系統(tǒng)(很大程度上要歸功于其豐富的元數(shù)據(jù))通常具有太多延遲,無法有效利用閃存性能。

創(chuàng)建高性能對象存儲系統(tǒng)的另一個挑戰(zhàn)是基礎(chǔ)設(shè)施的橫向擴展特性。為了滿足容量需求,對象存儲將大量節(jié)點添加到存儲集群中。每個節(jié)點的容量都被吸收到集群中,從而創(chuàng)建一個存儲池。在大型橫向擴展集群中,具有數(shù)十個節(jié)點都是比較常見的。聚合和管理這些節(jié)點的等待時間可能很長。

人工智能深度學(xué)習(xí)的對象存儲挑戰(zhàn)

非結(jié)構(gòu)化的大型數(shù)據(jù)工作負載(例如人工智能和機器學(xué)習(xí)以及深度學(xué)習(xí))是對象存儲架構(gòu)如何成為高性能工作負載的一個很好的例子。理論上,這些工作負載對于對象存儲而言應(yīng)該是理想的。它們擁有數(shù)百萬甚至數(shù)十億個文件,而存儲所有這些數(shù)據(jù)需要大量的SSD硬盤或HDD硬盤,因此需要許多節(jié)點。這些過程也是受吞吐量驅(qū)動的。

所有這些因素的結(jié)合使人工智能和深度學(xué)習(xí)針對對象存儲的高節(jié)點數(shù)存儲集群量身定制。大多數(shù)與人工智能通信的框架(例如TensorFlow)用于驅(qū)動人工智能和機器學(xué)習(xí)工作負載,它們都使用Amazon S3協(xié)議。大多數(shù)對象存儲系統(tǒng)也是基于S3存儲桶,并且S3存儲桶本身是高度并行的。從理論上講,對象存儲基礎(chǔ)設(shè)施應(yīng)該能夠滿足人工智能和機器或深度學(xué)習(xí)工作負載的需求。

但是,此方法不僅僅需要創(chuàng)建一個全閃存對象存儲系統(tǒng)。該系統(tǒng)必須能夠解決這樣一個問題,即可能會有數(shù)十個(即使不是數(shù)百個)節(jié)點,而元數(shù)據(jù)以及集群管理也帶來了挑戰(zhàn)。

應(yīng)對元數(shù)據(jù)挑戰(zhàn)

元數(shù)據(jù)是關(guān)于數(shù)據(jù)的數(shù)據(jù),它對高性能對象存儲帶來了挑戰(zhàn),其原因有兩個:第一個挑戰(zhàn)是,對象存儲系統(tǒng)需要更多時間來管理其豐富的元數(shù)據(jù)。由于大多數(shù)對象存儲供應(yīng)商會在集群中指定一定數(shù)量的節(jié)點來管理和存儲元數(shù)據(jù),因此管理更加復(fù)雜。在人工智能和深度學(xué)習(xí)等工作負載中,專用的元數(shù)據(jù)控制器通常不堪重負,并成為系統(tǒng)瓶頸。因此,閃存驅(qū)動器甚至硬盤無法充分發(fā)揮其潛力。

第二個挑戰(zhàn)是集群通信。大多數(shù)橫向擴展NAS或塊存儲系統(tǒng)的節(jié)點數(shù)都比較少。在網(wǎng)絡(luò)附屬存儲(NAS)和塊用例中,擁有六個節(jié)點的存儲集群被認為是大型的存儲系統(tǒng),但在許多對象存儲部署中,六個節(jié)點只是一個入門級別。而節(jié)點間的通信成為一個大問題,尤其是在不涉及性能的歸檔的用例中。

要創(chuàng)建高性能的大規(guī)模對象存儲解決方案,需要解決元數(shù)據(jù)性能和集群管理問題。下一代對象存儲將元數(shù)據(jù)分布在集群中的每個節(jié)點上,而不僅僅是幾個控制器。元數(shù)據(jù)的分布可確保每個節(jié)點都具有響應(yīng)I/O請求所需的所有信息。

其他高性能對象存儲問題

對象存儲系統(tǒng)還必須解決節(jié)點間聯(lián)網(wǎng)的問題。元數(shù)據(jù)的分布在這里有所幫助,因為它減少了東西流向的流量。供應(yīng)商必須優(yōu)化其節(jié)點間網(wǎng)絡(luò),因此它不會成為性能瓶頸。它們極有可能必須優(yōu)化網(wǎng)絡(luò)通信,以最大程度地減少傳輸頻率。

需要優(yōu)化的另一個領(lǐng)域是協(xié)議仿真。例如,大多數(shù)對象存儲系統(tǒng)都支持網(wǎng)絡(luò)文件系統(tǒng)(NFS)。網(wǎng)絡(luò)文件系統(tǒng)(NFS)的支持至關(guān)重要,因為許多物聯(lián)網(wǎng)設(shè)備不是內(nèi)部部署S3存儲桶,而是使用網(wǎng)絡(luò)文件系統(tǒng)(NFS)。其挑戰(zhàn)在于,許多對象存儲系統(tǒng)都使用一個單獨的組件在網(wǎng)絡(luò)文件系統(tǒng)(NFS)和S3存儲桶之間進行轉(zhuǎn)換,而不是在其軟件中內(nèi)部部署運行網(wǎng)絡(luò)文件系統(tǒng)(NFS)。其轉(zhuǎn)移的開銷很大,并且在高性能情況下會顯示出來。

網(wǎng)絡(luò)文件系統(tǒng)(NFS)在對象存儲代碼中的原生集成可實現(xiàn)更高的性能,并同時訪問相同的數(shù)據(jù)。并發(fā)訪問意味著物聯(lián)網(wǎng)設(shè)備可以通過網(wǎng)絡(luò)文件系統(tǒng)(NFS)將數(shù)據(jù)發(fā)送到對象存儲卷,同時人工智能或深度學(xué)習(xí)框架可以通過S3存儲桶對象對其進行處理,而無需對其進行復(fù)制或移動。

NAS適用的位置

網(wǎng)絡(luò)附屬存儲(NAS)系統(tǒng)仍在數(shù)據(jù)中心中發(fā)揮作用。對象存儲是長期歸檔和備份的理想選擇,雖然大容量網(wǎng)絡(luò)附屬存儲(NAS)仍可以在備份存儲市場上競爭。對象存儲還適合作為文件服務(wù)器的替代品,以替代性能不太重要的工作負載(例如用戶主目錄)。

高性能對象存儲非常適合需要數(shù)十或數(shù)百個節(jié)點以及數(shù)十PB容量的大規(guī)模工作負載。這些工作負載還取決于吞吐量,并且在I/O訪問中高度并行。在這兩個極端之間是高性能、非結(jié)構(gòu)化的數(shù)據(jù)工作負載,這些工作負載本質(zhì)上是隨機I/O,節(jié)點數(shù)量很少。在這些用例中,網(wǎng)絡(luò)附屬存儲(NAS)可能仍然是一個更好的選擇。

版權(quán)聲明:本文為企業(yè)網(wǎng)D1Net編譯,轉(zhuǎn)載需注明出處為:企業(yè)網(wǎng)D1Net,如果不注明出處,企業(yè)網(wǎng)D1Net將保留追究其法律責(zé)任的權(quán)利。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1789

    文章

    46438

    瀏覽量

    236669
  • 對象存儲
    +關(guān)注

    關(guān)注

    0

    文章

    66

    瀏覽量

    11955
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5449

    瀏覽量

    120813

原文標題:現(xiàn)代數(shù)據(jù)中心高性能對象存儲面臨的挑戰(zhàn)

文章出處:【微信號:D1Net11,微信公眾號:存儲D1net】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    人工智能、機器學(xué)習(xí)深度學(xué)習(xí)存在什么區(qū)別

    人工智能指的是在某種程度上顯示出類似人類智能的設(shè)備。AI有很多技術(shù),但其中一個很大的子集是機器學(xué)習(xí)——讓算法從數(shù)據(jù)中學(xué)習(xí)。
    發(fā)表于 10-24 17:22 ?2376次閱讀
    <b class='flag-5'>人工智能</b>、機器<b class='flag-5'>學(xué)習(xí)</b>和<b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b>存在什么區(qū)別

    《AI for Science:人工智能驅(qū)動科學(xué)創(chuàng)新》第6章人AI與能源科學(xué)讀后感

    、優(yōu)化等方面的應(yīng)用有了更清晰的認識。特別是書中提到的基于大數(shù)據(jù)和機器學(xué)習(xí)的能源管理系統(tǒng),通過實時監(jiān)測和分析能源數(shù)據(jù),實現(xiàn)了能源的高效利用和智能化管理。 其次,第6章通過多個案例展示了人工智能在能源科學(xué)中
    發(fā)表于 10-14 09:27

    AI for Science:人工智能驅(qū)動科學(xué)創(chuàng)新》第4章-AI與生命科學(xué)讀后感

    很幸運社區(qū)給我一個閱讀此書的機會,感謝平臺。 《AI for Science:人工智能驅(qū)動科學(xué)創(chuàng)新》第4章關(guān)于AI與生命科學(xué)的部分,為我們揭示了人工智能技術(shù)在生命科學(xué)領(lǐng)域中的廣泛應(yīng)用和深遠影響。在
    發(fā)表于 10-14 09:21

    《AI for Science:人工智能驅(qū)動科學(xué)創(chuàng)新》第二章AI for Science的技術(shù)支撐學(xué)習(xí)心得

    人工智能在科學(xué)研究中的核心技術(shù),包括機器學(xué)習(xí)、深度學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)等。這些技術(shù)構(gòu)成了AI for Science的基石,使得AI能夠處理和分析復(fù)雜的數(shù)據(jù)集,從而發(fā)現(xiàn)隱藏在數(shù)據(jù)中的模式和規(guī)
    發(fā)表于 10-14 09:16

    《AI for Science:人工智能驅(qū)動科學(xué)創(chuàng)新》第一章人工智能驅(qū)動的科學(xué)創(chuàng)新學(xué)習(xí)心得

    人工智能:科學(xué)研究的加速器 第一章清晰地闡述了人工智能作為科學(xué)研究工具的強大功能。通過機器學(xué)習(xí)深度學(xué)習(xí)等先進技術(shù),AI能夠處理和分析海量
    發(fā)表于 10-14 09:12

    risc-v在人工智能圖像處理應(yīng)用前景分析

    人工智能推薦系統(tǒng)中強大的圖形處理器(GPU)一爭高下。其獨特的設(shè)計使得該處理器在功耗受限的條件下仍能實現(xiàn)高性能的圖像處理任務(wù)。 Ceremorphic公司 :該公司開發(fā)的分層學(xué)習(xí)處理器結(jié)合了
    發(fā)表于 09-28 11:00

    名單公布!【書籍評測活動NO.44】AI for Science:人工智能驅(qū)動科學(xué)創(chuàng)新

    、污染治理、碳減排三個方面介紹了人工智能為環(huán)境科學(xué)引入的新價值和新機遇。 第8章探討了AI for Science在快速發(fā)展過程中面臨的機遇和挑戰(zhàn),并對“平臺科研”模式進行了展望。 申請時間
    發(fā)表于 09-09 13:54

    報名開啟!深圳(國際)通用人工智能大會將啟幕,國內(nèi)外大咖齊聚話AI

    ,得到了華為、騰訊、優(yōu)必選、中煤科工、中國聯(lián)通、云天勵飛、考拉悠然、智航、力維智聯(lián)等國內(nèi)人工智能企業(yè)的深度參與和大力支持。 報名后即可到現(xiàn)場領(lǐng)取禮品,總計5000份,先到先選! 點擊報名:https://bbs.elecfans.com/jishu_2447254_1
    發(fā)表于 08-22 15:00

    FPGA在人工智能中的應(yīng)用有哪些?

    FPGA(現(xiàn)場可編程門陣列)在人工智能領(lǐng)域的應(yīng)用非常廣泛,主要體現(xiàn)在以下幾個方面: 一、深度學(xué)習(xí)加速 訓(xùn)練和推理過程加速:FPGA可以用來加速深度學(xué)
    發(fā)表于 07-29 17:05

    人工智能、機器學(xué)習(xí)深度學(xué)習(xí)是什么

    在科技日新月異的今天,人工智能(Artificial Intelligence, AI)、機器學(xué)習(xí)(Machine Learning, ML)和深度學(xué)習(xí)(Deep Learning,
    的頭像 發(fā)表于 07-03 18:22 ?920次閱讀

    人工智能深度學(xué)習(xí)的五大模型及其應(yīng)用領(lǐng)域

    隨著科技的飛速發(fā)展,人工智能(AI)技術(shù)特別是深度學(xué)習(xí)在各個領(lǐng)域展現(xiàn)出了強大的潛力和廣泛的應(yīng)用價值。深度學(xué)習(xí)作為人工智能的一個核心分支,通過
    的頭像 發(fā)表于 07-03 18:20 ?3117次閱讀

    5G智能物聯(lián)網(wǎng)課程之Aidlux下人工智能開發(fā)(SC171開發(fā)套件V1)

    ://t.elecfans.com/v/25653.html 人工智能 初學(xué)者完整學(xué)習(xí)流程實現(xiàn)手寫數(shù)字識別案例 28分55秒 https://t.elecfans.com/v/27184.html
    發(fā)表于 04-01 10:40

    FPGA在深度學(xué)習(xí)應(yīng)用中或?qū)⑷〈鶪PU

    現(xiàn)場可編程門陣列 (FPGA) 解決了 GPU 在運行深度學(xué)習(xí)模型時面臨的許多問題 在過去的十年里,人工智能的再一次興起使顯卡行業(yè)受益匪淺。英偉達 (Nvidia) 和 AMD 等公司的股價也大幅
    發(fā)表于 03-21 15:19

    嵌入式人工智能的就業(yè)方向有哪些?

    嵌入式人工智能的就業(yè)方向有哪些? 在新一輪科技革命與產(chǎn)業(yè)變革的時代背景下,嵌入式人工智能成為國家新型基礎(chǔ)建設(shè)與傳統(tǒng)產(chǎn)業(yè)升級的核心驅(qū)動力。同時在此背景驅(qū)動下,眾多名企也紛紛在嵌入式人工智能領(lǐng)域布局
    發(fā)表于 02-26 10:17

    深度學(xué)習(xí)人工智能中的 8 種常見應(yīng)用

    深度學(xué)習(xí)簡介深度學(xué)習(xí)人工智能(AI)的一個分支,它教神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)和推理。近年來,它解決復(fù)雜問題
    的頭像 發(fā)表于 12-01 08:27 ?3132次閱讀
    <b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b>在<b class='flag-5'>人工智能</b>中的 8 種常見應(yīng)用