0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

當(dāng)機(jī)器學(xué)習(xí)遇上SSD,會(huì)擦出怎樣的火花呢?

VIBT_dputech ? 來(lái)源:大普微 ? 2020-09-07 16:12 ? 次閱讀

近年來(lái)人工智能和大數(shù)據(jù)的迅速發(fā)展正在深刻改變著這個(gè)世界和我們的生活方式。人工智能的核心是機(jī)器學(xué)習(xí)(Machine Learning) 算法,自 2006 年以來(lái),在機(jī)器學(xué)習(xí)領(lǐng)域,以深度學(xué)習(xí)(Deep Lerning) 為代表的機(jī)器學(xué)習(xí)算法取得了突破性的進(jìn)展,在2017年AlphaGo大戰(zhàn)圍棋冠軍李世石后這一技術(shù)加速走向市場(chǎng)、落地應(yīng)用。而SSD作為大數(shù)據(jù)的一種存儲(chǔ)介質(zhì),正在取代HDD成為主流的存儲(chǔ)設(shè)備。那么當(dāng)機(jī)器學(xué)習(xí)遇上SSD,會(huì)擦出怎樣的火花呢?

一、什么是機(jī)器學(xué)習(xí)?

·機(jī)器學(xué)習(xí)是讓計(jì)算機(jī)具有學(xué)習(xí)的能力,無(wú)需進(jìn)行明確編程?!?亞瑟·薩繆爾,1959

·計(jì)算機(jī)程序利用經(jīng)驗(yàn) E 學(xué)習(xí)任務(wù) T,性能是 P,如果針對(duì)任務(wù) T 的性能 P 隨著經(jīng)驗(yàn) E 不斷增長(zhǎng),則稱為機(jī)器學(xué)習(xí)?!?湯姆·米切爾,1997

機(jī)器學(xué)習(xí)是一類算法的總稱,這些算法從大量歷史數(shù)據(jù)中挖掘出其中隱含的規(guī)律,并用于預(yù)測(cè)或者分類,更具體的說(shuō),機(jī)器學(xué)習(xí)可以看作是尋找一個(gè)函數(shù),輸入是樣本數(shù)據(jù),輸出是期望的結(jié)果,只是這個(gè)函數(shù)過(guò)于復(fù)雜,以至于不太方便形式化表達(dá)。需要注意的是,機(jī)器學(xué)習(xí)的目標(biāo)是使學(xué)到的函數(shù)很好地適用于“新樣本”,而不僅僅是在訓(xùn)練樣本上表現(xiàn)很好。學(xué)到的函數(shù)適用于新樣本的能力,稱為泛化(Generalization)能力。

二、機(jī)器學(xué)習(xí)步驟

通常學(xué)習(xí)一個(gè)好的函數(shù),分為以下三步:

1、選擇一個(gè)合適的模型,這通常需要依據(jù)實(shí)際問(wèn)題而定,針對(duì)不同的問(wèn)題和任務(wù)需要選取恰當(dāng)?shù)哪P?,模型就是一組函數(shù)的集合。

2、判斷一個(gè)函數(shù)的好壞,這需要確定一個(gè)衡量標(biāo)準(zhǔn),也就是我們通常說(shuō)的損失函數(shù)(Loss Function),損失函數(shù)的確定也需要依據(jù)具體問(wèn)題而定,如回歸問(wèn)題一般采用歐式距離,分類問(wèn)題一般采用交叉熵代價(jià)函數(shù)。

3、找出“最好”的函數(shù),如何從眾多函數(shù)中最快的找出“最好”的那一個(gè),這一步是最大的難點(diǎn),做到又快又準(zhǔn)往往不是一件容易的事情。常用的方法有梯度下降算法,最小二乘法等和其他一些技巧(tricks)。

學(xué)習(xí)得到“最好”的函數(shù)后,需要在新樣本上進(jìn)行測(cè)試,只有在新樣本上表現(xiàn)很好,才算是一個(gè)“好”的函數(shù)。

三、機(jī)器學(xué)習(xí)的類型

機(jī)器學(xué)習(xí)主要有三種基本類型:監(jiān)督學(xué)習(xí)、非監(jiān)督學(xué)習(xí)和強(qiáng)化學(xué)習(xí)。

1監(jiān)督學(xué)習(xí)

監(jiān)督學(xué)習(xí)是使用已知正確答案的示例來(lái)訓(xùn)練模型。已知數(shù)據(jù)和其一一對(duì)應(yīng)的標(biāo)簽,訓(xùn)練一個(gè)智能算法,將輸入數(shù)據(jù)映射到標(biāo)簽的過(guò)程,它的常見(jiàn)應(yīng)用場(chǎng)景如分類問(wèn)題和回歸問(wèn)題。常見(jiàn)的算法有K近鄰算法、線性回歸、邏輯回歸、支持向量機(jī)(SVM)、決策樹(shù)和隨機(jī)森林、神經(jīng)網(wǎng)絡(luò)。

分類

在分類中,機(jī)器被訓(xùn)練成將一個(gè)組劃分為特定的類。分類的一個(gè)簡(jiǎn)單例子是電子郵件帳戶上的垃圾郵件過(guò)濾器。過(guò)濾器分析你以前標(biāo)記為垃圾郵件的電子郵件,并將它們與新郵件進(jìn)行比較。如果它們匹配一定的百分比,這些新郵件將被標(biāo)記為垃圾郵件并發(fā)送到適當(dāng)?shù)奈募A。那些比較不相似的電子郵件被歸類為正常郵件并發(fā)送到你的郵箱。

也許你會(huì)問(wèn)這個(gè)分類算法對(duì)于SSD有什么用呢?SSD中的一個(gè)典型的分類問(wèn)題是IO模式識(shí)別,判斷IO是純讀、純寫(xiě)或者混合讀寫(xiě)的,這是一個(gè)三分類的問(wèn)題;判斷IO是順序的還是隨機(jī)的,這是一個(gè)二分類的問(wèn)題。可以根據(jù)實(shí)際情況選擇相應(yīng)的相應(yīng)的機(jī)器學(xué)習(xí)分類算法識(shí)別出不同的IO模式,然后針對(duì)不同的模式FTL就可采取不同策略,進(jìn)而提升SSD的性能。

回歸

回歸問(wèn)題通常是用來(lái)預(yù)測(cè)一個(gè)值,它的預(yù)測(cè)結(jié)果是連續(xù)的,如預(yù)測(cè)房?jī)r(jià)、未來(lái)的天氣情況等,例如一個(gè)產(chǎn)品的實(shí)際價(jià)格為500元,通過(guò)回歸分析預(yù)測(cè)值為499元,我們認(rèn)為這是一個(gè)比較好的回歸分析。

回歸算法在SSD中能用在什么地方呢?回歸算法在SSD的一個(gè)應(yīng)用是IO強(qiáng)度預(yù)測(cè),在一定模式下IO強(qiáng)度在時(shí)序上是有一定規(guī)律的,可以根據(jù)前一段時(shí)間的IO強(qiáng)度預(yù)測(cè)下一段時(shí)間的IO強(qiáng)度,Smart-IO技術(shù)采用長(zhǎng)短期記憶人工神經(jīng)網(wǎng)絡(luò)LSTM對(duì)IO強(qiáng)度進(jìn)行預(yù)測(cè)。提前預(yù)測(cè)出IO強(qiáng)度后就可優(yōu)化FTL策略、合理分配GC占用資源、合理調(diào)度、提高數(shù)據(jù)命中率等,進(jìn)而提升SSD性能。

2非監(jiān)督學(xué)習(xí)

在無(wú)監(jiān)督學(xué)習(xí)中,數(shù)據(jù)是無(wú)標(biāo)簽的。學(xué)習(xí)模型是為了推斷出數(shù)據(jù)的一些內(nèi)在結(jié)構(gòu)。無(wú)監(jiān)督學(xué)習(xí)主要分為聚類和降維。

聚類用于根據(jù)屬性和行為對(duì)象進(jìn)行分組。這與分類不同,因?yàn)檫@些組不是你提供的。聚類的一個(gè)例子是將一個(gè)組劃分成不同的子組(例如,基于年齡和婚姻狀況),然后應(yīng)用到有針對(duì)性的營(yíng)銷方案中。大多數(shù)大數(shù)據(jù)可視化使用降維來(lái)識(shí)別趨勢(shì)和規(guī)則。主要算法: K-means、層次聚類分析(HCA)、DBSCAN。

高維數(shù)據(jù)中很容易出現(xiàn)樣本稀疏、距離計(jì)算困難等問(wèn)題,即“維度災(zāi)難”,為了緩解維度災(zāi)難,常用的就是降維。降維的主要方法有主成分分析(PCA)、線性判別分析(LDA)、局部線性嵌入(LLE)。如圖所示,通過(guò)PCA的方法可以把一個(gè)三位的數(shù)據(jù)降維成一個(gè)二維數(shù)據(jù)。

無(wú)監(jiān)督學(xué)習(xí)由于沒(méi)有標(biāo)簽,相比監(jiān)督學(xué)習(xí)來(lái)說(shuō)相當(dāng)于少了一些輸入信息,實(shí)際應(yīng)用中相對(duì)監(jiān)督學(xué)習(xí)學(xué)習(xí)會(huì)困難一些,那么在SSD是否就無(wú)用武之地了呢?非也非也。Smart-IO數(shù)據(jù)分組技術(shù)用K-means算法對(duì)IO進(jìn)行冷熱數(shù)據(jù)分組,然后把不同組的數(shù)據(jù)寫(xiě)到不同的block或者die上,那么就可以減小,可減小WA,延長(zhǎng)SSD使用壽命。

3強(qiáng)化學(xué)習(xí)

強(qiáng)化學(xué)習(xí)算法的思路非常簡(jiǎn)單,以游戲?yàn)槔?,如果在游戲中采取某種策略可以取得較高的得分,那么就進(jìn)一步「強(qiáng)化」這種策略,以期繼續(xù)取得較好的結(jié)果。這種策略與日常生活中的各種「績(jī)效獎(jiǎng)勵(lì)」非常類似。我們平時(shí)也常常用這樣的策略來(lái)提高自己的游戲水平。AlphaGo下圍棋也是這個(gè)原理,只告訴機(jī)器圍棋的基本規(guī)則,但是不告訴它人類摸索了上千年才總結(jié)出來(lái)的定式等圍棋戰(zhàn)術(shù),讓機(jī)器完全依靠自學(xué),打敗人類。

強(qiáng)化學(xué)習(xí)感覺(jué)和SSD很難沾上邊,不過(guò)熟悉SSD(固態(tài)硬盤(pán))的人都知道,垃圾回收(GC,Garbage Collection)是SSD固件設(shè)計(jì)中的重要一環(huán),也是影響SSD主控性能的重要因素。一般的GC機(jī)制都是只根據(jù)當(dāng)前硬盤(pán)空閑空間狀態(tài)來(lái)做GC的:當(dāng)有空閑空間的時(shí),不啟動(dòng)GC;反之,當(dāng)沒(méi)有空閑空間的情況下,執(zhí)行GC任務(wù)。這種策略的缺點(diǎn)是如果在用戶操作的時(shí)候進(jìn)行GC會(huì)造成SSD性能明顯下降,可以在主控空閑時(shí)提前進(jìn)行GC,但是GC過(guò)于頻繁會(huì)造成WA寫(xiě)放大過(guò)大,所以需要一個(gè)平衡,需要一種算法來(lái)自動(dòng)確定何時(shí)GC,強(qiáng)化學(xué)習(xí)正好可以排上用場(chǎng),給定一定的衡量標(biāo)準(zhǔn),然后讓機(jī)器通過(guò)強(qiáng)化學(xué)習(xí)的方法訓(xùn)練來(lái)自動(dòng)學(xué)習(xí)GC的時(shí)機(jī),得到更優(yōu)的GC的策略。

四、DapuStor機(jī)器學(xué)習(xí)技術(shù)

DapuStor已基于SSD開(kāi)發(fā)出Smart-IO Data Grouping和Smart-IO Intensities Prediction等先進(jìn)技術(shù),把機(jī)器學(xué)習(xí)的先進(jìn)算法用到了SSD中,提升了SSD的產(chǎn)品性能。同時(shí)自研的帶有計(jì)算和智能的數(shù)據(jù)存儲(chǔ)處理器芯片(簡(jiǎn)稱DPU),可以在芯片層面實(shí)現(xiàn)更多的智能功能和硬件加速,實(shí)現(xiàn)存算一體,滿足高端存儲(chǔ)和邊緣計(jì)算市場(chǎng)的需求。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • SSD
    SSD
    +關(guān)注

    關(guān)注

    20

    文章

    2818

    瀏覽量

    117026
  • 人工智能
    +關(guān)注

    關(guān)注

    1789

    文章

    46401

    瀏覽量

    236630
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8325

    瀏覽量

    132216

原文標(biāo)題:當(dāng)機(jī)器學(xué)習(xí)遇上SSD

文章出處:【微信號(hào):dputech,微信公眾號(hào):DapuStor】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    IP地址與智能家居能夠碰撞出什么樣的火花呢?

    感應(yīng)燈、遠(yuǎn)程遙控空調(diào),自動(dòng)感應(yīng)窗簾——智能家居已經(jīng)在正逐步走入我們的生活,為我們帶來(lái)前所未有的便捷與舒適體驗(yàn)。而在這一進(jìn)程中,IP地址又能夠與智能家居碰撞出什么樣的火花呢? 一、IP地址:智能家居
    的頭像 發(fā)表于 09-24 11:21 ?169次閱讀

    電機(jī)碳刷打火花的原因及處理方法

    電機(jī)碳刷打火花的原因及處理方法如下: 一、電機(jī)碳刷打火花的原因 碳刷磨損過(guò)度 :當(dāng)碳刷磨損到一定程度時(shí),其與換向器之間的接觸面積會(huì)減小,導(dǎo)致電阻增大,進(jìn)而產(chǎn)生高溫和火花。 碳刷硬度不夠
    的頭像 發(fā)表于 09-03 14:32 ?1637次閱讀

    當(dāng)5G融合體育時(shí),會(huì)碰撞出怎樣火花

    觀賽的樂(lè)趣,你更愛(ài)哪一種?是和親朋好友圍坐電視機(jī)前共同經(jīng)歷難忘的時(shí)刻,還是獨(dú)自徜徉于直播、彈幕和熱搜的世界?隨著科技與體育的關(guān)系日益緊密,我們的觀賽體驗(yàn)正在被重新定義。正值全球矚目的體育盛事即將在巴黎啟幕,讓我們共同期待當(dāng)5G融合體育時(shí),會(huì)碰撞出怎樣
    的頭像 發(fā)表于 08-16 11:14 ?4016次閱讀

    機(jī)器學(xué)習(xí)算法原理詳解

    機(jī)器學(xué)習(xí)作為人工智能的一個(gè)重要分支,其目標(biāo)是通過(guò)讓計(jì)算機(jī)自動(dòng)從數(shù)據(jù)中學(xué)習(xí)并改進(jìn)其性能,而無(wú)需進(jìn)行明確的編程。本文將深入解讀幾種常見(jiàn)的機(jī)器學(xué)習(xí)
    的頭像 發(fā)表于 07-02 11:25 ?566次閱讀

    深度學(xué)習(xí)與傳統(tǒng)機(jī)器學(xué)習(xí)的對(duì)比

    在人工智能的浪潮中,機(jī)器學(xué)習(xí)和深度學(xué)習(xí)無(wú)疑是兩大核心驅(qū)動(dòng)力。它們各自以其獨(dú)特的方式推動(dòng)著技術(shù)的進(jìn)步,為眾多領(lǐng)域帶來(lái)了革命性的變化。然而,盡管它們都屬于機(jī)器
    的頭像 發(fā)表于 07-01 11:40 ?980次閱讀

    SOLIDWORKS教育版:開(kāi)啟數(shù)字化設(shè)計(jì)新時(shí)代的鑰匙

    在數(shù)字化設(shè)計(jì)的世界里,SolidWorks無(wú)疑是一個(gè)重量級(jí)的角色。那么,你是否想過(guò),當(dāng)solidworks遇上教育版,會(huì)碰撞出怎樣火花呢?
    的頭像 發(fā)表于 06-17 16:18 ?213次閱讀

    聊聊下一代企業(yè)級(jí)SSD外形EDSFF #EDSFF #SSD #硬盤(pán)抽取盒

    硬盤(pán)SSD
    ICY DOCK硬盤(pán)盒
    發(fā)布于 :2024年06月13日 17:15:19

    當(dāng)USB Type-C 遇上汽車(chē)應(yīng)用新需求,會(huì)擦出什么火花?

    盡管 USB Type-C 主要作為筆記本電腦、平板電腦和智能手機(jī)的新一代、更快充電標(biāo)準(zhǔn)而為人所熟知,但在電力輸送和連接應(yīng)用領(lǐng)域也變得日益普及。USB Type-C 的速度和效率非常高:隨著 USB 電力輸送 (USB PD) R3.1 規(guī)范的發(fā)展, 一個(gè) USB Type-C 連接器便可支持高達(dá) 240W(48V 和 5A)的功率,相較于 USB Std-A 連接器的 7.5W(5V 和 1.5A) ,這是一個(gè)顯著的提升。 USB Type-C 的廣泛采用并非偶然,歐盟、印度、巴西和韓國(guó)紛紛制定并實(shí)施了相關(guān)規(guī)定,要求便攜式個(gè)人電子產(chǎn)品
    發(fā)表于 05-16 09:49 ?703次閱讀
    當(dāng)USB Type-C <b class='flag-5'>遇上</b>汽車(chē)應(yīng)用新需求,<b class='flag-5'>會(huì)</b><b class='flag-5'>擦出</b>什么<b class='flag-5'>火花</b>?

    晶體晶振在SSD上的應(yīng)用

    ,SSD在消費(fèi)技術(shù)解決方案中的使用正在迅速上升。隨著物聯(lián)網(wǎng)、VR/AR、5G、在線技術(shù)和機(jī)器學(xué)習(xí)等技術(shù)的發(fā)展變得越來(lái)越普遍,預(yù)計(jì)這種需求將繼續(xù)下去。根據(jù)市場(chǎng)研究數(shù)據(jù),S
    的頭像 發(fā)表于 04-30 16:03 ?444次閱讀
    晶體晶振在<b class='flag-5'>SSD</b>上的應(yīng)用

    TC234LP使用iLLD Flash Demo每次運(yùn)行到擦出Dflash就會(huì)跑飛的原因?

    TC234LP 使用iLLD Flash Demo 每次運(yùn)行到擦出Dflash就會(huì)跑飛
    發(fā)表于 02-02 07:07

    如何使用TensorFlow構(gòu)建機(jī)器學(xué)習(xí)模型

    在這篇文章中,我將逐步講解如何使用 TensorFlow 創(chuàng)建一個(gè)簡(jiǎn)單的機(jī)器學(xué)習(xí)模型。
    的頭像 發(fā)表于 01-08 09:25 ?874次閱讀
    如何使用TensorFlow構(gòu)建<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>模型

    智慧校園的&quot;邊緣智能&quot;: 打造未來(lái)教育的橋梁

    ? ? ? 在科技飛速發(fā)展的時(shí)代,智能已經(jīng)滲透到我們生活的各個(gè)角落。而當(dāng)智能遇上教育,會(huì)激發(fā)出怎樣火花呢?今天,我們就來(lái)聊聊這個(gè)熱門(mén)話題——智慧校園和邊緣智能網(wǎng)關(guān)的結(jié)合,它們是如何共
    的頭像 發(fā)表于 01-05 16:41 ?282次閱讀
    智慧校園的&quot;邊緣智能&quot;: 打造未來(lái)教育的橋梁

    為什么彈簧針連接器對(duì)接會(huì)產(chǎn)生電火花呢?

    彈簧針PogoPin連接器是一種特殊的連接器,CFE為客戶提供一站式客制化彈簧針pogopin磁吸連接充電解決方案。
    的頭像 發(fā)表于 12-07 09:16 ?855次閱讀
    為什么彈簧針連接器對(duì)接<b class='flag-5'>會(huì)</b>產(chǎn)生電<b class='flag-5'>火花呢</b>?

    傳統(tǒng)能源大佬“撞上”新能源“新貴”:擦出怎樣火花?

    近年來(lái),中國(guó)新能源汽車(chē)市場(chǎng)蓬勃發(fā)展,新能源充電行業(yè)迎來(lái)了前所未有的機(jī)遇。在這個(gè)背景下,殼牌、中石油等石化巨頭們紛紛加碼充電樁領(lǐng)域,試圖在這個(gè)迅速發(fā)展的市場(chǎng)中搶占一席之地。 黨的二十大報(bào)告指出,要加快發(fā)展方式綠色轉(zhuǎn)型,推動(dòng)形成綠色低碳的生產(chǎn)方式和生活方式。這為傳統(tǒng)能源企業(yè)加快向“油氣氫電服”綜合能源服務(wù)商轉(zhuǎn)型發(fā)展指明了道路。 中石油方面表示,到“十四五”末期,公司將建設(shè)充換電站1000座以上,升級(jí)打造“可換電
    的頭像 發(fā)表于 12-06 09:21 ?375次閱讀

    SSD和HDD的具體對(duì)比

    SSD廠商早就預(yù)測(cè)NAND閃存的價(jià)格會(huì)隨著時(shí)間的推移而下降,讓SSD能夠在單價(jià)上與HDD競(jìng)爭(zhēng)。事實(shí)上,NAND閃存的價(jià)格一直在下降。
    發(fā)表于 12-01 15:06 ?1310次閱讀
    <b class='flag-5'>SSD</b>和HDD的具體對(duì)比