0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

經(jīng)驗(yàn)分享:半路出家的我如何從0到1學(xué)習(xí)機(jī)器學(xué)習(xí)

8g3K_AI_Thinker ? 來源:未知 ? 作者:steve ? 2018-04-19 16:10 ? 次閱讀

作為一個(gè)數(shù)學(xué)系出身,半路出家開始搞機(jī)器學(xué)習(xí)的人,在學(xué)習(xí)機(jī)器學(xué)習(xí)的過程中自然踩了無數(shù)的坑,也走過很多本不該走的彎路。于是很想總結(jié)一份如何入門機(jī)器學(xué)習(xí)的資料,也算是為后來人做一點(diǎn)點(diǎn)微小的貢獻(xiàn)。

▌前言

在 2016 年 3 月,隨著 AlphaGo 打敗了李世乭,人工智能開始大規(guī)模的進(jìn)入人們的視野。不僅是互聯(lián)網(wǎng)的工程師們很關(guān)注人工智能的發(fā)展,就連外面的吃瓜群眾也開始關(guān)注人工智能對(duì)日常生活的影響。隨著人臉識(shí)別能力的日益增強(qiáng),個(gè)性化新聞推薦 App 的橫行天下,TensorFlow 等開源工具被更多的人所知曉,于是就有越來越多的人開始逐步的轉(zhuǎn)行到人工智能的領(lǐng)域,無論是計(jì)算機(jī)出身的后臺(tái)開發(fā)人員,電子通信等工程師,還是數(shù)學(xué)物理等傳統(tǒng)理科人士,都有人逐步開始轉(zhuǎn)行到機(jī)器學(xué)習(xí)的領(lǐng)域。

作為一個(gè)轉(zhuǎn)行的人,自然要介紹一下自己的專業(yè)背景。筆者在本科的時(shí)候的專業(yè)是數(shù)學(xué)與應(yīng)用數(shù)學(xué),外行人可以理解為基礎(chǔ)數(shù)學(xué)。在博士期間的研究方向是動(dòng)力系統(tǒng)和分形幾何,所做的還是基礎(chǔ)數(shù)學(xué),和計(jì)算機(jī)的關(guān)系不大。

如果有人想了解筆者究竟在做什么科研的話,可以參考知乎文章“復(fù)動(dòng)力系統(tǒng)(1)--- Fatou集與Julia集"。至于機(jī)器學(xué)習(xí)的話,在讀書期間基本上也沒接觸過,甚至沒聽說過還有這種東西。不過在讀書期間由于專業(yè)需要,C++ 之類的代碼還是能夠?qū)懸恍┑模?UVA OJ 上面也留下過自己的足跡。

▌2015 年:嘗試轉(zhuǎn)型

行路難,行路難,多歧路,今安在?

在 2015 年畢業(yè)之后機(jī)緣巧合,恰好進(jìn)入騰訊公司從事機(jī)器學(xué)習(xí)的相關(guān)工作。不過剛進(jìn)來的時(shí)候壓力也不小,現(xiàn)在回想起來的話,當(dāng)時(shí)走了一些不該走的彎路。用李白的《行路難》中的詩詞來描述當(dāng)時(shí)的心情就是“行路難,行路難,多歧路,今安在?”

在 2015 年 10 月份,第一次接觸到一個(gè)不大不小的項(xiàng)目,那就是 XX 推薦項(xiàng)目。而這個(gè)項(xiàng)目是當(dāng)時(shí)組內(nèi)所接到的第二個(gè)推薦項(xiàng)目,當(dāng)年的推薦系統(tǒng)還是搭建在大數(shù)據(jù)集群上的,完全沒有任何說明文檔和前端頁面,當(dāng)時(shí)的整個(gè)系統(tǒng)和全部流程復(fù)雜而繁瑣。不過在接觸這個(gè)系統(tǒng)的過程中,逐步開始學(xué)習(xí)了 Linux 操作系統(tǒng)的一些簡(jiǎn)單命令,SQL 的使用方法。

了解 SQL 的話其實(shí)不只是通過了這個(gè)系統(tǒng),通過當(dāng)時(shí)的 ADS 值班,幫助業(yè)務(wù)方提取數(shù)據(jù),也把 SQL 的基礎(chǔ)知識(shí)進(jìn)一步的加深了。SQL 的學(xué)習(xí)的話,在2015年讀過兩本非常不錯(cuò)的入門教材《SQL基礎(chǔ)教程》與《HIVE編程指南》。Linux 的相關(guān)內(nèi)容閱讀了《Linux 命令行與 Shell 腳本編程大全》之后也就大概有所了解了。于是工作了一段時(shí)間之后,為了總結(jié)一些常見的 SQL 算法,寫過一篇文章 "HIVE基礎(chǔ)介紹"。

在做推薦項(xiàng)目的過程中,除了要使用 SQL 來處理數(shù)據(jù),要想做機(jī)器學(xué)習(xí),還需要了解常見的機(jī)器學(xué)習(xí)算法。當(dāng)年接觸到的第一個(gè)機(jī)器學(xué)習(xí)算法就是邏輯回歸(Logistic Regression),既然提到了機(jī)器學(xué)習(xí)的邏輯回歸,無法避免的就是交叉驗(yàn)證的概念,這個(gè)是機(jī)器學(xué)習(xí)中的一個(gè)基本概念。

通過物品的類別屬性和用戶的基本特征來構(gòu)造出新的特征,例如特征的內(nèi)積(inner product)。后來在學(xué)習(xí)的過程中逐步添加了特征的外積和笛卡爾積,除了特征的交叉之外,還有很多的方法來構(gòu)造特征,例如把特征標(biāo)準(zhǔn)化,歸一化,離散化,二值化等操作。除了構(gòu)造特征之外,如何判斷特征的重要性則是一個(gè)非常關(guān)鍵的問題。

最常見的方法就是查看訓(xùn)練好的模型的權(quán)重,另外還可以使用 Pearson 相關(guān)系數(shù)和 KL 散度等數(shù)學(xué)工具來粗糙的判斷特征是否有效。在此期間也寫過一些文章“交叉驗(yàn)證”,“特征工程簡(jiǎn)介”,“KL散度”。關(guān)于特征工程,除了閱讀一些必要的書籍之外,最重要的還是要實(shí)踐,只有實(shí)踐才能夠讓自己的經(jīng)驗(yàn)更加豐富。

在做推薦系統(tǒng)的時(shí)候,之前都是通過邏輯回歸算法(Logistic Regression)離線地把模型的權(quán)重算好,然后導(dǎo)入線上系統(tǒng),再進(jìn)行實(shí)時(shí)的計(jì)算和打分。除了離線的算法之外,在 2015 年的 12 月份了解到了能夠在線學(xué)習(xí)的 FTRL 算法。調(diào)研了之后在 2016 年初在組內(nèi)進(jìn)行了分享,同時(shí)在zr9558.com上面分享了自己的總結(jié),最近把該文章轉(zhuǎn)移到自己的微信公眾號(hào)上“Follow the Regularized Leader”。

在做 XX 推薦項(xiàng)目的過程中,了解到了數(shù)據(jù)才是整個(gè)機(jī)器學(xué)習(xí)項(xiàng)目的基石,如果數(shù)據(jù)的質(zhì)量不佳,那就需要進(jìn)行數(shù)據(jù)的預(yù)處理,甚至推動(dòng)開發(fā)人員去解決數(shù)據(jù)上報(bào)的問題。通常來說,要想做好一個(gè)推薦項(xiàng)目,除了特征工程和算法之外,最重要的就是數(shù)據(jù)的核對(duì)。當(dāng)時(shí)的經(jīng)驗(yàn)是需要核對(duì)多方的數(shù)據(jù),那就是算法離線計(jì)算出來的結(jié)果,線上計(jì)算出來的結(jié)果,真實(shí)產(chǎn)品中所展示的結(jié)果這三方的數(shù)據(jù)必須要完全一致,一旦不一致,就需要復(fù)盤核查,而不是繼續(xù)推進(jìn)項(xiàng)目。在此期間,踩過無數(shù)的數(shù)據(jù)的坑,因此得到的經(jīng)驗(yàn)就是一定要反復(fù)的核查數(shù)據(jù)。

【經(jīng)驗(yàn)分享】如何從0到1開始機(jī)器學(xué)習(xí)?

▌2016:從零到一

站在巨人的肩膀上,才能看得更遠(yuǎn)。-—學(xué)習(xí)推薦系統(tǒng)

“站在巨人的肩膀上,才能看得更遠(yuǎn)?!钡搅?2016 年的 2 月份,除了 XX 推薦項(xiàng)目的首頁個(gè)性化調(diào)優(yōu)算法之外,還開啟了另外一個(gè)小項(xiàng)目,嘗試開啟首頁的 tab,那就是針對(duì)不同的用戶推薦不同的物品。這個(gè)小項(xiàng)目簡(jiǎn)單一點(diǎn)的做法就是使用 ItemCF 或者熱傳導(dǎo)傳播的算法,在用戶收聽過某個(gè)節(jié)目之后,就給用戶推薦相似的節(jié)目。

這種場(chǎng)景其實(shí)在工業(yè)界早就有了成功的案例,也不算是一個(gè)新的場(chǎng)景。就好比與用戶在某電商網(wǎng)站上看中了某本書,然后就被推薦了其他的相關(guān)書籍。之前也寫過一篇推薦系統(tǒng)的簡(jiǎn)單算法“物質(zhì)擴(kuò)散算法”,推薦給大家參考一下。至于 ItemCF 和熱傳導(dǎo)算法的相關(guān)內(nèi)容,會(huì)在后續(xù)的 Blog 中持續(xù)完善。

“讀書千遍,其義自見。”在使用整個(gè)推薦系統(tǒng)的過程中,筆者只是大概知道了整個(gè)系統(tǒng)是如何搭建而成的。而要整體的了解機(jī)器學(xué)習(xí)的相關(guān)算法,光做項(xiàng)目則是遠(yuǎn)遠(yuǎn)不夠的。在做推薦業(yè)務(wù)的這段時(shí)間,周志華老師的教材《機(jī)器學(xué)習(xí)》在2016年初上市,于是花了一些時(shí)間來閱讀這本書籍。但是個(gè)人感覺這本書難度不大,只是需要另外一本書結(jié)合著看才能夠體會(huì)其中的精妙之處,那就是《機(jī)器學(xué)習(xí)實(shí)戰(zhàn)》。在《機(jī)器學(xué)習(xí)實(shí)戰(zhàn)》中,不僅有機(jī)器學(xué)習(xí)相關(guān)算法的原理描述,還有詳細(xì)的源代碼,這足以讓每一個(gè)初學(xué)者從新手到入門了。

路漫漫其修遠(yuǎn)兮,吾將上下而求索

說到從零到一,其實(shí)指的是在這一年體驗(yàn)了如何從零到一地做一個(gè)新業(yè)務(wù)。到了 2016 年的時(shí)候,為了把機(jī)器學(xué)習(xí)引入業(yè)務(wù)安全領(lǐng)域,在部門內(nèi)部成立了 XX 項(xiàng)目組,這個(gè)項(xiàng)目在部門內(nèi)部其實(shí)并沒有做過大規(guī)模的嘗試,也并沒有成功的經(jīng)驗(yàn),甚至也沒有一個(gè)合適的系統(tǒng)讓人使用,而且安全業(yè)務(wù)和推薦業(yè)務(wù)基本上不是一回事。

因?yàn)閷?duì)于推薦系統(tǒng)而言,給用戶的推薦是否準(zhǔn)確決定了 CTR 是否達(dá)標(biāo),但是對(duì)于安全系統(tǒng)而言,要想上線打擊黑產(chǎn)的話,準(zhǔn)確率則需要 99% 以上才行。之前的推薦系統(tǒng)用得最多的算法就是邏輯回歸,而且會(huì)存儲(chǔ)物品和用戶的兩類特征,其余的算法主要還是 ItemCF 和熱傳導(dǎo)算法。這就導(dǎo)致了當(dāng)時(shí)做 XX 項(xiàng)目的時(shí)候,之前的技術(shù)方案并不可用,需要基于業(yè)務(wù)安全的實(shí)際場(chǎng)景來重新搭建一套框架體系。

但是當(dāng)時(shí)做安全項(xiàng)目的時(shí)候并沒有實(shí)際的業(yè)務(wù)經(jīng)驗(yàn),而且暫定的計(jì)劃是基于 XX1 和 XX2 兩個(gè)業(yè)務(wù)來進(jìn)行試點(diǎn)機(jī)器學(xué)習(xí)。為了做好這個(gè)項(xiàng)目,一開始筆者調(diào)研了幾家號(hào)稱做機(jī)器學(xué)習(xí)+安全的初創(chuàng)公司,其中調(diào)研的最多的就是 XX 這家公司,因?yàn)樗麄兗野l(fā)表了一篇文章,里面介紹了機(jī)器學(xué)習(xí)如何應(yīng)用在業(yè)務(wù)安全上,那就是搭建一套無監(jiān)督+有監(jiān)督+人工打標(biāo)簽的對(duì)抗體系。筆者還是總結(jié)了當(dāng)時(shí)兩三個(gè)月所學(xué)的異常點(diǎn)檢測(cè)算法,文章的鏈接如下:“異常點(diǎn)監(jiān)測(cè)算法(一)”,“異常點(diǎn)檢測(cè)算法(二)”,“異常點(diǎn)檢測(cè)算法(三)”,“異常點(diǎn)檢測(cè)算法綜述”。

在 2016 年底的時(shí)候,說起來也是機(jī)緣巧合,有的同事看到了我在 2016 年 11 月份發(fā)表的文章,就來找筆者探討了一下如何構(gòu)建游戲 AI。當(dāng)時(shí)筆者對(duì)游戲AI的應(yīng)用場(chǎng)景幾乎不了解,只知道 DeepMind 做出了 AlphaGo,在 2013 年使用了深度神經(jīng)網(wǎng)絡(luò)玩 Atari 游戲。在12月份花費(fèi)了一定的時(shí)間研究了強(qiáng)化學(xué)習(xí)和深度學(xué)習(xí),也搭建過簡(jiǎn)單的 DQN 網(wǎng)絡(luò)進(jìn)行強(qiáng)化學(xué)習(xí)的訓(xùn)練。通過幾次的接觸和交流之后總算 2017 年 1 月份做出一個(gè)簡(jiǎn)單的游戲 AI,通過機(jī)器學(xué)習(xí)也能夠進(jìn)行游戲 AI 的自主學(xué)習(xí)。雖然不在游戲部門,但是通過這件事情,筆者對(duì)游戲 AI 也產(chǎn)生了濃厚的興趣,撰寫過兩篇文章“強(qiáng)化學(xué)習(xí)與泛函分析”,“深度學(xué)習(xí)與強(qiáng)化學(xué)習(xí)”。

【經(jīng)驗(yàn)分享】如何從0到1開始機(jī)器學(xué)習(xí)?

▌2017 年:再整旗鼓

在做日常項(xiàng)目的同時(shí),在 2017 年也接觸量子計(jì)算。在后續(xù)幾個(gè)月的工作中,持續(xù)調(diào)研了量子計(jì)算的基礎(chǔ)知識(shí),一些量子機(jī)器學(xué)習(xí)的技術(shù)方案,寫了兩篇文章“量子計(jì)算(一)”,“量子計(jì)算(二)”介紹了量子計(jì)算的基礎(chǔ)概念和技巧。

三十功名塵與土,八千里路云和月

提到再整旗鼓,其實(shí)指的是在 2017 年再次從零到一的做全新的項(xiàng)目。到了 2017 年 7 月份,隨著業(yè)務(wù)安全的機(jī)器學(xué)習(xí)框架已經(jīng)逐漸完善,XX 項(xiàng)目也快走到了尾聲,于是就又有了新的項(xiàng)目到了自己的手里,那就是織云智能運(yùn)維項(xiàng)目。運(yùn)營(yíng)中心這邊還在探索和起步階段,業(yè)界的智能運(yùn)維(AIOPS)的提出也是在2017年才逐步開始,那就是從手工運(yùn)維,自動(dòng)化運(yùn)維,逐步走向人工智能運(yùn)維的階段,也就是所謂的 AIOPS。只有這樣,運(yùn)營(yíng)中心才有可能實(shí)現(xiàn)真正的咖啡運(yùn)維階段。

【經(jīng)驗(yàn)分享】如何從0到1開始機(jī)器學(xué)習(xí)?

正式接觸到運(yùn)維項(xiàng)目是 2017 年 8 月份,從跟業(yè)務(wù)運(yùn)維同學(xué)的溝通情況來看,當(dāng)時(shí)有幾個(gè)業(yè)務(wù)的痛點(diǎn)和難點(diǎn)。例如:織云Monitor 時(shí)間序列的異常檢測(cè),哈勃的根因分析,織云ROOT 系統(tǒng)的根源分析,故障排查,成本優(yōu)化等項(xiàng)目。在 AIOPS 人員短缺,并且學(xué)術(shù)界并不怎么研究這類技術(shù)方案的前提下,如何在運(yùn)維中開展機(jī)器學(xué)習(xí)那就是一個(gè)巨大的難題。就像當(dāng)年有神盾系統(tǒng),無論怎么做都可以輕松的接入其余推薦業(yè)務(wù),并且也有相對(duì)成熟的內(nèi)部經(jīng)驗(yàn),學(xué)術(shù)界和工業(yè)界都有無數(shù)成功的案例。但是智能運(yùn)維這一塊,在 2017 年才被推廣出來,之前都是手工運(yùn)維和 DevOps 的一些內(nèi)容。于是,如何盡快搭建一套能夠在部門內(nèi)使用的智能運(yùn)維體系就成了一個(gè)巨大的挑戰(zhàn)。面臨的難題基本上有以下幾點(diǎn):

1. 歷史包袱沉重

2. AIOPS 人員短缺

3. 沒有成熟的系統(tǒng)框架

在這種情況下,外部引進(jìn)技術(shù)是不可能了,只能夠靠自研,合作的同事主要是業(yè)務(wù)運(yùn)維和運(yùn)營(yíng)開發(fā)。當(dāng)時(shí)第一個(gè)接觸的智能運(yùn)維項(xiàng)目就是哈勃的多維下鉆分析,其業(yè)務(wù)場(chǎng)景就是一旦發(fā)現(xiàn)了成功率等指標(biāo)下跌之后,需要從多維的指標(biāo)中精準(zhǔn)的發(fā)現(xiàn)異常,例如從運(yùn)營(yíng)商,省份,手機(jī)等指標(biāo)中發(fā)現(xiàn)導(dǎo)致成功率下跌的原因,這就是經(jīng)典的根因分析。這一塊在調(diào)研之后發(fā)現(xiàn),主要幾篇文章可以參考,綜合考慮了之后撰寫了一份資料,那就是“根因分析的探索”。PS:除了哈勃多維下鉆之外,個(gè)人感覺在 BI 智能商業(yè)分析中,其實(shí)也可以是這類方法來智能的發(fā)現(xiàn)“為什么DAU下跌?”“為什么收入沒有達(dá)到預(yù)期”等問題。

除了哈勃多維下鉆之外,織云Monitor 的時(shí)間序列異常檢測(cè)算法則是更為棘手的項(xiàng)目。之前的 Monitor 異常檢測(cè)算法,就是靠開發(fā)人員根據(jù)曲線的特點(diǎn)設(shè)定三個(gè)閾值(最大值,最小值,波動(dòng)率)來進(jìn)行異常檢測(cè)。這樣的結(jié)果就是準(zhǔn)確率不準(zhǔn),覆蓋率不夠,人力成本巨大。在上百萬條曲線都需要進(jìn)行異常檢測(cè)的時(shí)候,每一條曲線都需要人工配置閾值是完全不合理的。于是,導(dǎo)致的結(jié)果就是每周都需要有人值班,有了問題還不一定能夠及時(shí)發(fā)現(xiàn)。而對(duì)于時(shí)間序列算法,大家通常能夠想到的就是 ARIMA 算法,深度學(xué)習(xí)的 RNN 與 LSTM 算法,F(xiàn)acebook 近期開源的 Prophet 工具。這些方法筆者都調(diào)研過,并且未來會(huì)撰寫相關(guān)的文章介紹 ARIMA,RNN,Prophet 的使用,歡迎大家交流。

其實(shí)以上的幾種時(shí)間序列預(yù)測(cè)和異常檢測(cè)算法,主要還是基于單條時(shí)間序列來做的,而且基本上是針對(duì)那些比較平穩(wěn),具有歷史規(guī)律的時(shí)間序列來進(jìn)行操作的。如果針對(duì)每一條曲線都單獨(dú)搭建一個(gè)時(shí)間序列模型的話,那和閾值檢測(cè)沒有任何的區(qū)別,人力成本依舊巨大。而且在 織云Monitor 的實(shí)際場(chǎng)景下,這些時(shí)間序列異常檢測(cè)模型都有著自身的缺陷,無法做到“百萬條KPI曲線一人挑”的效果。

于是在經(jīng)歷了很多調(diào)研之后,我們創(chuàng)新性地提出了一個(gè)技術(shù)方案,成功的做到了“百萬條曲線”的異常檢測(cè)就用幾個(gè)模型搞定。那就是無監(jiān)督學(xué)習(xí)的方案加上有監(jiān)督學(xué)習(xí)的方案,第一層我們使用無監(jiān)督算法過濾掉大部分的異常,第二層我們使用了有監(jiān)督的算法來提升準(zhǔn)確率和召回率。

在時(shí)間序列異常檢測(cè)的各類算法中,通常的論文里面都是針對(duì)某一類時(shí)間序列,使用某一類模型,效果可以達(dá)到最優(yōu)。但是在我們的應(yīng)用場(chǎng)景下,見過的曲線千奇百怪,筆者都說不清楚有多少曲線的形狀,因此只用某一類時(shí)間序列的模型是絕對(duì)不可取的。但是,在學(xué)習(xí)機(jī)器學(xué)習(xí)的過程中,有一種集成學(xué)習(xí)的辦法,那就是把多個(gè)模型的結(jié)果作為特征,使用這些特征來訓(xùn)練一個(gè)較為通用的模型,從而對(duì)所有的 織云Monitor 時(shí)間序列進(jìn)行異常檢測(cè)。這一類方法筆者總結(jié)過,那就是“時(shí)間序列簡(jiǎn)介(一)”,最終我們做到了“百萬條曲線一人挑”,成功去掉了制定閾值的業(yè)務(wù)效果。

【經(jīng)驗(yàn)分享】如何從0到1開始機(jī)器學(xué)習(xí)?

走向未來

亦余心之所善兮,雖九死其猶未悔。

在轉(zhuǎn)行的過程中,筆者也走過彎路,體會(huì)過排查數(shù)據(jù)問題所帶來的痛苦,經(jīng)歷過業(yè)務(wù)指標(biāo)達(dá)成所帶來的喜悅,感受過如何從零到一搭建一套系統(tǒng)。在此撰寫一篇文章來記錄筆者這兩年多的成長(zhǎng)經(jīng)歷,希望能夠盡微薄之力幫助到那些有志向轉(zhuǎn)行來做機(jī)器學(xué)習(xí)的人。從這兩年做項(xiàng)目的經(jīng)歷來看,要想從零到一地做好項(xiàng)目,在一開始就必須要有一個(gè)好的規(guī)劃,然后一步一步的根據(jù)項(xiàng)目的進(jìn)展調(diào)整前進(jìn)的方向。但是如果沒有一個(gè)足夠的知識(shí)積累,就很難找到合適的前進(jìn)方向。

“亦余心之所善兮,雖九死其猶未悔。”在某些時(shí)候會(huì)有人為了短期的利益而放棄了一個(gè)長(zhǎng)遠(yuǎn)的目標(biāo),但是如果要讓自己走得更遠(yuǎn),最佳的方案是讓自己和團(tuán)隊(duì)一起成長(zhǎng),最好的是大家都擁有一個(gè)長(zhǎng)遠(yuǎn)的目標(biāo),不能因?yàn)橐恍┪⑿〉牟▌?dòng)而放任自己。同時(shí),如果團(tuán)隊(duì)或個(gè)人急于求成,往往會(huì)導(dǎo)致失敗,而堅(jiān)持不懈的學(xué)習(xí)則是做科研和開展工作的不二法門。

詩人陸游曾經(jīng)教育過他的后輩:“汝果欲學(xué)詩,功夫在詩外”。意思是說,如果你想真正地寫出好的詩詞,就要在生活上下功夫,去體驗(yàn)生活的酸甜苦辣,而不是抱著一本詩詞歌賦來反復(fù)閱讀。

如果看過天龍八部的人就知道,鳩摩智當(dāng)時(shí)上少林寺去挑戰(zhàn),在少林高僧面前展示出自己所學(xué)的少林七十二絕技,諸多少林高僧無不大驚失色。而當(dāng)時(shí)的虛竹在旁邊觀戰(zhàn),就對(duì)少林高僧們說:“鳩摩智所耍的招數(shù)雖然是少林絕技,但是本質(zhì)上卻是使用小無相功催動(dòng)出來的。雖然招數(shù)相同,但是卻用的道家的內(nèi)力?!睘槭裁瓷倭值母呱畟儧]有看出來鳩摩智武功的關(guān)鍵之處呢,那是因?yàn)樯倭指呱畟冊(cè)诰毠Φ臅r(shí)候,一直抱著武學(xué)秘籍在修煉,一輩子練到頭了也就13門絕技。

其實(shí)從鳩摩智的個(gè)人修煉來看,修練武學(xué)的關(guān)鍵并不在武學(xué)秘籍里。沒有找到關(guān)鍵的佛經(jīng),沒有找到運(yùn)功的法門,無論抱著武學(xué)秘籍修煉多少年,終究與別人有著本質(zhì)上的差距。

筆者在 SNG 社交網(wǎng)絡(luò)運(yùn)營(yíng)部的這兩年多,用過推薦項(xiàng)目,做過安全項(xiàng)目,正在做運(yùn)維項(xiàng)目,也算是部門內(nèi)唯一一個(gè)(不知道是否準(zhǔn)確)做過三種項(xiàng)目的人,使用過推薦系統(tǒng),從零到一搭建過兩個(gè)系統(tǒng)。目前筆者的個(gè)人興趣集中在 AIOPS 這個(gè)場(chǎng)景下,因?yàn)楣P者相信在業(yè)務(wù)運(yùn)維這個(gè)傳統(tǒng)領(lǐng)域,機(jī)器學(xué)習(xí)一定有著自己的用武之地。相信在不久的將來,AIOPS 將會(huì)在運(yùn)維上面的各個(gè)場(chǎng)景落地,真正的走向咖啡運(yùn)維。

【經(jīng)驗(yàn)分享】如何從0到1開始機(jī)器學(xué)習(xí)?

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1789

    文章

    46401

    瀏覽量

    236637
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8325

    瀏覽量

    132218

原文標(biāo)題:如何從0到1開始機(jī)器學(xué)習(xí)?

文章出處:【微信號(hào):AI_Thinker,微信公眾號(hào):人工智能頭條】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    人工智能、機(jī)器學(xué)習(xí)和深度學(xué)習(xí)存在什么區(qū)別

    人工智能指的是在某種程度上顯示出類似人類智能的設(shè)備。AI有很多技術(shù),但其中一個(gè)很大的子集是機(jī)器學(xué)習(xí)——讓算法數(shù)據(jù)中學(xué)習(xí)。
    發(fā)表于 10-24 17:22 ?2376次閱讀
    人工智能、<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>和深度<b class='flag-5'>學(xué)習(xí)</b>存在什么區(qū)別

    合肥湯誠(chéng)音頻功放芯片XA9812B早教機(jī)套裝兒童智能學(xué)習(xí)機(jī)應(yīng)用解決方案

    、智能學(xué)習(xí)機(jī)和在線學(xué)習(xí)平臺(tái)等,幫助家長(zhǎng)為孩子提供更好的學(xué)習(xí)環(huán)境。 早教機(jī)智能學(xué)習(xí)機(jī)是一種先進(jìn)的教育設(shè)備,結(jié)合了現(xiàn)代科技和兒童教育理念,旨在為嬰幼兒提供多樣化的
    的頭像 發(fā)表于 09-25 17:22 ?228次閱讀
    合肥湯誠(chéng)音頻功放芯片XA9812B早教機(jī)套裝兒童智能<b class='flag-5'>學(xué)習(xí)機(jī)</b>應(yīng)用解決方案

    小度學(xué)習(xí)機(jī)Z30發(fā)布,搭載紫光展銳芯片平臺(tái)

    AI時(shí)代,大模型成為推動(dòng)智慧教育升維發(fā)展的新質(zhì)生產(chǎn)力。近期小度科技重磅發(fā)布全球首款基于文心大模型的學(xué)習(xí)機(jī)——小度學(xué)習(xí)機(jī)Z30,該產(chǎn)品搭載紫光展銳UNISOC S8000芯片平臺(tái),基于文心大模型,重新
    的頭像 發(fā)表于 08-26 09:15 ?543次閱讀

    【「時(shí)間序列與機(jī)器學(xué)習(xí)」閱讀體驗(yàn)】+ 鳥瞰這本書

    清晰,時(shí)間序列分析的基礎(chǔ)理論出發(fā),逐步深入機(jī)器學(xué)習(xí)算法在時(shí)間序列預(yù)測(cè)中的應(yīng)用,內(nèi)容全面,循序漸進(jìn)。每一章都經(jīng)過精心設(shè)計(jì),對(duì)理論知識(shí)進(jìn)行了詳細(xì)的闡述,對(duì)實(shí)際案例進(jìn)行了生動(dòng)的展示,使讀
    發(fā)表于 08-12 11:28

    BP神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)機(jī)

    BP神經(jīng)網(wǎng)絡(luò)(Backpropagation Neural Network),即反向傳播神經(jīng)網(wǎng)絡(luò),是一種基于梯度下降算法的多層前饋神經(jīng)網(wǎng)絡(luò),其學(xué)習(xí)機(jī)制的核心在于通過反向傳播算法
    的頭像 發(fā)表于 07-10 15:49 ?307次閱讀

    機(jī)器學(xué)習(xí)算法原理詳解

    機(jī)器學(xué)習(xí)作為人工智能的一個(gè)重要分支,其目標(biāo)是通過讓計(jì)算機(jī)自動(dòng)數(shù)據(jù)中學(xué)習(xí)并改進(jìn)其性能,而無需進(jìn)行明確的編程。本文將深入解讀幾種常見的機(jī)器
    的頭像 發(fā)表于 07-02 11:25 ?576次閱讀

    深度學(xué)習(xí)與傳統(tǒng)機(jī)器學(xué)習(xí)的對(duì)比

    在人工智能的浪潮中,機(jī)器學(xué)習(xí)和深度學(xué)習(xí)無疑是兩大核心驅(qū)動(dòng)力。它們各自以其獨(dú)特的方式推動(dòng)著技術(shù)的進(jìn)步,為眾多領(lǐng)域帶來了革命性的變化。然而,盡管它們都屬于機(jī)器
    的頭像 發(fā)表于 07-01 11:40 ?980次閱讀

    小度發(fā)布首款百度文心大模型學(xué)習(xí)機(jī)

    近日,小度科技推出了一款基于文心大模型的學(xué)習(xí)機(jī)——小度學(xué)習(xí)機(jī)Z30。這款學(xué)習(xí)機(jī)針對(duì)學(xué)習(xí)計(jì)劃、診斷、練習(xí)、學(xué)習(xí)、預(yù)習(xí)、育兒、答疑七大環(huán)節(jié)進(jìn)行了
    的頭像 發(fā)表于 05-29 09:10 ?656次閱讀

    全球首款基于文心大模型的學(xué)習(xí)機(jī)—小度學(xué)習(xí)機(jī)Z30重磅發(fā)布

    AI時(shí)代,大模型成為推動(dòng)智能教育升維發(fā)展的新質(zhì)生產(chǎn)力。5月27日小度科技召開新品發(fā)布會(huì),全球首款基于文心大模型的學(xué)習(xí)機(jī)——小度學(xué)習(xí)機(jī)Z30重磅發(fā)布,
    的頭像 發(fā)表于 05-28 09:30 ?577次閱讀

    AI大模型落地學(xué)習(xí)機(jī),大模型應(yīng)用成學(xué)習(xí)機(jī)創(chuàng)新方向

    電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)大模型在終端產(chǎn)品上的落地,除了智能手機(jī)、PC之外,還有學(xué)習(xí)機(jī)。過去一段時(shí)間,隨著大模型的火熱,互聯(lián)網(wǎng)、教育公司都已經(jīng)紛紛披露大模型在教育領(lǐng)域的最新動(dòng)態(tài),并發(fā)布搭載AI
    的頭像 發(fā)表于 02-23 01:19 ?3718次閱讀

    TCL&quot;未來紙&quot;顯示技術(shù)助力松鼠Ai S20智能學(xué)習(xí)機(jī),全球首個(gè)智適應(yīng)教育大模型亮相CES

    拉斯維加斯2024年1月15日 /美通社/ -- TCL"未來紙"(NXTPAPER)顯示技術(shù)助力新一代旗艦智能學(xué)習(xí)機(jī)松鼠Ai S20學(xué)習(xí)機(jī),并在今年的國(guó)際消費(fèi)電子展(CES)上初露鋒芒,這是繼松鼠
    的頭像 發(fā)表于 01-15 20:55 ?548次閱讀
    TCL&quot;未來紙&quot;顯示技術(shù)助力松鼠Ai S20智能<b class='flag-5'>學(xué)習(xí)機(jī)</b>,全球首個(gè)智適應(yīng)教育大模型亮相CES

    大牛談如何學(xué)習(xí)機(jī)器視覺?

    國(guó)內(nèi)外機(jī)器視覺發(fā)展的不同。本人認(rèn)為,只有先搞清了兩邊的不一樣,才便于說清如何下手學(xué)習(xí)。國(guó)外機(jī)器視覺發(fā)展今天,已經(jīng)
    發(fā)表于 01-15 11:02 ?351次閱讀
    大牛談如何<b class='flag-5'>學(xué)習(xí)機(jī)器</b>視覺?

    如何使用TensorFlow構(gòu)建機(jī)器學(xué)習(xí)模型

    在這篇文章中,將逐步講解如何使用 TensorFlow 創(chuàng)建一個(gè)簡(jiǎn)單的機(jī)器學(xué)習(xí)模型。
    的頭像 發(fā)表于 01-08 09:25 ?874次閱讀
    如何使用TensorFlow構(gòu)建<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>模型

    什么是機(jī)器學(xué)習(xí)?它的重要性體現(xiàn)在哪

    機(jī)器學(xué)習(xí)是一種人工智能(AI)的子領(lǐng)域,旨在使計(jì)算機(jī)系統(tǒng)通過經(jīng)驗(yàn)自動(dòng)學(xué)習(xí)和改進(jìn),而無需明確地進(jìn)行編程。它側(cè)重于開發(fā)算法和模型,使計(jì)算機(jī)能夠
    的頭像 發(fā)表于 01-05 08:27 ?1277次閱讀
    什么是<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>?它的重要性體現(xiàn)在哪

    機(jī)器人和自動(dòng)化學(xué)習(xí)機(jī)會(huì)

    Hine Automation和ROOTS Education在合作創(chuàng)造主題更加相關(guān)、更易獲得的機(jī)器人和自動(dòng)化學(xué)習(xí)機(jī)會(huì)。此次合作是一項(xiàng)積極舉措,旨在確保半導(dǎo)體行業(yè)擁有所需的訓(xùn)練有素的勞動(dòng)力,以解決技能短缺問題并在未來幾年蓬勃發(fā)展。
    的頭像 發(fā)表于 11-07 16:08 ?295次閱讀