0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

機(jī)器學(xué)習(xí)不需要數(shù)學(xué),調(diào)包就行?

jmiy_worldofai ? 來(lái)源:未知 ? 作者:胡薇 ? 2018-09-30 10:38 ? 次閱讀

不抖機(jī)靈,想從接觸過(guò)機(jī)器學(xué)習(xí)學(xué)術(shù)圈但已投身工業(yè)界的角度來(lái)回答。

我認(rèn)為:大部分機(jī)器學(xué)習(xí)從業(yè)者不需要過(guò)度的把時(shí)間精力放在數(shù)學(xué)上,而該用于熟悉不同算法的應(yīng)用場(chǎng)景和掌握一些調(diào)參技巧。好的數(shù)學(xué)基礎(chǔ)可以使你的模型簡(jiǎn)潔高效,但絕非必要的先決條件。

原因如下:

1. 即使你有了一定的數(shù)學(xué)功底,還是不知道怎么調(diào)參或者進(jìn)行優(yōu)化。

這話說(shuō)的雖然有點(diǎn)自暴自棄,但捫心自問(wèn)在座的各位,當(dāng)你發(fā)現(xiàn) accuracy 不好、loss 很高、模型已經(jīng) overfitting 了,你唰唰唰列列公式玩玩矩陣就知道問(wèn)題出在哪里了嗎?不一定。誠(chéng)然,懂得更多的統(tǒng)計(jì)原理可以幫助推測(cè)問(wèn)題出在了哪里,你可能換了一個(gè) loss function 或者加了新的 regularizer,但結(jié)果不一定會(huì)更好 :(數(shù)學(xué)基礎(chǔ)之于機(jī)器學(xué)習(xí)從業(yè)者很像 debugger 之于碼農(nóng),它給了你方向,但不能保證你一定可以解決問(wèn)題。那怎么能解決問(wèn)題?只有經(jīng)驗(yàn)經(jīng)驗(yàn)經(jīng)驗(yàn),別無(wú)他法,有時(shí)候甚至靠的是直覺(jué)。數(shù)學(xué)基礎(chǔ)是好的內(nèi)功基礎(chǔ),但你調(diào)包調(diào)多了,其實(shí)也慢慢能抓到一些感覺(jué),不必看不起 “調(diào)包俠”。

2. 工業(yè)界可以應(yīng)用的模型是很有限的,可調(diào)的參數(shù)也是有限的。

工業(yè)界選擇模型非??粗乜山忉屝?,效率,以及和整個(gè)系統(tǒng)的整合能力。舉例,在我的工作中,大部分時(shí)間都在使用 Regression 和 Decision Tree 相關(guān)的算法(如 Random Forests)。是因?yàn)檫@兩個(gè)算法最好么?不,恰恰是因?yàn)檫@兩個(gè)算法穩(wěn)定及高效,而且容易解釋。對(duì)于這樣的模型,你即使數(shù)學(xué)能力很強(qiáng),能調(diào)整的參數(shù)也是有限的。根據(jù)網(wǎng)上的例子和經(jīng)驗(yàn),大量的工程師可以在數(shù)學(xué)基礎(chǔ)稍弱的情況下做到很好的效果。

3. 數(shù)學(xué) / 統(tǒng)計(jì)知識(shí)已經(jīng)成了既得利益者刻意為外來(lái)者建立的一道壁壘。

不知道大家有多少人是從事過(guò) ML 研究的。我個(gè)人的觀察是做出成績(jī)的 ML 研究人員是有限的,科班出身的 researcher 更是遠(yuǎn)遠(yuǎn)無(wú)法工業(yè)界的空缺。所以大家沒(méi)有必要擔(dān)心會(huì)被轉(zhuǎn)行者搶了飯碗,也沒(méi)有必要刻意鼓吹一定要懂矩陣,凸優(yōu)化,等數(shù)學(xué)知識(shí)才配做機(jī)器學(xué)習(xí)。大家都是出來(lái)賣(mài)的,不必互相為難。說(shuō)來(lái)慚愧,在工作中我常常跟老板說(shuō)這個(gè)人不能用,你要用我這種科班出身的人,但我內(nèi)心是不贊同的。

每當(dāng)我看到知乎上有人問(wèn)機(jī)器學(xué)習(xí)怎么入門(mén),結(jié)果大家立馬推薦第一本就看 PRML 和 Statitical Learning 以及一大堆公開(kāi)課和數(shù)學(xué)課的時(shí)候,我的內(nèi)心是崩潰的。各位答主的目標(biāo)是把所有人都嚇回去還是秀一下優(yōu)越感?

4. 理論模型和實(shí)際應(yīng)用分的是兩塊不同的蛋糕。

承接第 2,3 點(diǎn),做理論研究的發(fā)力于突破,提出新的模型或者優(yōu)化方法,做應(yīng)用的致力于把模型應(yīng)用于數(shù)據(jù)上,攫取商業(yè)價(jià)值。這兩者不存在利益沖突,做理論的人有自帶正統(tǒng)光環(huán)的優(yōu)勢(shì),所以更該顯得大度一些。只有 “調(diào)包” 的人越來(lái)越多,這個(gè)行業(yè)才會(huì)繁榮,因?yàn)樽C明技術(shù)落了地,可以帶來(lái)實(shí)際價(jià)值。

5. 行業(yè)的發(fā)展趨勢(shì)是降低工具的使用難度,這讓我們不必反復(fù)造輪子。

亞馬、遜谷歌、微軟等各大平臺(tái)都開(kāi)放了他們的機(jī)器學(xué)習(xí)工具。以前人們還需要自己寫(xiě)各種模型,好一些的調(diào)一下 sklearn,但現(xiàn)在 Azure ML Studio 已經(jīng)方便到零代碼了。年初的時(shí)候,我試了一下 ML studio,簡(jiǎn)直方便的可怕,完全是圖形拖動(dòng)連接就可以建立模型,那一刻我仿似看到了自己即將失業(yè)。

6. 文藝一點(diǎn)說(shuō),我們需要更包容的心態(tài),切勿文人相輕。

想要接觸了解一門(mén)學(xué)科,應(yīng)該先有興趣,才有探索的積極性。就像我們第一次看到 Hello word 出現(xiàn)的樣子,很多剛?cè)胄械娜说谝淮慰吹綑C(jī)器學(xué)習(xí)能解決實(shí)際問(wèn)題時(shí),會(huì)產(chǎn)生濃厚的興趣。

我怕的就是所謂的圈內(nèi)人都說(shuō)你必須要會(huì)矩陣分解,必須要會(huì)用 trace 算導(dǎo)數(shù),必須會(huì)優(yōu)化,才能開(kāi)始學(xué)習(xí)機(jī)器學(xué)習(xí)。這個(gè)周期太長(zhǎng),很多人連開(kāi)始的勇氣都沒(méi)有~ 我覺(jué)得不管怎么樣,要先動(dòng)手做起來(lái),發(fā)現(xiàn)自己的不足,再去補(bǔ)充需要的東西。

既然學(xué)術(shù)是自由的,我們就打開(kāi)大門(mén),歡迎大家都進(jìn)來(lái)坐坐。如果他 / 她不喜歡,歡迎到隔壁串門(mén)。但我們不要給自己家門(mén)壘了高高的臺(tái)階,說(shuō)閑人勿進(jìn)。久而久之,難免門(mén)可羅雀。

綜上,我覺(jué)得應(yīng)用機(jī)器學(xué)習(xí)模型和技巧既不能完全不懂?dāng)?shù)學(xué),兩眼一抹黑,也不該要求每個(gè)從業(yè)者都要精通各種數(shù)學(xué)理論。模型應(yīng)用者要長(zhǎng)存對(duì)理論的敬畏之心,不要總想搞個(gè)大新聞?wù)f “機(jī)器學(xué)習(xí)也不過(guò)如此”,但做理論的也不必覺(jué)得高人一等,別人都是二等公民。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴

原文標(biāo)題:如何看待「機(jī)器學(xué)習(xí)不需要數(shù)學(xué),很多算法封裝好了,調(diào)個(gè)包就行」這種說(shuō)法?

文章出處:【微信號(hào):worldofai,微信公眾號(hào):worldofai】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    深控技術(shù)不需要點(diǎn)表的注塑機(jī)網(wǎng)關(guān):制藥行業(yè)的智能變革

    深控技術(shù)研發(fā)的 “不需要點(diǎn)表的注塑機(jī)網(wǎng)關(guān)” 在制藥行業(yè)的成功應(yīng)用,為企業(yè)帶來(lái)了顯著的經(jīng)濟(jì)效益和社會(huì)效益。它不僅提高了生產(chǎn)效率和產(chǎn)品質(zhì)量,還降低了設(shè)備維護(hù)成本,為制藥企業(yè)的智能化轉(zhuǎn)型提供了有力支持。相信在未來(lái),深控技術(shù)不需要點(diǎn)表的注塑機(jī)網(wǎng)關(guān)將在更多行業(yè)發(fā)揮重要作用,推動(dòng)產(chǎn)業(yè)
    的頭像 發(fā)表于 10-23 09:44 ?20次閱讀
    深控技術(shù)<b class='flag-5'>不需要</b>點(diǎn)表的注塑機(jī)網(wǎng)關(guān):制藥行業(yè)的智能變革

    SMT 產(chǎn)線數(shù)據(jù)采集方案 —— 不需要點(diǎn)表的工業(yè)網(wǎng)關(guān)

    深控技術(shù)研發(fā)的 “不需要點(diǎn)表的工業(yè)網(wǎng)關(guān)” 為 SMT 產(chǎn)線的數(shù)據(jù)采集提供了一種高效、準(zhǔn)確、便捷的解決方案。
    的頭像 發(fā)表于 10-21 10:31 ?72次閱讀
    SMT 產(chǎn)線數(shù)據(jù)采集方案 —— <b class='flag-5'>不需要</b>點(diǎn)表的工業(yè)網(wǎng)關(guān)

    不需要點(diǎn)表的工業(yè)網(wǎng)關(guān)”的 PLC 數(shù)據(jù)采集解決方案

    深控技術(shù)的 PLC 數(shù)據(jù)采集解決方案以其自主研發(fā)的 “不需要點(diǎn)表的工業(yè)網(wǎng)關(guān)” 為核心,旨在為各類(lèi)工業(yè)場(chǎng)景提供高效、便捷、可靠的數(shù)據(jù)采集服務(wù),助力企業(yè)實(shí)現(xiàn)數(shù)字化轉(zhuǎn)型和智能化升級(jí)。該解決方案能夠無(wú)縫對(duì)接
    的頭像 發(fā)表于 10-14 16:01 ?118次閱讀
    “<b class='flag-5'>不需要</b>點(diǎn)表的工業(yè)網(wǎng)關(guān)”的 PLC 數(shù)據(jù)采集解決方案

    深控技術(shù)研發(fā)的 “不需要點(diǎn)表的工業(yè)網(wǎng)關(guān)” 在工廠產(chǎn)線設(shè)備的應(yīng)用

    工廠產(chǎn)線設(shè)備的高效運(yùn)行與數(shù)據(jù)交互至關(guān)重要。深控技術(shù)研發(fā)的 “不需要點(diǎn)表的工業(yè)網(wǎng)關(guān)” 為工廠產(chǎn)線帶來(lái)了創(chuàng)新性的解決方案,極大地提升了設(shè)備的互聯(lián)互通性、數(shù)據(jù)處理效率以及整體運(yùn)營(yíng)的智能化水平。
    的頭像 發(fā)表于 10-14 10:52 ?118次閱讀
    深控技術(shù)研發(fā)的 “<b class='flag-5'>不需要</b>點(diǎn)表的工業(yè)網(wǎng)關(guān)” 在工廠產(chǎn)線設(shè)備的應(yīng)用

    TAS5755M的I2S有PLL,是否可以不需要MCLK?

    TAS5755M的I2S有PLL,是否可以不需要MCLK?
    發(fā)表于 10-10 06:25

    不需要點(diǎn)表的工業(yè)網(wǎng)關(guān)” 深控技術(shù)物聯(lián)網(wǎng)解決方案

    不需要點(diǎn)表的工業(yè)網(wǎng)關(guān)” 物聯(lián)網(wǎng)解決方案
    的頭像 發(fā)表于 09-29 15:43 ?247次閱讀
    “<b class='flag-5'>不需要</b>點(diǎn)表的工業(yè)網(wǎng)關(guān)” 深控技術(shù)物聯(lián)網(wǎng)解決方案

    OPA2171需不需要外部補(bǔ)償?

    如OPA2171這個(gè)運(yùn)放,不知道需不需要外部補(bǔ)償?
    發(fā)表于 09-26 06:23

    選擇ths4631后需不需要用jfet呀?

    如圖所示的電荷靈敏前方電路,如果用ths4631作為運(yùn)放A1,還需不需要用前端的Q1(Q1為jfet,型號(hào)為2sk152),如果需要時(shí)什么原因,如果不需要時(shí)什么原因。還有用Q1的作用是什么?
    發(fā)表于 09-23 07:20

    網(wǎng)線那幾根線不需要

    在網(wǎng)線中,哪幾根線不需要接主要取決于網(wǎng)絡(luò)的需求和類(lèi)型。一般來(lái)說(shuō),在百兆網(wǎng)絡(luò)中,通常只需要用到其中的四根線,即第1、第2、第3、第6根線,它們分別承擔(dān)著數(shù)據(jù)的發(fā)送和接收功能。這四根線在網(wǎng)線中的顏色
    的頭像 發(fā)表于 09-04 09:40 ?546次閱讀

    ESP32雙核系列基于FreeRTOS編程,需不需要關(guān)注雙核特性呢?

    如題,我需不需要關(guān)注兩個(gè)cpu都有在工作,運(yùn)行線程?
    發(fā)表于 06-19 07:32

    L6235Q VREF引腳要是不需要tacho測(cè)速功能需要怎么接?

    這個(gè)L6235Q VREF引腳要是不需要tacho測(cè)速功能需要怎么接,看數(shù)據(jù)手冊(cè)好像是說(shuō)PWM電流控制器參考電壓,最小值為-0.1V,最大值為5V,設(shè)計(jì)時(shí)應(yīng)該怎
    發(fā)表于 03-28 08:17

    不需要License不需要燒錄器,板卡集成下載器和調(diào)試功能,盤(pán)古PGX-Lite 7K開(kāi)發(fā)板

    不需要License不需要燒錄器,板卡集成下載器和調(diào)試功能,盤(pán)古PGX-Lite 7K開(kāi)發(fā)板,紫光同創(chuàng)Compa系類(lèi)低功耗CPLD,基于PGC7KD-6IMBG256,輕松掌握國(guó)產(chǎn)FPGA操作
    發(fā)表于 03-08 13:51

    六類(lèi)屏蔽網(wǎng)線和六類(lèi)非屏蔽網(wǎng)線都不需要接地嗎

    是的,一般情況下六類(lèi)屏蔽網(wǎng)線和六類(lèi)非屏蔽網(wǎng)線都不需要接地。在綜合布線工程中,通常采用免接地方式,即網(wǎng)線不需要直接接地。這是因?yàn)榫W(wǎng)線傳輸?shù)男盘?hào)電壓較低,一般在12V左右,因此不需要通過(guò)接地來(lái)消除靜電等
    的頭像 發(fā)表于 03-08 10:01 ?2740次閱讀

    指向code區(qū)數(shù)組的指針需不需要加code關(guān)鍵字的聲明?

    指向code區(qū)數(shù)組的指針需不需要加code 關(guān)鍵字的聲明?
    發(fā)表于 11-02 06:16

    完全不需要電解電容的LED驅(qū)動(dòng)方案資料詳情

    電子發(fā)燒友網(wǎng)站提供《完全不需要電解電容的LED驅(qū)動(dòng)方案資料詳情.rar》資料免費(fèi)下載
    發(fā)表于 10-31 10:22 ?0次下載
    完全<b class='flag-5'>不需要</b>電解電容的LED驅(qū)動(dòng)方案資料詳情