0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

機(jī)器教學(xué):用人類的專業(yè)知識與經(jīng)驗指導(dǎo)機(jī)器學(xué)習(xí)

電子工程師 ? 來源:YXQ ? 2019-05-06 09:27 ? 次閱讀

隨著AI應(yīng)用的場景越來越豐富,加上數(shù)據(jù)量小、任務(wù)復(fù)雜等種種實踐中可能出現(xiàn)的挑戰(zhàn),有時機(jī)器學(xué)習(xí)的結(jié)果并不理想,而且效率低下。而我們?nèi)祟悡碛胸S富的專業(yè)經(jīng)驗,為什么不向機(jī)器傳授一些小訣竅呢?為此,微軟研究院推出了一種輔助方法——“機(jī)器教學(xué)”(Machine Teaching),人類可以利用自己的專業(yè)知識和經(jīng)驗幫助AI進(jìn)行更有針對性的學(xué)習(xí),幫助強(qiáng)化學(xué)習(xí)算法更快地找到解決方案。本文編譯自微軟人工智能博客“Machine teaching: How people’s expertise makes AI even more powerful”。

微軟商業(yè)人工智能事業(yè)部總經(jīng)理、Bonsai公司前首席執(zhí)行官M(fèi)ark Hammond

用人類的知識幫助機(jī)器學(xué)習(xí)

我們今天的機(jī)器學(xué)習(xí)過程,某種程度上就像把一根球棒和一只棒球交給五歲小朋友,向他展示球棒和棒球之間無數(shù)種使用方法,然后期望他自己體會出打棒球的正確方式——我們向機(jī)器展示海量的數(shù)據(jù),希望它能自己找到其中的關(guān)聯(lián)和模式。這對簡單的文本、圖像識別等常見的AI技術(shù)來說非常有效,但隨著AI應(yīng)用的領(lǐng)域和場景越來越豐富,有時機(jī)器自主學(xué)習(xí)的效果并不理想,而且效率低下,特別是在訓(xùn)練數(shù)據(jù)過少的情況下。

“面對人類,我們可能會非常自然地想到,教小朋友打棒球要從最簡單的開始,慢慢過渡到快球;但當(dāng)我們面對機(jī)器的時候,大家都想直接給系統(tǒng)上快球。事實上,機(jī)器學(xué)習(xí)除了自行從數(shù)據(jù)中摸索知識,更可以從經(jīng)驗豐富的人類這里獲取相關(guān)的知識?!?微軟商業(yè)人工智能事業(yè)部總經(jīng)理Mark Hammond說。為此,微軟研究院開發(fā)了一種輔助方法——“機(jī)器教學(xué)”(Machine Teaching),人類可以利用自己的專業(yè)知識和經(jīng)驗幫助AI將復(fù)雜問題分解成比較簡單的任務(wù),并為機(jī)器學(xué)習(xí)模型提供相關(guān)的重要線索,幫助強(qiáng)化學(xué)習(xí)算法更好地找到解決方案。

如果你要教一位小朋友識別桌子,你會先告訴他:“它有四條腿和一個平面”。如果他把椅子也當(dāng)成了桌子,你就會進(jìn)一步向他解釋:“椅子有靠背,但桌子沒有靠背”。這一抽象的反饋的循環(huán)是人類學(xué)習(xí)方式的關(guān)鍵,而它也能使傳統(tǒng)的機(jī)器學(xué)習(xí)方法變得更強(qiáng)大。

機(jī)器教學(xué)能在許多場景中發(fā)揮出格外的優(yōu)勢。在有監(jiān)督學(xué)習(xí)中,如果某個特定行業(yè)或公司的需求過于具體,導(dǎo)致訓(xùn)練數(shù)據(jù)非常少,機(jī)器教學(xué)將非常有用。而在復(fù)雜的強(qiáng)化學(xué)習(xí)場景中,算法可能很難從數(shù)百萬種可能中做出選擇,這時,如果擁有某方面專業(yè)知識的人類提供一些幫助,機(jī)器就能大大縮短尋找解決方案的時間。

這也是微軟提出機(jī)器教學(xué)的長遠(yuǎn)目標(biāo)之一。我們希望為來自各行各業(yè)的人們提供人工智能平臺,讓律師、會計師、工程師、護(hù)士等不同領(lǐng)域的專家即使具備很少的AI專業(yè)知識,也能將所在領(lǐng)域的專業(yè)知識傳授給智能系統(tǒng),讓智能系統(tǒng)更有效地助力問題的解決。

“即使是最聰明的AI,也要經(jīng)過很多學(xué)習(xí)才能完成現(xiàn)實世界中的復(fù)雜任務(wù)。因此AI需要在人們的引導(dǎo)下學(xué)習(xí),這也讓更廣泛的用戶能借助機(jī)器學(xué)習(xí)來完成復(fù)雜的任務(wù),這是機(jī)器教學(xué)的意義所在?!?微軟商業(yè)人工智能事業(yè)部副總裁Gurdeep Pall表示。

微軟機(jī)器教學(xué)組對機(jī)器教學(xué)原理的探索已將近十年,目前他們正在將這些概念融入微軟的各大產(chǎn)品,以幫助企業(yè)構(gòu)建定制化的智能系統(tǒng)與工具?!叭绻憧梢韵蛩藗魇谀承┲R,你也能用相似的方法把它們傳授給機(jī)器?!蔽④浗艹龉こ處煛C(jī)器教學(xué)項目發(fā)起者Patrice Simard說,他的團(tuán)隊將加入微軟體驗與設(shè)備組,將機(jī)器教學(xué)與微軟的對話式AI產(chǎn)品進(jìn)一步整合。

微軟研究員Patrice Simard,Alicia Edelman Pelton和Riham Mansour(從左至右)正在將機(jī)器教學(xué)融入微軟產(chǎn)品中

機(jī)器教學(xué)的應(yīng)用潛力

Simard開始思考新的AI系統(tǒng)范式,是因為他注意到機(jī)器學(xué)習(xí)會議上的許多工作都在通過精妙的基準(zhǔn)測試來提高算法性能。這讓他意識到“教授”知識對機(jī)器學(xué)習(xí)的重要性,特別是在數(shù)據(jù)有限的情況下。

機(jī)器教學(xué)要通過識別高層級、有意義的特征來改進(jìn)模型。比如,你想讓AI選出質(zhì)量最好的汽車,卻只有很少的標(biāo)注數(shù)據(jù),AI提取出的“好車”的特征可能會非常不靠譜,比如“車牌第四位是2”。但如果提示AI對油耗、安全評級、碰撞測試、價格等標(biāo)準(zhǔn)進(jìn)行綜合考量,盡管數(shù)據(jù)仍然有限,AI對汽車質(zhì)量的評估將有效許多。

除此之外,機(jī)器教學(xué)的另一個目的是把復(fù)雜任務(wù)分解為多個更簡單的任務(wù)。如果沒有高層級特征,則可用包含較低層級特征、簡單到只需少量案例就能學(xué)習(xí)的子模型來構(gòu)建。如果系統(tǒng)多次出現(xiàn)同樣的錯誤,則可以通過添加特征或案例的方式來消除。

Azure認(rèn)知服務(wù)中的語言理解API是機(jī)器教學(xué)理念應(yīng)用的首批產(chǎn)品之一,它能夠幫助用戶 “理解” 短文本中的意圖和關(guān)鍵概念,目前已被UPS快遞、Progressive Insurance和西班牙電信等企業(yè)用于開發(fā)智能客服機(jī)器人。使用機(jī)器教學(xué)的方法,人們將無需為客服機(jī)器人準(zhǔn)備包含所有用戶問題的數(shù)據(jù)集,只需提供四五個問題案例和該領(lǐng)域的重要特征、關(guān)鍵字,語言理解API就可以順利完成剩余的工作。

機(jī)器教學(xué)流程圖

再舉個例子,一家公司想用AI掃描過去一年的所有文件和電子郵件,了解銷售一共發(fā)出了多少次報價,又有多少次成功完成了銷售。AI首先要知道怎樣從合同或發(fā)票中識別報價,而問題在于沒有現(xiàn)成的訓(xùn)練數(shù)據(jù),而且每名銷售人員的開單據(jù)的方式可能都有所差別。

這時,如果采用傳統(tǒng)的機(jī)器學(xué)習(xí)方法,這家公司就要經(jīng)歷漫長繁復(fù)的人工標(biāo)記數(shù)據(jù)流程,再請一位機(jī)器學(xué)習(xí)專家來構(gòu)建機(jī)器學(xué)習(xí)模型。而一旦銷售人員改變了單據(jù)格式,模型就會無法識別。

而如果采用機(jī)器教學(xué)的模式,企業(yè)內(nèi)部的專業(yè)人員將為報價常見的特征和結(jié)構(gòu)提供線索,如客戶名、“報價單”、“交貨日期”、“產(chǎn)品”、“數(shù)量”、“付款條款”等關(guān)鍵詞。系統(tǒng)會將這些專業(yè)知識轉(zhuǎn)化為機(jī)器可理解的語言來執(zhí)行預(yù)先選擇的機(jī)器學(xué)習(xí)算法。這樣,利用組織內(nèi)已有的專業(yè)知識,就能在很短的時間內(nèi)為企業(yè)構(gòu)建定制化的AI解決方案。

微軟研究人員正在探索如何將機(jī)器教學(xué)應(yīng)用于更復(fù)雜的任務(wù)題,比如對更長的文檔、電子郵件和圖像進(jìn)行分類;以及如何讓“教學(xué)”的過程更直觀,比如向用戶呈現(xiàn)可能有意義的特征建議。

微軟商業(yè)人工智能事業(yè)部副總裁Gurdeep Pall講解基于機(jī)器教學(xué)的自主系統(tǒng)解決方案

將機(jī)器教學(xué)與深度強(qiáng)化學(xué)習(xí)融合

十余年前,當(dāng)Hammond在耶魯大學(xué)神經(jīng)科學(xué)實驗室擔(dān)任系統(tǒng)程序員時,他注意到了科學(xué)家一步步訓(xùn)練動物完成研究任務(wù)的過程。他由此想到,我們?nèi)祟悡碛胸S富的專業(yè)經(jīng)驗,為什么不向機(jī)器傳授一些小訣竅呢?

因此他創(chuàng)辦了Bonsai公司,將機(jī)器教學(xué)與深度強(qiáng)化學(xué)習(xí)融合,幫助企業(yè)在機(jī)器人、制造、能源、建筑管理等領(lǐng)域開發(fā)自主系統(tǒng)。微軟在去年將Bonsai公司納入麾下。

深度強(qiáng)化學(xué)習(xí)模型通過基于激勵機(jī)制的反復(fù)試錯進(jìn)行學(xué)習(xí),目前在電子游戲中已經(jīng)能夠打敗人類。Hammond認(rèn)為,對于現(xiàn)實世界中更為復(fù)雜的應(yīng)用問題,深度強(qiáng)化學(xué)習(xí)還有很長的路要走,而機(jī)器教學(xué)方法與深度強(qiáng)化學(xué)習(xí)的結(jié)合則可以大大提高解決問題的效率。

開發(fā)者和其他領(lǐng)域的專業(yè)人士可以用Bonsai定制的編程語言Inkling將自己的專業(yè)知識“傳授”給AI,就像編寫課件一樣。通過對這些關(guān)鍵知識的學(xué)習(xí),Bonsai系統(tǒng)能更快地選出最好的強(qiáng)化學(xué)習(xí)模型,并在模擬環(huán)境中測試不同的操作,給出效果最優(yōu)的解決方案,從而避免許多耗時的無效探索。

在Hammond看來,人們從一開始就應(yīng)該告訴AI應(yīng)該著重關(guān)注哪些要點(diǎn),“如果只用強(qiáng)化學(xué)習(xí),不向它提供任何對解決問題有幫助的信息,它就會像無頭蒼蠅一樣隨意探索,很難發(fā)現(xiàn)行之有效的解決方案。所以機(jī)器教學(xué)非常重要,它能夠讓問題真正得以解決?!?/p>

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1789

    文章

    46397

    瀏覽量

    236607
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8325

    瀏覽量

    132207

原文標(biāo)題:機(jī)器教學(xué):用人類的專業(yè)知識與經(jīng)驗指導(dǎo)機(jī)器學(xué)習(xí)

文章出處:【微信號:aicapital,微信公眾號:全球人工智能】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    人工智能、機(jī)器學(xué)習(xí)和深度學(xué)習(xí)存在什么區(qū)別

    人工智能指的是在某種程度上顯示出類似人類智能的設(shè)備。AI有很多技術(shù),但其中一個很大的子集是機(jī)器學(xué)習(xí)——讓算法從數(shù)據(jù)中學(xué)習(xí)
    發(fā)表于 10-24 17:22 ?2373次閱讀
    人工智能、<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>和深度<b class='flag-5'>學(xué)習(xí)</b>存在什么區(qū)別

    【「時間序列與機(jī)器學(xué)習(xí)」閱讀體驗】時間序列的信息提取

    個重要環(huán)節(jié),目標(biāo)是從給定的時間序列數(shù)據(jù)中提取出有用的信息和特征,以支持后續(xù)的分析和預(yù)測任務(wù)。 特征工程(Feature Engineering)是將數(shù)據(jù)轉(zhuǎn)換為更好地表示潛在問題的特征,從而提高機(jī)器學(xué)習(xí)
    發(fā)表于 08-17 21:12

    【「時間序列與機(jī)器學(xué)習(xí)」閱讀體驗】+ 鳥瞰這本書

    的交織中不斷成長。 讀者對這本書的評價普遍很高。他們稱贊作者用通俗易懂的語言將復(fù)雜的概念解釋得透徹清晰,即使是初學(xué)者也能輕松入門。同時,書中豐富的案例和詳細(xì)的步驟指導(dǎo)也讓讀者快速積累經(jīng)驗,提高實戰(zhàn)技能。甚至有讀者表示,這本書已經(jīng)成為時間序列分析、
    發(fā)表于 08-12 11:28

    【「時間序列與機(jī)器學(xué)習(xí)」閱讀體驗】+ 簡單建議

    這本書以其系統(tǒng)性的框架和深入淺出的講解,為讀者繪制了一幅時間序列分析與機(jī)器學(xué)習(xí)融合應(yīng)用的宏偉藍(lán)圖。作者不僅扎實地構(gòu)建了時間序列分析的基礎(chǔ)知識,更巧妙地展示了機(jī)器
    發(fā)表于 08-12 11:21

    【《時間序列與機(jī)器學(xué)習(xí)》閱讀體驗】+ 了解時間序列

    收到《時間序列與機(jī)器學(xué)習(xí)》一書,彩色印刷,公式代碼清晰,非常精美。感謝作者,感謝電子發(fā)燒友提供了一個讓我學(xué)習(xí)時間序列及應(yīng)用的機(jī)會! 前言第一段描述了編寫背景: 由此可知,這是一本關(guān)于時間序列進(jìn)行大數(shù)
    發(fā)表于 08-11 17:55

    Al大模型機(jī)器

    豐富的知識儲備。它們可以涵蓋各種領(lǐng)域的知識,并能夠回答相關(guān)問題。靈活性與通用性: AI大模型機(jī)器人具有很強(qiáng)的靈活性和通用性,能夠處理各種類型的任務(wù)和問題。持續(xù)學(xué)習(xí)和改進(jìn): 這些模型可以
    發(fā)表于 07-05 08:52

    機(jī)器學(xué)習(xí)算法原理詳解

    機(jī)器學(xué)習(xí)作為人工智能的一個重要分支,其目標(biāo)是通過讓計算機(jī)自動從數(shù)據(jù)中學(xué)習(xí)并改進(jìn)其性能,而無需進(jìn)行明確的編程。本文將深入解讀幾種常見的機(jī)器學(xué)習(xí)
    的頭像 發(fā)表于 07-02 11:25 ?560次閱讀

    深度學(xué)習(xí)與傳統(tǒng)機(jī)器學(xué)習(xí)的對比

    在人工智能的浪潮中,機(jī)器學(xué)習(xí)和深度學(xué)習(xí)無疑是兩大核心驅(qū)動力。它們各自以其獨(dú)特的方式推動著技術(shù)的進(jìn)步,為眾多領(lǐng)域帶來了革命性的變化。然而,盡管它們都屬于機(jī)器
    的頭像 發(fā)表于 07-01 11:40 ?978次閱讀

    名單公布!【書籍評測活動NO.35】如何用「時間序列與機(jī)器學(xué)習(xí)」解鎖未來?

    專業(yè)知識,對這一領(lǐng)域進(jìn)行系統(tǒng)的梳理和總結(jié)。然而,將時間序列分析與機(jī)器學(xué)習(xí)技術(shù)相結(jié)合的書籍卻并不多見。 以上正是《時間序列與機(jī)器學(xué)習(xí)》這本“
    發(fā)表于 06-25 15:00

    請問PSoC? Creator IDE可以支持IMAGIMOB機(jī)器學(xué)習(xí)嗎?

    我的項目使用 POSC62 MCU 進(jìn)行開發(fā),由于 UDB 模塊是需求的重要組成部分,所以我選擇了PSoC? Creator IDE 來進(jìn)行項目開發(fā)。 但現(xiàn)在,由于需要擴(kuò)展,我不得不使用機(jī)器學(xué)習(xí)模塊
    發(fā)表于 05-20 08:06

    MR混合現(xiàn)實情景實訓(xùn)教學(xué)系統(tǒng)在軍事專業(yè)課堂上的應(yīng)用

    相結(jié)合,能夠創(chuàng)建出高度逼真、互動性強(qiáng)的教學(xué)環(huán)境。這種技術(shù)不僅可以呈現(xiàn)三維立體的教學(xué)場景,還能模擬各種實際作戰(zhàn)環(huán)境,使學(xué)生能夠身臨其境地體驗軍事專業(yè)知識和技能的實踐應(yīng)用。 MR混合現(xiàn)實在軍事專業(yè)
    的頭像 發(fā)表于 02-19 10:07 ?368次閱讀

    什么是機(jī)器學(xué)習(xí)?它的重要性體現(xiàn)在哪

    機(jī)器學(xué)習(xí)是一種人工智能(AI)的子領(lǐng)域,旨在使計算機(jī)系統(tǒng)通過經(jīng)驗自動學(xué)習(xí)和改進(jìn),而無需明確地進(jìn)行編程。它側(cè)重于開發(fā)算法和模型,使計算機(jī)能夠從數(shù)據(jù)中提取模式、進(jìn)行預(yù)測和做出決策,而無需顯
    的頭像 發(fā)表于 01-05 08:27 ?1266次閱讀
    什么是<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>?它的重要性體現(xiàn)在哪

    選對機(jī)器人集成商四個關(guān)鍵

    與具有專業(yè)知識經(jīng)驗豐富的機(jī)器人集成商合作,同時采用高性能的機(jī)器人和先進(jìn)的外圍設(shè)備,有助于制造企業(yè)更高效地實現(xiàn)機(jī)器人自動化。
    的頭像 發(fā)表于 12-20 11:18 ?813次閱讀

    德州儀器如何用“芯”助力客戶設(shè)計智能、安全的機(jī)器

    機(jī)器人的應(yīng)用范圍正在從工業(yè)領(lǐng)域拓展到千行百業(yè)。展望未來,機(jī)器人將繼續(xù)影響人類在工作、家庭和日常生活中的體驗。在德州儀器的機(jī)器人展區(qū),我們展示了德州儀器豐富的模擬和嵌入式處理產(chǎn)品、技術(shù)與
    的頭像 發(fā)表于 11-10 10:02 ?630次閱讀

    全面總結(jié)機(jī)器學(xué)習(xí)中的優(yōu)化算法

    幾乎所有的機(jī)器學(xué)習(xí)算法最后都?xì)w結(jié)為求一個目標(biāo)函數(shù)的極值,即最優(yōu)化問題,例如對于有監(jiān)督學(xué)習(xí),我們要找到一個最佳的映射函數(shù)f (x),使得對訓(xùn)練樣本的損失函數(shù)最小化(最小化經(jīng)驗風(fēng)險或結(jié)構(gòu)風(fēng)
    發(fā)表于 11-02 10:18 ?380次閱讀
    全面總結(jié)<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>中的優(yōu)化算法