0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

圖像分類中的一個常見問題

zhKF_jqr_AI ? 來源:未知 ? 作者:李倩 ? 2018-07-11 09:16 ? 次閱讀

編者按:本文作者Pete Warden是Jetpac公司的CTO,主要研究領域是數(shù)據(jù)科學和機器學習。在本文中,他結(jié)合自己的工作經(jīng)歷,發(fā)現(xiàn)了在圖像分類中的一個常見問題,即模型的不實用性。針對該問題他提出了自己的想法。以下是論智對原文的編譯。

幾天前,曾經(jīng)和我合作過的Plant Village團隊在開發(fā)一款移動APP時發(fā)現(xiàn),這款圖像識別器可以檢測植物病害,如下圖所示,性能不錯。

但是當攝像頭指向電腦鍵盤時,這款APP仍然認為它是被損壞的糧食。

計算機視覺研究者來說,這種結(jié)果并不罕見,但是對大多數(shù)人來說還是有些出乎意料的。所以本文將研究這種情況為什么會發(fā)生,以及我們應該如何應對。

人類可以準確分辨身邊的任何物體,所以我們自然就希望機器能擁有同樣的能力。但是大多數(shù)模型都只在非常有限的目標物體上進行了訓練,例如原始ImageNet競賽中只涵蓋了1000種物品類別。重要的是,訓練過程中假設模型所看到的每個樣本都是目標物體之一,而預測結(jié)果必須是已有種類中的一種。模型不能回答:“我不知道”,并且也沒有這樣的訓練數(shù)據(jù)讓它學會這種回答。事實上這是符合研究設置的,但是一旦應用到現(xiàn)實中就會出現(xiàn)問題。

當我在Jetpac工作時,想要說服客戶我們的產(chǎn)品——AlexNet是一項創(chuàng)新型產(chǎn)品都非常困難,因為每次我們把Demo給客戶看的時候,他們都會對著自己的臉,模型就會判斷這是“氧氣罩”或者“安全帶”這種奇怪的東西。這是因為在ImageNet競賽類別中沒有關于人臉的標簽,但是大多數(shù)關于面罩或安全帶的標簽都含有人臉。甚至當我們將手機對著盤子時,APP會將其認成“馬桶圈”,也是非常尷尬了。這是因為在原本的類別中沒有“盤子”,與圖片最相近的就是馬桶。

所以我不禁想到了“開放的世界”和“封閉的世界”的問題。模型在訓練和評估的時候通常都是假設面對的物體屬于有限的類別中,但是當它們走出實驗室,這種假設就不成立了,用戶們會根據(jù)隨機物體對它們的性能表現(xiàn)進行評價,不管該物體是不是訓練集中的。

所以這一問題應該如何解決呢?

不幸的是,目前還沒有一種簡單完美的解決方法,但是可以通過其他方案對這一問題稍稍改進。最直接的方法就是在訓練數(shù)據(jù)中加入“未知”一類,或者直接對具體物體開設新的分類。具體來說應該考慮以下幾個問題:

類別中應該包含怎樣的樣本?現(xiàn)實世界中有無數(shù)符合含有目標物體的圖片,你應該如何選擇?

在“未知”類別中還需要設立多少不同的物體種類?

當“未知物品”和已有類別很像時,應該怎么做?例如你想在ImageNet的1000個類別中加入一個狗狗的種類,但是它看起來和未知種類的狗狗很像。

未知種類中,各類樣本的訓練數(shù)據(jù)比例應該如何分配?

最后一點確實是個更重要的問題,從圖像分類網(wǎng)絡中得到的預測值并不是概率,它們假設看到任意特殊類別物體的概率和訓練數(shù)據(jù)中的類別相同。如果你將一種含有企鵝的動物分類器用在亞馬遜雨林中,你也會遇到同樣的問題。即使分類器有美國城市中常見的狗狗種類,稀有品種在ImageNet訓練數(shù)據(jù)中出現(xiàn)的次數(shù)也會比在狗狗公園中出現(xiàn)的頻率高。通常的解決方法是弄清楚你將在檢測過程中遇到的具體先驗概率是什么,然后用它們將校準值應用于網(wǎng)絡輸出,以獲得更接近真實概率的東西。

解決實際應用中此類問題的主要思想就是限制模型的使用場景,這樣對目標物體的預測假設就會匹配訓練數(shù)據(jù)。一種直接的方法是進行產(chǎn)品設計,你可以在用戶界面設計一個引導人們將設備對準目標物體后,再開啟運行分類器。

再復雜一點的話,你可以設計一個單獨的圖像分類器,試著確定主要圖像分類器沒有關注的條件。這和創(chuàng)建一個單獨的“未知”分類不同,因為它的作用主要類似于一個在詳細模型之前的過濾器。在開頭的植物病害問題上,操作環(huán)境非常明顯,可以很輕易地訓練模型辨別枝葉和其他照片。這和門控模型能判斷出圖像是否在不支持場景中拍攝非常相似。這個門控模型會在完整的圖像分類器之前運行,如果它沒有檢測到看起來像植物的東西,就會做出錯誤消息的提示,表明沒有找到植物。

那些讓你拍攝信用卡或者進行光學字符識別的應用經(jīng)常會將屏幕上方向指引和檢測是否有模糊或偏移的模型結(jié)合起來,引導用戶拍攝能成功識別的照片,有時會在交互頁面上添加簡單的問題,例如“這里有樹葉嗎”。

也許這篇文章不能提供一個令人滿意的答案,但是這也反映了,機器學習一旦走出了研究問題的限制,就很容易達不到用戶所期望的效果。人們對一個目標物體往往存在很多常識性理解和外界知識,而我們在傳統(tǒng)分類任務中并不能將這些因素考慮在內(nèi)。為了達到用戶希望看到的效果,我們必須設計一款能讓模型全面地了解世界的系統(tǒng),并基于該系統(tǒng)做出正確的決策,而不僅僅是輸出一個結(jié)果。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 分類器
    +關注

    關注

    0

    文章

    152

    瀏覽量

    13159
  • 圖像分類
    +關注

    關注

    0

    文章

    89

    瀏覽量

    11896
  • 機器學習
    +關注

    關注

    66

    文章

    8323

    瀏覽量

    132183

原文標題:當圖像分類器走出實驗室,碰到未知物體怎么辦?

文章出處:【微信號:jqr_AI,微信公眾號:論智】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關推薦

    90電氣技術(shù)常見問題及解答

    90電氣技術(shù)常見問題及解答
    的頭像 發(fā)表于 11-26 09:11 ?3.4w次閱讀

    Protel使用常見問題及解答

    Protel使用常見問題及解答
    發(fā)表于 04-14 09:27

    FPGA邏輯設計常見問題有哪些

    圖像采集系統(tǒng)的結(jié)構(gòu)及工作原理是什么FPGA邏輯設計常見問題有哪些
    發(fā)表于 04-29 06:18

    STM32串口的常見問題有哪些?

    STM32串口的常見問題有哪些?
    發(fā)表于 02-18 08:00

    Protel使用常見問題及解答

    Protel使用常見問題及解答 、如何將原理圖中的部分加到另
    發(fā)表于 07-02 12:08 ?743次閱讀

    分析RF電路設計常見問題

    分析RF電路設計常見問題,感興趣的小伙伴們可以瞧瞧。
    發(fā)表于 09-18 17:15 ?0次下載

    Protel使用常見問題及解答

    Protel使用常見問題及解答,下來看看。
    發(fā)表于 01-16 16:36 ?0次下載

    基于495C語言常見問題

    基于495C語言常見問題
    發(fā)表于 10-13 10:18 ?2次下載
    基于495<b class='flag-5'>個</b>C語言<b class='flag-5'>常見問題</b>集

    機器學習應用常見問題分類問題你了解多少

    分類問題是機器學習應用常見問題,而二分類問題是其中的典型,例如垃圾郵件的識別。本文基于UCI機器學習數(shù)據(jù)庫的銀行營銷數(shù)據(jù)集,從對數(shù)據(jù)集
    的頭像 發(fā)表于 03-29 16:40 ?1.5w次閱讀
    機器學習應用<b class='flag-5'>中</b>的<b class='flag-5'>常見問題</b><b class='flag-5'>分類</b>問題你了解多少

    電氣二次常見問題有哪些_40電氣二次常見問題盤點

    本文主要介紹的是電氣二次常見問題,首先介紹了電氣二次原理圖,其次盤點了40電氣二次常見問題,具體的跟隨小編起來了解下。
    發(fā)表于 05-31 16:51 ?5313次閱讀
    電氣二次<b class='flag-5'>常見問題</b>有哪些_40<b class='flag-5'>個</b>電氣二次<b class='flag-5'>常見問題</b>盤點

    labview有哪些常見問題?labview三常見問題和解決方法概述

    本文檔的主要內(nèi)容詳細介紹的是labview有哪些常見問題?labview三常見問題和解決方法概述三常見問題是:1.labview在運行后
    發(fā)表于 09-18 18:53 ?0次下載

    隔離信號和電源的4常見問題

    隔離信號和電源的4常見問題
    發(fā)表于 10-28 12:00 ?1次下載
    隔離信號和電源的4<b class='flag-5'>個</b><b class='flag-5'>常見問題</b>

    互聯(lián)車輛如何處理數(shù)據(jù):3常見問題

    互聯(lián)車輛如何處理數(shù)據(jù):3常見問題
    發(fā)表于 10-31 08:23 ?0次下載
    互聯(lián)車輛如何處理數(shù)據(jù):3<b class='flag-5'>個</b><b class='flag-5'>常見問題</b>

    伺服線束生產(chǎn)加工過程常見問題

    在上期的《伺服線束常見問題總結(jié)干貨》,我們詳細闡述了關于規(guī)格選型、工況環(huán)境、現(xiàn)場布線、生產(chǎn)加工和材料等五方面的
    的頭像 發(fā)表于 12-05 10:57 ?1389次閱讀

    PCB設計常見問題有哪些?

    站式PCBA智造廠家今天為大家講講PCB設計常見問題有哪些?PCB設計布局時容易出現(xiàn)的五大常見問題。在電子產(chǎn)品的開發(fā)過程,PCB(P
    的頭像 發(fā)表于 05-23 09:13 ?662次閱讀
    PCB設計<b class='flag-5'>中</b>的<b class='flag-5'>常見問題</b>有哪些?