0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

剛上崗就翻車?微軟AI編輯圖像識(shí)別出錯(cuò)

如意 ? 來源:百家號(hào) ? 作者:新華網(wǎng)客戶端 ? 2020-07-01 17:52 ? 次閱讀

目前階段的編輯工作完全依賴AI是不現(xiàn)實(shí)的,讓AI成為人類編輯的幫手似乎更切實(shí)可行。雙方協(xié)同起來,將使工作更加高效有質(zhì)量。

日前,微軟宣布6月底擬裁撤近80名外包編輯,由AI編輯負(fù)責(zé)接下來的MSN網(wǎng)站的新聞抓取、排版和配圖等工作。但沒想到,剛到崗沒多久,AI編輯就“翻車”了,而且犯了一個(gè)非常低級(jí)的錯(cuò)誤。AI編輯在尋找配圖的時(shí)候,把非裔歌手Leigh跟阿拉伯裔歌手Jade弄混了。

針對(duì)此次微軟AI的配圖錯(cuò)誤事件,Jade也在社交媒體上表達(dá)了不滿:“正常區(qū)分兩個(gè)不同膚色的人有那么難嗎?”為何一向以高識(shí)別率著稱的AI,這次卻“翻車”了?

解決臉盲問題需要不斷擴(kuò)大學(xué)習(xí)范圍

人臉識(shí)別技術(shù)是目前AI領(lǐng)域公認(rèn)的比較成熟的技術(shù),圈內(nèi)人士也熱衷像刷分一樣把人臉識(shí)別準(zhǔn)確率屢屢刷出新高,最高的號(hào)稱準(zhǔn)確率可達(dá)99.9%。人臉識(shí)別技術(shù)有如此輝煌的戰(zhàn)績,為何此次AI編輯還會(huì)臉盲呢?

“人臉識(shí)別技術(shù)的工作原理,主要是比對(duì)五官比例以及面部特征?!碧旖虼髮W(xué)智能與計(jì)算學(xué)部教授韓亞洪解釋,簡單說,就是基于人臉圖像的大數(shù)據(jù),先對(duì)看到的人臉圖像進(jìn)行預(yù)處理,提取面部各個(gè)方面的特征,并通過分層多次提取,尋找對(duì)于識(shí)別個(gè)體人臉最有效的特征表達(dá)。

人臉識(shí)別技術(shù)這些年已經(jīng)發(fā)生了重大的變化,傳統(tǒng)的人臉識(shí)別方法已經(jīng)被基于卷積神經(jīng)網(wǎng)絡(luò)深度學(xué)習(xí)方法替代。深度學(xué)習(xí)方法的主要優(yōu)勢是它們可通過大規(guī)模數(shù)據(jù)集進(jìn)行訓(xùn)練,從而學(xué)習(xí)到這些數(shù)據(jù)的最佳特征。

“雖然可以使用大規(guī)模數(shù)據(jù)集進(jìn)行訓(xùn)練,但是目前99.9%的準(zhǔn)確率,基本上是在一些基準(zhǔn)的數(shù)據(jù)集上測試的結(jié)果。這個(gè)數(shù)據(jù)集肯定是有范圍的,如果收集的數(shù)據(jù)是在數(shù)據(jù)集分布的范圍內(nèi),便可獲得比較高的準(zhǔn)確率。”韓亞洪說。

據(jù)了解,目前號(hào)稱人臉識(shí)別準(zhǔn)確率達(dá)到99%以上的,很多指的都是和全世界最權(quán)威的人臉數(shù)據(jù)庫LFW(Labeled Faces in the Wild)進(jìn)行比對(duì)測試的成績。LFW可以被認(rèn)作一個(gè)考查深度學(xué)習(xí)系統(tǒng)人臉識(shí)別能力的題庫。它從互聯(lián)網(wǎng)上提取6000張不同朝向、表情和光照環(huán)境的人臉照片作為考題,可以讓任何系統(tǒng)在里面“跑分”?!芭芊帧边^程是LFW給出一對(duì)照片,詢問測試系統(tǒng)兩張照片是不是同一個(gè)人,系統(tǒng)給出yes或no的答案。

“解決特定的臉盲問題并不難,其實(shí)就是重新針對(duì)任務(wù),收集這項(xiàng)任務(wù)領(lǐng)域內(nèi)的人臉圖像,在原有算法模型上訓(xùn)練,或者重新設(shè)計(jì)新的算法模型進(jìn)行訓(xùn)練,都會(huì)提高人臉識(shí)別率,以滿足實(shí)際應(yīng)用的需求?!表n亞洪說,但是超出了特定任務(wù),AI的“臉盲癥”就會(huì)復(fù)發(fā)。目前并沒有哪個(gè)通用的模型算法可以解決所有的任務(wù),但是AI可以通過不斷地調(diào)整,大量的學(xué)習(xí),從而提高人臉識(shí)別的準(zhǔn)確性。

新華社聯(lián)合搜狗在第五屆世界互聯(lián)網(wǎng)大會(huì)上發(fā)布全球首個(gè)合成新聞主播——“AI合成主播”,運(yùn)用最新人工智能技術(shù),“克隆”出與真人主播擁有同樣播報(bào)能力的“分身”。視覺中國供圖

深度神經(jīng)網(wǎng)絡(luò)模型是進(jìn)階的必要條件

“目前針對(duì)新聞文檔的分析和處理任務(wù),AI編輯做起來相對(duì)得心應(yīng)手?!表n亞洪介紹,具體地說,比如在一篇很長的報(bào)道中,讓AI編輯把重點(diǎn)摘出來,這是沒有問題的?,F(xiàn)在是多媒體時(shí)代,大量的新聞報(bào)道會(huì)涉及圖片和視頻,AI編輯可以將圖片或者視頻自動(dòng)提取出來,再從大篇幅的文字報(bào)道中,選取與之相匹配的文字說明,這個(gè)工作AI是可以比較準(zhǔn)確地做到的。

“解決特定領(lǐng)域的問題,AI大多時(shí)候還是沒問題的,但是要實(shí)現(xiàn)通用,就比較難了?!表n亞洪強(qiáng)調(diào),實(shí)現(xiàn)這些功能需要用到自然語言處理、模式識(shí)別、圖像視頻理解等領(lǐng)域的技術(shù)。

要培養(yǎng)一名AI編輯,首先需要收集大量的新聞報(bào)道和圖片視頻,再根據(jù)收集到的數(shù)據(jù)設(shè)計(jì)一個(gè)針對(duì)這個(gè)任務(wù)的深度神經(jīng)網(wǎng)絡(luò)模型,網(wǎng)絡(luò)模型里會(huì)有很多參數(shù),然后通過數(shù)據(jù)把參數(shù)訓(xùn)練出來,它就具備了最初設(shè)定的各種編輯能力了。在使用過程中,隨著AI編輯學(xué)習(xí)了更多的新聞,它的業(yè)務(wù)能力和性能也將不斷提升。

“不過目前的新聞生產(chǎn)對(duì)于AI編輯來說還很困難。”韓亞洪說,要讓AI學(xué)會(huì)寫新聞,必須要針對(duì)某個(gè)特定新聞主題,進(jìn)行大量資料搜集和模型訓(xùn)練。目前AI技術(shù)只能在風(fēng)格相對(duì)固定、詞匯量使用范圍較小的領(lǐng)域完成文本生成,比如天氣預(yù)報(bào)等內(nèi)容,AI可以很好地輸出相關(guān)報(bào)道和消息。但要生成人類創(chuàng)作的那種有創(chuàng)新要求、情感描述豐富的文章,AI編輯的能力仍有待進(jìn)一步提升。

協(xié)作將使新聞生產(chǎn)更加高效

“有趣的是,AI犯的錯(cuò)誤大多是我們意想不到的低級(jí)錯(cuò)誤,但在某些方面又強(qiáng)悍到讓人類望塵莫及?!表n亞洪舉例說,像給文章分類這種工作,人類編輯要進(jìn)行大量閱讀,重復(fù)性勞動(dòng)耗時(shí)耗力,速度非常慢。但這項(xiàng)工作AI編輯做起來就非常簡單了,通過文字—文檔的主題建模,AI可以比較準(zhǔn)確地對(duì)文章按主題進(jìn)行分類。另外,對(duì)于可以使用模板的短新聞,比如天氣預(yù)報(bào)、證券信息等,AI編輯可以準(zhǔn)確迅速地將各種數(shù)字或者專有名詞嵌套到模板中,從而完成一定的文檔生成任務(wù)。

美聯(lián)社曾使用AI系統(tǒng)自動(dòng)編發(fā)企業(yè)財(cái)報(bào)。AI系統(tǒng)對(duì)數(shù)據(jù)進(jìn)行自動(dòng)抓取,將其嵌套在美聯(lián)社預(yù)先設(shè)定的新聞模板中,幾秒鐘就能完成一篇150—300字的短消息,該系統(tǒng)每季度能產(chǎn)出約4000篇新聞,與之相比,美聯(lián)社的人工編輯們每季度只能完成400篇。

做這些特定的工作,AI編輯比人類厲害的地方不僅在于速度,準(zhǔn)確率也可圈可點(diǎn)?!跋穹诸惢蛘呤乔短啄0鍖懚滔⑦@類的工作,因?yàn)槿蝿?wù)明確,AI的準(zhǔn)確率還是非常高的,很少出現(xiàn)錯(cuò)別字或者數(shù)據(jù)錯(cuò)誤?!表n亞洪介紹。

在運(yùn)用大數(shù)據(jù)分析預(yù)測爆款方面,AI編輯可能比人類單純從經(jīng)驗(yàn)出發(fā)顯得更“科學(xué)”。2015年,《紐約時(shí)報(bào)》使用AI機(jī)器人對(duì)社交平臺(tái)中的文章進(jìn)行篩選和分析,預(yù)測哪部分內(nèi)容適合推廣。凡是由它自動(dòng)推薦的文章的點(diǎn)擊量都大大增加,甚至達(dá)到了普通文章的38倍。

“但在AI編輯的世界中,只有知道和不知道兩種狀態(tài),因此處理的內(nèi)容一旦超綱,它們就會(huì)立刻犯很多低級(jí)到可笑的錯(cuò)誤?!表n亞洪說,像這次AI編輯把非裔的Leigh跟阿拉伯裔的Jade弄混了的這樣的錯(cuò)誤,對(duì)于人類來說,即使沒見過Leigh ,但根據(jù)常識(shí),也不會(huì)把非洲裔和阿拉伯裔弄混。

“目前階段的編輯工作完全依賴AI是不現(xiàn)實(shí)的,讓AI成為人類編輯的幫手似乎更切實(shí)可行?!表n亞洪說。美聯(lián)社預(yù)測,AI介入媒體行業(yè)能夠幫助新聞工作者釋放20%左右的時(shí)間,讓后者可以將這部分時(shí)間更多地投入到內(nèi)容創(chuàng)作方面,簡單的事實(shí)核查與調(diào)研方面的工作交給AI,有利于提高新聞質(zhì)量。

“未來,人類應(yīng)該把AI編輯當(dāng)作合作伙伴,雙方協(xié)同起來,使工作更加高效有質(zhì)量?!表n亞洪說,人類不應(yīng)該覺得AI是來“搶飯碗”的,而應(yīng)該為有AI這樣的合作伙伴而感到幸運(yùn)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 微軟
    +關(guān)注

    關(guān)注

    4

    文章

    6537

    瀏覽量

    103818
  • 圖像識(shí)別
    +關(guān)注

    關(guān)注

    9

    文章

    516

    瀏覽量

    38194
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    29401

    瀏覽量

    267704
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    AI大模型在圖像識(shí)別中的優(yōu)勢

    AI大模型在圖像識(shí)別中展現(xiàn)出了顯著的優(yōu)勢,這些優(yōu)勢主要源于其強(qiáng)大的計(jì)算能力、深度學(xué)習(xí)算法以及大規(guī)模的數(shù)據(jù)處理能力。以下是對(duì)AI大模型在圖像識(shí)別中優(yōu)勢的介紹: 一、高效性與準(zhǔn)確性 處理速
    的頭像 發(fā)表于 10-23 15:01 ?125次閱讀

    圖像檢測和圖像識(shí)別的原理、方法及應(yīng)用場景

    圖像檢測和圖像識(shí)別是計(jì)算機(jī)視覺領(lǐng)域的兩個(gè)重要概念,它們在許多應(yīng)用場景中發(fā)揮著關(guān)鍵作用。 1. 定義 1.1 圖像檢測 圖像檢測(Object Detection)是指在
    的頭像 發(fā)表于 07-16 11:19 ?2359次閱讀

    圖像識(shí)別算法都有哪些方法

    圖像識(shí)別算法是計(jì)算機(jī)視覺領(lǐng)域的核心任務(wù)之一,它涉及到從圖像中提取特征并進(jìn)行分類、識(shí)別和分析的過程。隨著深度學(xué)習(xí)技術(shù)的不斷發(fā)展,圖像識(shí)別算法已經(jīng)取得了顯著的進(jìn)展。本文將介紹
    的頭像 發(fā)表于 07-16 11:14 ?4606次閱讀

    圖像識(shí)別算法的提升有哪些

    引言 圖像識(shí)別是計(jì)算機(jī)視覺領(lǐng)域的核心任務(wù)之一,旨在使計(jì)算機(jī)能夠自動(dòng)地識(shí)別和理解圖像中的內(nèi)容。隨著計(jì)算機(jī)硬件的發(fā)展和深度學(xué)習(xí)技術(shù)的突破,圖像識(shí)別算法的性能得到了顯著提升。本文將介紹
    的頭像 發(fā)表于 07-16 11:12 ?505次閱讀

    圖像識(shí)別算法的優(yōu)缺點(diǎn)有哪些

    圖像識(shí)別算法是一種利用計(jì)算機(jī)視覺技術(shù)對(duì)圖像進(jìn)行分析和理解的方法,它在許多領(lǐng)域都有廣泛的應(yīng)用,如自動(dòng)駕駛、醫(yī)療診斷、安全監(jiān)控等。然而,圖像識(shí)別算法也存在一些優(yōu)缺點(diǎn)。 一、圖像識(shí)別算法的優(yōu)
    的頭像 發(fā)表于 07-16 11:09 ?1007次閱讀

    圖像識(shí)別算法的核心技術(shù)是什么

    圖像識(shí)別算法是計(jì)算機(jī)視覺領(lǐng)域的一個(gè)重要研究方向,其目標(biāo)是使計(jì)算機(jī)能夠像人類一樣理解和識(shí)別圖像中的內(nèi)容。圖像識(shí)別算法的核心技術(shù)包括以下幾個(gè)方面: 特征提取 特征提取是
    的頭像 發(fā)表于 07-16 11:02 ?462次閱讀

    圖像識(shí)別技術(shù)包括自然語言處理嗎

    圖像識(shí)別技術(shù)與自然語言處理是人工智能領(lǐng)域的兩個(gè)重要分支,它們在很多方面有著密切的聯(lián)系,但也存在一些區(qū)別。 一、圖像識(shí)別技術(shù)與自然語言處理的關(guān)系 1.1 圖像識(shí)別技術(shù)的定義 圖像識(shí)別技術(shù)
    的頭像 發(fā)表于 07-16 10:54 ?508次閱讀

    圖像識(shí)別技術(shù)在醫(yī)療領(lǐng)域的應(yīng)用

    一、引言 圖像識(shí)別技術(shù)是一種利用計(jì)算機(jī)視覺技術(shù)對(duì)圖像進(jìn)行分析和處理的技術(shù)。隨著計(jì)算機(jī)技術(shù)、人工智能技術(shù)、大數(shù)據(jù)技術(shù)等的發(fā)展,圖像識(shí)別技術(shù)在各個(gè)領(lǐng)域的應(yīng)用越來越廣泛。在醫(yī)療領(lǐng)域,圖像識(shí)別
    的頭像 發(fā)表于 07-16 10:48 ?509次閱讀

    圖像識(shí)別技術(shù)的原理是什么

    圖像識(shí)別技術(shù)是一種利用計(jì)算機(jī)視覺和機(jī)器學(xué)習(xí)技術(shù)對(duì)圖像進(jìn)行分析和理解的技術(shù)。它可以幫助計(jì)算機(jī)識(shí)別和理解圖像中的對(duì)象、場景和活動(dòng)。 圖像預(yù)處理
    的頭像 發(fā)表于 07-16 10:46 ?735次閱讀

    圖像識(shí)別屬于人工智能嗎

    屬于。圖像識(shí)別是人工智能(Artificial Intelligence, AI)領(lǐng)域的一個(gè)重要分支。 一、圖像識(shí)別概述 1.1 定義 圖像識(shí)別是指利用計(jì)算機(jī)技術(shù)對(duì)
    的頭像 發(fā)表于 07-16 10:44 ?749次閱讀

    如何利用CNN實(shí)現(xiàn)圖像識(shí)別

    卷積神經(jīng)網(wǎng)絡(luò)(CNN)是深度學(xué)習(xí)領(lǐng)域中一種特別適用于圖像識(shí)別任務(wù)的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。它通過模擬人類視覺系統(tǒng)的處理方式,利用卷積、池化等操作,自動(dòng)提取圖像中的特征,進(jìn)而實(shí)現(xiàn)高效的圖像識(shí)別。本文將從CNN的基本原理、構(gòu)建過程、訓(xùn)練策略以
    的頭像 發(fā)表于 07-03 16:16 ?811次閱讀

    神經(jīng)網(wǎng)絡(luò)在圖像識(shí)別中的應(yīng)用

    隨著人工智能技術(shù)的飛速發(fā)展,神經(jīng)網(wǎng)絡(luò)在圖像識(shí)別領(lǐng)域的應(yīng)用日益廣泛。神經(jīng)網(wǎng)絡(luò)以其強(qiáng)大的特征提取和分類能力,為圖像識(shí)別帶來了革命性的進(jìn)步。本文將詳細(xì)介紹神經(jīng)網(wǎng)絡(luò)在圖像識(shí)別中的應(yīng)用案例,包括卷積神經(jīng)網(wǎng)絡(luò)(CNN)在面部
    的頭像 發(fā)表于 07-01 14:19 ?532次閱讀

    圖像識(shí)別技術(shù)原理 圖像識(shí)別技術(shù)的應(yīng)用領(lǐng)域

    圖像識(shí)別技術(shù)是一種通過計(jì)算機(jī)對(duì)圖像進(jìn)行分析和理解的技術(shù)。它借助計(jì)算機(jī)視覺、模式識(shí)別、人工智能等相關(guān)技術(shù),通過對(duì)圖像進(jìn)行特征提取和匹配,找出圖像
    的頭像 發(fā)表于 02-02 11:01 ?2075次閱讀

    基于TensorFlow和Keras的圖像識(shí)別

    TensorFlow和Keras最常見的用途之一是圖像識(shí)別/分類。通過本文,您將了解如何使用Keras達(dá)到這一目的。定義如果您不了解圖像識(shí)別的基本概念,將很難完全理解本文的內(nèi)容。因此在正文開始之前
    的頭像 發(fā)表于 01-13 08:27 ?732次閱讀
    基于TensorFlow和Keras的<b class='flag-5'>圖像識(shí)別</b>

    如何使用Python進(jìn)行圖像識(shí)別的自動(dòng)學(xué)習(xí)自動(dòng)訓(xùn)練?

    如何使用Python進(jìn)行圖像識(shí)別的自動(dòng)學(xué)習(xí)自動(dòng)訓(xùn)練? 使用Python進(jìn)行圖像識(shí)別的自動(dòng)學(xué)習(xí)和自動(dòng)訓(xùn)練需要掌握一些重要的概念和技術(shù)。在本文中,我們將介紹如何使用Python中的一些常用庫和算法來實(shí)現(xiàn)
    的頭像 發(fā)表于 01-12 16:06 ?502次閱讀