0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

關于AI算法能否對不同年齡、性別和膚色的人一視同仁的詳細解答

IEEE電氣電子工程師 ? 來源:賢集網 ? 作者:電氣傳播 ? 2021-04-25 11:06 ? 次閱讀

Facebook研究人員發(fā)布了一個數(shù)據集,旨在幫助機器學習開發(fā)人員測試算法的偏差。

即使在不同的光照條件下,算法是否能夠對不同年齡、性別和膚色的人一視同仁呢?Facebook的AI Red團隊近日發(fā)布了一個名為“Casual Conversations”的數(shù)據集,用于回答這個問題。10兆字節(jié)的數(shù)據由3011名參與者錄制的視頻組成;數(shù)據集由每人約15個1分鐘片段組成,總時長超過45000分鐘。視頻分別被標記出年齡和性別,由每個參與者自我報告,膚色由訓練有素的注解者使用標準比例確定,以及照明條件,也由注解者確定。

Facebook AI Red團隊的研究經理Cristian Canton給了我一個簡單的例子,說明了開發(fā)人員是如何使用數(shù)據集的。

“考慮門戶(Portal)設備,”他說。(門戶是Facebook價值150美元的桌面智能屏幕。)“我們有一個攝像頭,可以跟蹤人們。如果我現(xiàn)在是工程師來構建這項技術,為了確保它的包容性,我可以獲取臨時會話數(shù)據集,通過門戶中的跟蹤算法來運行它,并測量它在哪些地方表現(xiàn)不好。比如說,你可能會發(fā)現(xiàn),對于一個特定年齡、膚色或性別的人來說,在昏暗的光線下,這是行不通的。然后我就會知道我的算法對于特定的子組有缺陷。”

Facebook的研究人員在去年的Deepfake Detection Challenge(一項旨在開發(fā)自動識別欺詐媒體工具的競賽)的前五名獲獎者身上測試了該數(shù)據集。

在近日發(fā)布的一篇研究論文和博客文章中,他們報告說,雖然所有五種算法都在與較暗的膚色作斗爭,但在年齡、性別和光照條件等方面表現(xiàn)最為一致的模型并不是第一名得主Selim Seferbekov,而是排名第三的團隊NTechLab。有趣的是,排名第四的18歲的研究小組最擅長分析的是年齡在45歲以上的年齡組中的受試者的視頻。

在不同的人群中表現(xiàn)平平,并不是Deep Fake Challenge的評判標準之一,因為還沒有完整的非正式對話數(shù)據集。

Said Canton說:“如果我們今天重新開始比賽,也許我們會考慮尋找一個更具包容性的方法。”

Canton說,近日發(fā)布的Casual Conversations數(shù)據集只是創(chuàng)造人工智能公平所需工作的開始。首先,他指出,這個問題是多方面的,雖然有這樣的數(shù)據是有幫助的,但這并不是最終的解決辦法。

Image: FacebookThese pie charts show the frequency of the different tags for age, gender, apparent skin tone, and lighting conditions in the 45,186 videos that make up the Casual Conversations data set.

至于數(shù)據集開發(fā)本身,他說,該團隊還只是在“漫長旅程的第一步”。我們已經確定了年齡、性別、膚色和光照條件,但(這些視頻)都是在美國錄制的。如果我們在其他國家錄制,我們可能會發(fā)現(xiàn)更多我們需要考慮且尚未看到的多樣性?!?/p>

Canton指出,錄音的音頻部分也代表了尚未開發(fā)的潛力。這些音頻文件是通過要求受試者回答簡單的對話提示(如“你最喜歡的菜是什么”)而創(chuàng)建的,目前只針對年齡和性別進行標記。“我們還沒有對口音進行注釋,但這是未來可實現(xiàn)的一個潛在途徑。我們確實認為這篇文章可以有一些有趣的結果。不過,我們要測試音頻模型的包容性。”

Canton希望,將這些數(shù)據公之于眾將引發(fā)反饋,從而使數(shù)據集更豐富、更具包容性?!拔液芟M吹剿玫讲捎茫缓笞屛业耐潞蛯W者告訴我們更多他們的想法。我們希望進行自我批評。有了反饋,我們可以不斷改進它。我們希望它成為衡量人工智能公平性的標準方式?!?/p>

Canton還希望這個數(shù)據集的發(fā)展能夠樹立一個新的標準。他對這個數(shù)據集的創(chuàng)建方式感到自豪,包括它是可信來源。他在我們的談話中多次強調,3000多名受試者的付出是有報酬的,并且他們了解自己的聲音和視頻圖像是如何被使用的,如果他們改變了參與的想法,以后可以退出。

他說:“我們正試圖為負責任的人工智能在未來的樣子設定一個標準,”他補充說,F(xiàn)acebook團隊希望“激勵更多的人記錄擴充數(shù)據集。重要的是要做正確的事情 -- 通過使用正確的工具。”
編輯:lyn

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • Facebook
    +關注

    關注

    3

    文章

    1429

    瀏覽量

    54587
  • 機器學習
    +關注

    關注

    66

    文章

    8325

    瀏覽量

    132194
  • 數(shù)據集
    +關注

    關注

    4

    文章

    1199

    瀏覽量

    24594
  • AI算法
    +關注

    關注

    0

    文章

    245

    瀏覽量

    12210

原文標題:人工智能算法對年齡、性別和膚色一視同仁嗎?

文章出處:【微信號:IEEE_China,微信公眾號:IEEE電氣電子工程師】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    AI for Science:人工智能驅動科學創(chuàng)新》第4章-AI與生命科學讀后感

    很幸運社區(qū)給我個閱讀此書的機會,感謝平臺。 《AI for Science:人工智能驅動科學創(chuàng)新》第4章關于AI與生命科學的部分,為我們揭示了人工智能技術在生命科學領域中的廣泛應用和
    發(fā)表于 10-14 09:21

    AI for Science:人工智能驅動科學創(chuàng)新》第二章AI for Science的技術支撐學習心得

    非常高興本周末收到本新書,也非常感謝平臺提供閱讀機會。 這是本挺好的書,包裝精美,內容詳實,干活滿滿。 關于AI for Science:人工智能驅動科學創(chuàng)新》第二章“
    發(fā)表于 10-14 09:16

    HarmonyOS NEXT應用元服務開發(fā)Accessibility(信息無障礙)介紹

    Accessibility(信息無障礙),是指任何人在任何情況下都能平等、方便地獲取信息并利用信息。其目的是縮小全社會不同階層、不同地區(qū)、不同年齡、不同健康狀況的人群在信息理解、信息交互、信息利用
    發(fā)表于 10-09 10:29

    關于UCC25640x LLC諧振控制器的常見問題解答

    電子發(fā)燒友網站提供《關于UCC25640x LLC諧振控制器的常見問題解答.pdf》資料免費下載
    發(fā)表于 09-04 09:37 ?0次下載
    <b class='flag-5'>關于</b>UCC25640x LLC諧振控制器的常見問題<b class='flag-5'>解答</b>

    嵌入式軟件開發(fā)與AI整合

    嵌入式軟件開發(fā)與AI整合是當前技術發(fā)展的重要趨勢之。隨著人工智能技術的快速發(fā)展,嵌入式系統(tǒng)越來越多地集成了AI算法,以實現(xiàn)更復雜的智能功能。以下是
    的頭像 發(fā)表于 07-31 09:25 ?575次閱讀
    嵌入式軟件開發(fā)與<b class='flag-5'>AI</b>整合

    平衡創(chuàng)新與倫理:AI時代的隱私保護和算法公平

    成了把雙刃劍,其銳利的面正逐漸指向我們的核心價值。面對這些挑戰(zhàn),制定套有效的AI治理框架和隱私保護機制變得迫在眉睫。 確保AI決策
    發(fā)表于 07-16 15:07

    ai大模型和算法有什么區(qū)別

    AI大模型和算法是人工智能領域的兩個重要概念,它們在很多方面有著密切的聯(lián)系,但同時也存在些明顯的區(qū)別。 定義和概念 AI大模型通常是指具有大量參數(shù)和復雜結構
    的頭像 發(fā)表于 07-16 10:09 ?1225次閱讀

    中偉視界:實時監(jiān)控與預警,礦山罐籠超員AI算法如何保障礦工生命安全?

    隨著礦山智能化的發(fā)展,罐籠超員AI算法在礦山安全管理中發(fā)揮著關鍵作用。本文詳細介紹了罐籠超員AI算法的工作原理、技術實現(xiàn)和應用效果,并展望了
    的頭像 發(fā)表于 07-12 08:54 ?233次閱讀

    傳音推進多膚色影像技術創(chuàng)新,提供更多元的真實膚色影像成像體驗

    本地市場消費者的影像成像核心訴求,傳音研發(fā)了領先的多膚色影像技術,這項技術能兼容多區(qū)域多膚色類型用戶,拍照效果受本地文化因素影響的差異化需求,最重要的是膚色成像準確性及包容性,成功開啟了
    的頭像 發(fā)表于 06-19 17:17 ?363次閱讀

    求助,關于ESP32多核使用問題求解答

    關于esp32的多核使用,除了使用xTaskCreatePinnedToCore函數(shù)來控制線程跑的核心外能否有其他的實現(xiàn)比如: 現(xiàn)在有兩個bin文件,每個核心同時跑不同的bin文件,這種是否能夠實現(xiàn)。
    發(fā)表于 06-17 06:28

    加碼多膚色影像技術 這是傳音找到的“出海利器“?

    全球化時代,市場競爭愈演愈烈,產品差異化已然成為了企業(yè)脫穎而出的關鍵。在黃、白膚色長期占據人像攝影主賽道的背景下,傳音就憑借獨無二的多膚色影像技術走出非洲,走向了更廣闊的新興市場。 ? 聚焦深
    的頭像 發(fā)表于 06-13 16:43 ?364次閱讀

    NanoEdge AI的技術原理、應用場景及優(yōu)勢

    NanoEdge AI種基于邊緣計算的人工智能技術,旨在將人工智能算法應用于物聯(lián)網(IoT)設備和傳感器。這種技術的核心思想是將數(shù)據處理和分析從云端轉移到設備本身,從而減少數(shù)據傳
    發(fā)表于 03-12 08:09

    各位技術大佬,請問下通信距離能否人為控制呢?

    請問各位論壇技術專家們個問題,短距離無線通信能否控制距離呢?比如設置或者做到僅在半米/米/50米.....之內做通信的效果呢?就拿半米這個距離限定舉例,能否僅在半米內通訊,范圍以外
    發(fā)表于 01-07 13:47

    關于400G光模塊的常見問題解答

    最近在后臺收到了很多用戶咨詢關于400G光模塊的信息,那400G光模塊作為當下主流的光模塊類型,有哪些問題是備受關注的呢?下面來看看小易的詳細解答!
    的頭像 發(fā)表于 11-16 17:07 ?692次閱讀
    <b class='flag-5'>關于</b>400G光模塊的常見問題<b class='flag-5'>解答</b>

    什么是邊緣計算盒子(AI算法盒子)?

    邊緣計算盒子是種基于邊緣計算和人工智能技術的智能設備,它內置了靈活可配的多樣化AI算法庫,所以也被稱為AI算法盒子或智能邊緣分析
    的頭像 發(fā)表于 10-31 14:29 ?2443次閱讀
    什么是邊緣計算盒子(<b class='flag-5'>AI</b><b class='flag-5'>算法</b>盒子)?