0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Open Images Extended合集中引入了更具包容性的人物注釋MIAP數(shù)據(jù)集

硬件三人行 ? 來(lái)源:TensorFlow ? 作者:TensorFlow ? 2021-08-16 17:20 ? 次閱讀

發(fā)布人:Google Research 軟件工程師 Candice Schumann 和 Susanna Ricco

2016 年,我們推出了 Open Images。此協(xié)作版本包含約 900 萬(wàn)張含有標(biāo)簽的圖像,涵蓋數(shù)千個(gè)對(duì)象類別和 600 個(gè)類的邊界框注釋。從那之后,我們進(jìn)行了多次更新,如將眾包數(shù)據(jù)發(fā)布到 Open Images Extended 合集,以此提高對(duì)象注釋的多樣性。

更新

https://ai.googleblog.com/2019/05/announcing-open-images-v5-and-iccv-2019.html

Open Images Extended

https://storage.googleapis.com/openimages/web/extended.html

雖然這些數(shù)據(jù)集提供的標(biāo)簽擴(kuò)展性很強(qiáng),但此類標(biāo)簽并沒(méi)有關(guān)注人物的敏感屬性,這些屬性對(duì)于許多機(jī)器學(xué)習(xí) (ML) 公平性任務(wù)(例如公平性評(píng)估和偏見(jiàn)緩解)至關(guān)重要。事實(shí)上,找到包含徹底標(biāo)記此類敏感屬性的數(shù)據(jù)集是很困難的,尤其是在計(jì)算機(jī)視覺(jué)領(lǐng)域。

公平性任務(wù)

https://developers.google.com/machine-learning/crash-course/fairness/video-lecture

今天,我們?cè)?Open Images Extended 合集中引入了更具包容性的人物注釋 (MIAP) 數(shù)據(jù)集。此合集包含更多完整的邊界框注釋,用于包含 10 萬(wàn)張人物圖像中的的人物類層級(jí)結(jié)構(gòu)。每個(gè)注釋還帶有可感知到的性別呈現(xiàn)和年齡范圍等公平相關(guān)屬性的標(biāo)簽。作為 Responsible AI 研究的一部分,越來(lái)越多的人開始關(guān)注如何減少不公平偏見(jiàn),我們希望這些注釋能夠激勵(lì)已經(jīng)在使用 Open Images 的研究者,將公平分析納入他們的研究中。

Responsible AI 研究

https://ai.google/principles/

交叉描述通過(guò)為現(xiàn)有圖像-描述對(duì)和輔助描述添加語(yǔ)義相似度人工評(píng)分來(lái)擴(kuò)展 MS-COCO 評(píng)估集(實(shí)線),并通過(guò)為新的圖像-描述、描述-描述和圖像-圖像對(duì)添加人工評(píng)分來(lái)提高評(píng)分密度(虛線)*

Open Images 中的注釋

原始 Open Images 數(shù)據(jù)集中的每個(gè)圖像都包含圖像級(jí)注釋(寬泛地描述圖像)和包圍特定對(duì)象的邊界框。為了避免對(duì)同一個(gè)對(duì)象繪制多個(gè)邊界框,我們從標(biāo)簽候選集中臨時(shí)刪減了具體性較弱的類,我們將這一過(guò)程稱為層級(jí)去重。舉個(gè)例子,若一個(gè)圖像的標(biāo)簽包括動(dòng)物、 貓,和洗衣機(jī)則該圖像的注釋邊界框?yàn)樨埡拖匆聶C(jī),而不會(huì)注釋多余的類 ——?jiǎng)游铩?/p>

圖像級(jí)注釋

https://cloud.google.com/vision/docs/labels

邊界框

https://cloud.google.com/vision/docs/object-localizer

MIAP 數(shù)據(jù)集可用于原始 Open Images 數(shù)據(jù),集中人物 層級(jí)包含的五個(gè)類:人物、男人、女人、男孩、女孩。由于這些標(biāo)簽的存在,Open Images 數(shù)據(jù)集對(duì)于推進(jìn) Responsible AI 的研究具有獨(dú)特的價(jià)值,能夠幫助開發(fā)者訓(xùn)練通用的人物檢測(cè)器,訪問(wèn)性別和年齡范圍特定的標(biāo)簽,以實(shí)現(xiàn)公平分析和偏見(jiàn)緩解。

Responsible AI

https://ai.google/responsibilities/responsible-ai-practices/

人物檢測(cè)器

https://cloud.google.com/video-intelligence/docs/people-detection

然而,我們發(fā)現(xiàn)結(jié)合了層級(jí)去重和女人/女孩與男人/男孩之間的社會(huì)性區(qū)別后,原始注釋會(huì)受到限制。舉個(gè)例子,如果要求注釋器針對(duì)女孩這一分類繪制邊界框,它們便不會(huì)在圖像中的男孩周圍繪制邊界框。注釋器可能會(huì)也可能不會(huì)在某位女性周圍繪制邊界框,這取決于其對(duì)個(gè)人年齡的評(píng)估以及對(duì)女孩這一概念的文化性理解。此類判斷在不同圖像中可能會(huì)存在不一致,這取決于單獨(dú)的注釋器的文化背景、圖像人物的外表和場(chǎng)景的上下文。因此,某些圖像中的邊界框注釋會(huì)不完整,一些較為顯眼的人物沒(méi)有得到注釋。

MIAP 中的注釋

新的 MIAP 注釋旨在解決這些限制,實(shí)現(xiàn)讓 Open Images 成為推動(dòng)機(jī)器學(xué)習(xí)公平性研究取得新進(jìn)展的數(shù)據(jù)集的保障。我們不要求注釋器為層級(jí)結(jié)構(gòu)中最具體的類(例如,女孩)繪制邊界框,而是將此程序反過(guò)來(lái),要求它們?yōu)樾詣e和年齡未知的人物分類繪制邊界框。

所有人物邊界框?qū)脮r(shí)都將獲得感知到的性別呈現(xiàn)(很大可能是女性、很大可能是男性,或未知)以及年齡呈現(xiàn)(青年、中年、老年,或未知)等標(biāo)簽。我們認(rèn)識(shí)到性別不是二元的,個(gè)人的性別認(rèn)同可能與其感知或預(yù)期的性別呈現(xiàn)不符,為了緩解無(wú)意識(shí)偏見(jiàn)對(duì)注釋的影響,這里提示:注釋器,與性別呈現(xiàn)相關(guān)的規(guī)范因文化而異,且會(huì)隨時(shí)間的推移而變化。

這個(gè)過(guò)程添加了大量先前丟失的邊界框。

在包含人物的 10 萬(wàn)張圖像中,人物邊界框的數(shù)量從 35.8 萬(wàn)左右增加到 45.4 萬(wàn)左右。各個(gè)感知性別呈現(xiàn)和感知年齡呈現(xiàn)的邊界框數(shù)量持續(xù)增加。這些新注釋為人物檢測(cè)器的訓(xùn)練提供了更完整的基本事實(shí),并提供了更準(zhǔn)確的子組標(biāo)簽,以將公平性納入計(jì)算機(jī)視覺(jué)研究。

預(yù)期用例

我們?yōu)槿宋镞吔缈虻母兄挲g范圍和性別呈現(xiàn)納入了注釋,因?yàn)槲覀冋J(rèn)為有必要添加此類注釋,以便提高能力,實(shí)現(xiàn)更好的理解以及努力緩解并消除圖像理解領(lǐng)域,受保護(hù)子組之間的不公平偏見(jiàn)或不同性能。

我們注意到,標(biāo)簽捕獲的性別和年齡范圍是第三方僅根據(jù)視覺(jué)線索,而不是個(gè)人的自我認(rèn)知性別或?qū)嶋H年齡評(píng)估出來(lái)的。我們不支持也不容忍構(gòu)建或部署根據(jù)這些注釋訓(xùn)練的性別或年齡呈現(xiàn)分類器,因?yàn)槲覀冋J(rèn)為在公平性研究之外使用這些技術(shù)的相關(guān)風(fēng)險(xiǎn)大于任何潛在好處。

風(fēng)險(xiǎn)

https://dl.acm.org/doi/10.1145/3173574.3173582

致謝

這項(xiàng)研究背后的核心團(tuán)隊(duì)成員包括 Utsav Prabhu、Vittorio Ferrari 和 Caroline Pantofaru。同時(shí),我們還要感謝 Alex Hanna、Reena Jana、Alina Kuznetsova、Matteo Malloci、Stefano Pellegrini、Jordi Pont-Tuset 和 Mahima Pushkarna 對(duì)本項(xiàng)目的貢獻(xiàn)。

編輯:jq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    29397

    瀏覽量

    267691
  • 計(jì)算機(jī)視覺(jué)

    關(guān)注

    8

    文章

    1690

    瀏覽量

    45875
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8323

    瀏覽量

    132177
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1199

    瀏覽量

    24592

原文標(biāo)題:最新進(jìn)展:將包容性人物注釋納入 Open Image Extended 數(shù)據(jù)集

文章出處:【微信號(hào):yingjiansanrenxing,微信公眾號(hào):硬件三人行】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    TIDP.SAA接口怎么實(shí)現(xiàn)I2C Read Extended功能?

    我想要支持I2C Read Extended功能,如上圖所示,讀出00FF數(shù)據(jù),但是接口代碼中的I2C_Read_Generic和 Read_Extended_Word并不能和TI的軟件一樣支持讀出
    發(fā)表于 09-27 06:33

    求助,為什么噪聲很小的信號(hào)通過(guò)一階有源低通濾波器后反而引入了高頻噪聲?

    為什么噪聲很小的信號(hào)通過(guò)一階有源低通濾波器后反而引入了高頻噪聲?(信號(hào)從左邊輸入先經(jīng)放大后再濾波,放大后的信號(hào)還是噪聲非常小的)
    發(fā)表于 09-10 08:02

    PyTorch如何訓(xùn)練自己的數(shù)據(jù)

    PyTorch是一個(gè)廣泛使用的深度學(xué)習(xí)框架,它以其靈活性、易用和強(qiáng)大的動(dòng)態(tài)圖特性而聞名。在訓(xùn)練深度學(xué)習(xí)模型時(shí),數(shù)據(jù)是不可或缺的組成部分。然而,很多時(shí)候,我們可能需要使用自己的數(shù)據(jù)
    的頭像 發(fā)表于 07-02 14:09 ?975次閱讀

    超級(jí)電容器在集中器中的應(yīng)用

    單元)和下部多個(gè)終端或儀表。它負(fù)責(zé)管理整個(gè)系統(tǒng)、收集和存儲(chǔ)所有數(shù)據(jù)以及管理上層和下層之間的通信通道。集中器在電力系統(tǒng)有著重要作用,所以自身的可靠也尤為重要,除了設(shè)備的本身質(zhì)量以外,備用電源的選擇也是
    發(fā)表于 01-15 16:51

    語(yǔ)音數(shù)據(jù):推動(dòng)智能語(yǔ)音技術(shù)發(fā)展的關(guān)鍵驅(qū)動(dòng)力

    發(fā)展方向。 一、語(yǔ)音數(shù)據(jù)的重要 語(yǔ)音數(shù)據(jù)是智能語(yǔ)音技術(shù)的基石,它提供了大量的語(yǔ)音樣本和對(duì)應(yīng)的標(biāo)簽,用于訓(xùn)練和評(píng)估語(yǔ)音模型。通過(guò)語(yǔ)音
    的頭像 發(fā)表于 12-28 13:46 ?464次閱讀

    做項(xiàng)目沒(méi)靈感?一起來(lái)看看Build2gether包容性創(chuàng)新挑戰(zhàn)賽的創(chuàng)意吧!

    Build2gether包容性創(chuàng)新挑戰(zhàn)賽近日,由歐洲頂級(jí)大學(xué)ETHZurich主辦、全球知名硬件社區(qū)Hackster.io承辦的Build2gether包容性創(chuàng)新挑戰(zhàn)賽圓滿結(jié)束。本次
    的頭像 發(fā)表于 12-23 08:29 ?391次閱讀
    做項(xiàng)目沒(méi)靈感?一起來(lái)看看Build2gether<b class='flag-5'>包容性</b>創(chuàng)新挑戰(zhàn)賽的創(chuàng)意吧!

    語(yǔ)音數(shù)據(jù):AI語(yǔ)音技術(shù)的靈魂

    一、引言 在人工智能領(lǐng)域,語(yǔ)音技術(shù)被譽(yù)為“未來(lái)人機(jī)交互的入口”,而語(yǔ)音數(shù)據(jù)則是AI語(yǔ)音技術(shù)的靈魂。本文將深入探討語(yǔ)音數(shù)據(jù)的重要、構(gòu)建方
    的頭像 發(fā)表于 12-14 14:33 ?900次閱讀

    大模型數(shù)據(jù):力量的源泉,進(jìn)步的階梯

    的舞臺(tái) 大模型數(shù)據(jù)如廣袤的舞臺(tái),為AI技術(shù)的展現(xiàn)提供了廣闊的空間。這些數(shù)據(jù)規(guī)模龐大,包容萬(wàn)象,它們是AI進(jìn)步的基石。無(wú)論是自然語(yǔ)言處理、
    的頭像 發(fā)表于 12-07 17:18 ?583次閱讀

    zookeeper引入什么機(jī)制

    Zookeeper是一個(gè)開源的分布式協(xié)調(diào)服務(wù),被廣泛應(yīng)用于構(gòu)建分布式系統(tǒng)和大規(guī)模集群的管理。作為一個(gè)分布式協(xié)調(diào)服務(wù),Zookeeper引入了一系列機(jī)制來(lái)提供可靠的協(xié)調(diào)和一致服務(wù)。在這篇文章中,我們
    的頭像 發(fā)表于 12-03 16:38 ?769次閱讀

    java怎么注釋整個(gè)文檔

    java中可以使用特殊的注釋格式來(lái)注釋整個(gè)文檔,這種格式被稱為JavaDoc注釋。JavaDoc注釋可以用于生成HTML格式的文檔,包含類、方法、字段、參數(shù)等的詳細(xì)說(shuō)明。下面是
    的頭像 發(fā)表于 11-28 17:14 ?638次閱讀

    vs中如何快速注釋多行代碼

    在VS中,快速注釋多行代碼可以通過(guò)以下幾種方法實(shí)現(xiàn)。我將詳細(xì)介紹每種方法的步驟和應(yīng)用場(chǎng)景。 方法一:塊注釋注釋是一種常見(jiàn)的注釋多行代碼的方法。它適用于需要
    的頭像 發(fā)表于 11-22 10:26 ?1.5w次閱讀

    devc怎么注釋掉一段代碼

    在DevC中,要注釋掉一段代碼,你可以使用注釋符號(hào)來(lái)標(biāo)記這段代碼。注釋符號(hào)的作用是告訴編譯器不要編譯這些代碼,而是將其視為注釋,這樣可以方便開發(fā)人員在代碼中添加解釋、說(shuō)明或者臨時(shí)禁用某
    的頭像 發(fā)表于 11-22 10:23 ?2135次閱讀

    c語(yǔ)言怎么把代碼全部注釋

    要將C語(yǔ)言代碼全部注釋掉,即不讓代碼被編譯和執(zhí)行,可以使用注釋語(yǔ)句來(lái)實(shí)現(xiàn)。C語(yǔ)言提供兩種注釋方式:?jiǎn)涡?b class='flag-5'>注釋和多行注釋。 單行
    的頭像 發(fā)表于 11-22 10:21 ?6103次閱讀

    C語(yǔ)言中如何實(shí)現(xiàn)注釋

    在C語(yǔ)言中,注釋是用來(lái)增加代碼可讀注釋過(guò)程和功能的文本。C語(yǔ)言中支持兩種類型的注釋:?jiǎn)涡?b class='flag-5'>注釋和多行
    的頭像 發(fā)表于 11-22 10:17 ?1117次閱讀

    代碼即注釋,注釋即代碼的概念是如何形成的

    "代碼即注釋,注釋即代碼"這個(gè)概念是如何形成的呢?記得之前看一些討論,程序員應(yīng)該如何寫代碼的注釋,大家的意見(jiàn)很多,不過(guò)我只對(duì)兩句話記憶非常深刻:
    的頭像 發(fā)表于 11-18 16:52 ?675次閱讀
    代碼即<b class='flag-5'>注釋</b>,<b class='flag-5'>注釋</b>即代碼的概念是如何形成的