0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Ground-truth數(shù)據(jù)面臨哪些挑戰(zhàn)?

佐思汽車研究 ? 來源:lp ? 2019-03-12 16:03 ? 次閱讀

Ground-truth(真值)是什么?

Ground-truth在機(jī)器學(xué)習(xí)中表示有監(jiān)督學(xué)習(xí)的訓(xùn)練集的分類準(zhǔn)確性,用于證明或者推翻某個假設(shè)。有監(jiān)督的機(jī)器學(xué)習(xí)會對訓(xùn)練數(shù)據(jù)打標(biāo)記,將那些正確打標(biāo)記的數(shù)據(jù)成為ground truth。Ground truth就是參考標(biāo)準(zhǔn),一般用來做誤差量化,最終用于驗(yàn)證分類算法的準(zhǔn)確性。真值標(biāo)定的輸入一般是視頻文件。真值標(biāo)定既可以手動一幀一幀地標(biāo)定,也可以半自動化標(biāo)定后再手工修正,最終可以將結(jié)果保存成真值數(shù)據(jù)庫。

Ground-truth在自動駕駛汽車產(chǎn)業(yè)具有很高的的附加值,它涉及以下數(shù)據(jù)處理流程:數(shù)據(jù)采集、數(shù)據(jù)標(biāo)注、模型訓(xùn)練、應(yīng)用、驗(yàn)證。擁有最高質(zhì)量Ground-truth數(shù)據(jù)的公司將會處于自動駕駛汽車的最前沿。

Ground-truth質(zhì)量影響算法質(zhì)量。

一、Ground-truth數(shù)據(jù)面臨哪些挑戰(zhàn)

丟失或模糊的對象

不一致的標(biāo)記(行人手中有物體或沒有物體)

不同種類車輛之間不明確的邊界

系統(tǒng)性的標(biāo)記誤差

不精確性

定義不佳的需求

1.1 丟失或模糊的對象

1.2 不一致的標(biāo)記 (行人手中有物體或沒有物體)

1.3 不同種類車輛之間不明確的邊界

1.4 系統(tǒng)化標(biāo)記誤差

原始的標(biāo)記框不精確,通過對頂部和底部的修正以及更詳細(xì)的注釋使得標(biāo)記框更加精確。

二、實(shí)驗(yàn):Ground Truth質(zhì)量對于算法性能的影響

2.1 實(shí)驗(yàn)

我們展示了標(biāo)記框?qū)嶒?yàn)的初步結(jié)果

1. 復(fù)合分類(定義不佳的標(biāo)簽需求)

2. 不精確的真值標(biāo)記

復(fù)合分類

圖中騎車人和行人被標(biāo)記了出來,自行車沒有被標(biāo)記出來。

2.2 復(fù)合Caltech:新數(shù)據(jù)集

行人與攜帶行李的行人的對比

Caltech完成了從原始不精確標(biāo)記框到更為精確的標(biāo)記框,再到高質(zhì)量復(fù)合型標(biāo)記框的轉(zhuǎn)變。

2.3 復(fù)合型Caltech訓(xùn)練

1. 用于重復(fù)性結(jié)果的框外物體檢測

2. 體系結(jié)構(gòu):更快的 rcnn_resnet101_coco (coco預(yù)訓(xùn)練)

3. Caltech數(shù)據(jù)庫微調(diào)(任何一個變量都有一個獨(dú)立的模型,沒有超參數(shù)調(diào)優(yōu))

2.4 Caltech檢測器評估

Caltech 改進(jìn)的Caltech 復(fù)合Caltech
mAP@0.5 0.2170 0.3030 0.2916

初步結(jié)果:復(fù)合Caltech降低了精確度

2.5 扭曲VOC邊界框

2.6實(shí)驗(yàn)總結(jié)

標(biāo)記不精確(質(zhì)量)對高精度區(qū)域的性能影響顯著。

三、解決方案

加速標(biāo)注過程:更高速、精確并且具有成本效益

人工標(biāo)注過程從90分鐘壓縮到35分鐘

可視化不確定的地方,引導(dǎo)標(biāo)記人員

四、Understand.ai 質(zhì)量保證辦法

一是依靠智能算法

深度學(xué)習(xí)推理,與不確定性計(jì)算共同加快標(biāo)注員的工作

算法質(zhì)量檢測與物體追蹤

二是依靠人類智慧

每一幅圖像都經(jīng)過人類標(biāo)注員的驗(yàn)證

通過內(nèi)部專家提供額外的質(zhì)量保證

通過智能算法與人類智慧,共同完成高質(zhì)量的標(biāo)注。

通過算法推薦,計(jì)算不確定的地方,以及標(biāo)記人員解決不確定性的地方,共同完成高質(zhì)量的標(biāo)注。

LIDAR標(biāo)注

通過算法和工具,使得速度最高能提高5倍。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 數(shù)據(jù)庫
    +關(guān)注

    關(guān)注

    7

    文章

    3739

    瀏覽量

    64173
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8323

    瀏覽量

    132177
  • 自動駕駛
    +關(guān)注

    關(guān)注

    782

    文章

    13540

    瀏覽量

    165744

原文標(biāo)題:Ground-truth質(zhì)量是算法質(zhì)量的關(guān)鍵

文章出處:【微信號:zuosiqiche,微信公眾號:佐思汽車研究】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    移動電視射頻技術(shù)面臨什么挑戰(zhàn)

    隨著數(shù)字移動電視不斷向移動設(shè)備的應(yīng)用轉(zhuǎn)移,應(yīng)用和系統(tǒng)工程師正面臨著各種挑戰(zhàn),比如外形尺寸的小型化、更低的功耗以及信號完整性。對現(xiàn)有移動電視標(biāo)準(zhǔn)的研究重點(diǎn)將放在了DVB-H上。本文將從系統(tǒng)角度討論DVB-H接收器設(shè)計(jì)所面臨的機(jī)遇和
    發(fā)表于 06-03 06:28

    患者監(jiān)護(hù)儀設(shè)計(jì)面臨挑戰(zhàn)有哪些?

    遠(yuǎn)程患者監(jiān)護(hù)系統(tǒng)面臨的五大設(shè)計(jì)挑戰(zhàn):電池壽命便攜性或尺寸患者安全安全的數(shù)據(jù)傳輸集成
    發(fā)表于 11-23 06:43

    精確測量阻抗所面臨挑戰(zhàn)有哪些

    精確測量阻抗所面臨挑戰(zhàn)
    發(fā)表于 01-27 07:34

    調(diào)試速度高達(dá)幾個Gb每秒的連接時所面臨挑戰(zhàn)

    本文將討論信號集成和硬件工程師在設(shè)計(jì)或調(diào)試速度高達(dá)幾個Gb每秒的連接時所面臨挑戰(zhàn)。無論是進(jìn)行下一代高分辨率視頻顯示、醫(yī)學(xué)成像、數(shù)據(jù)存儲或是在最新的高速以太網(wǎng)和電信協(xié)議中,我們都面臨
    發(fā)表于 03-01 10:17

    部署實(shí)時數(shù)據(jù)流平臺面臨挑戰(zhàn)有哪些?

    部署實(shí)時數(shù)據(jù)流平臺面臨的五大挑戰(zhàn)
    發(fā)表于 03-17 07:00

    為什么采用WCSP?WCSP面臨挑戰(zhàn)有哪些?

    為什么采用WCSP?WCSP面臨挑戰(zhàn)有哪些?
    發(fā)表于 04-21 06:14

    使用空中鼠標(biāo)系統(tǒng)面臨哪些挑戰(zhàn)?如何去克服這些挑戰(zhàn)?

    使用空中鼠標(biāo)系統(tǒng)面臨哪些挑戰(zhàn)?如何去克服這些挑戰(zhàn)
    發(fā)表于 05-10 07:26

    有什么方法可以解決HID設(shè)計(jì)面臨挑戰(zhàn)?

    HID設(shè)計(jì)面臨哪些挑戰(zhàn)?有什么方法可以解決HID設(shè)計(jì)面臨挑戰(zhàn)?
    發(fā)表于 05-17 06:06

    汽車無線安全應(yīng)用面臨哪些設(shè)計(jì)挑戰(zhàn)

    汽車無線安全應(yīng)用面臨哪些設(shè)計(jì)挑戰(zhàn)?
    發(fā)表于 05-19 06:41

    無線基礎(chǔ)設(shè)施容量面臨挑戰(zhàn)是什么?

    無線基礎(chǔ)設(shè)施容量面臨挑戰(zhàn)是什么?
    發(fā)表于 05-20 06:47

    高速通信面臨挑戰(zhàn)是什么?

    高速通信面臨挑戰(zhàn)是什么?
    發(fā)表于 05-24 06:34

    RFID原理是什么?RFID技術(shù)面臨哪些挑戰(zhàn)?

    RFID原理是什么?RFID技術(shù)面臨哪些挑戰(zhàn)?
    發(fā)表于 05-26 06:06

    HUD 2.0面臨哪些挑戰(zhàn)?如何去解決?

    HUD 2.0的發(fā)展動力是什么?HUD 2.0面臨哪些挑戰(zhàn)?如何去解決?
    發(fā)表于 06-01 06:44

    機(jī)器開發(fā)人員面臨哪些軟件挑戰(zhàn)以及硬件挑戰(zhàn)?如何去應(yīng)對這些挑戰(zhàn)?

    機(jī)器開發(fā)人員面臨哪些軟件挑戰(zhàn)以及硬件挑戰(zhàn)?如何去應(yīng)對這些挑戰(zhàn)
    發(fā)表于 06-26 07:27

    如何在不增加額外參數(shù)量的前提下把模型的表達(dá)能力挖掘到極致

    Knowledge distillation 只使用了單獨(dú)的 soft label,而不是 DeiT 里面 hard 形式的 label 加 one-hot ground-truth,因?yàn)檠芯空哒J(rèn)為 soft label 包含的信息更多,更有利于知識蒸餾;
    的頭像 發(fā)表于 08-08 16:25 ?1130次閱讀