0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

自主駕駛中對(duì)抗式機(jī)器學(xué)習(xí)對(duì)完全視覺(jué)感知管道的攻擊

上??匕?/a> ? 來(lái)源:上??匕?/span> ? 作者:上??匕?/span> ? 2021-02-01 11:04 ? 次閱讀

對(duì)抗機(jī)器學(xué)習(xí)最新研究開(kāi)始關(guān)注自主駕駛中的視覺(jué)感知,并研究了目標(biāo)檢測(cè)模型的對(duì)抗示例。然而在視覺(jué)感知管道中,在被稱為多目標(biāo)跟蹤的過(guò)程中,檢測(cè)到的目標(biāo)必須被跟蹤,以建立周圍障礙物的移動(dòng)軌跡。由于多目標(biāo)跟蹤被設(shè)計(jì)為對(duì)目標(biāo)檢測(cè)中的錯(cuò)誤具有魯棒性,它對(duì)現(xiàn)有的盲目針對(duì)目標(biāo)檢測(cè)的攻擊技術(shù)提出了挑戰(zhàn):我們發(fā)現(xiàn)攻擊方需要超過(guò)98%的成功率來(lái)實(shí)際影響跟蹤結(jié)果,這是任何現(xiàn)有的攻擊技術(shù)都無(wú)法達(dá)到的。本文首次研究了自主駕駛中對(duì)抗式機(jī)器學(xué)習(xí)對(duì)完全視覺(jué)感知管道的攻擊,并發(fā)現(xiàn)了一種新的攻擊技術(shù)——軌跡劫持,該技術(shù)可以有效地使用目標(biāo)檢測(cè)的對(duì)抗示例欺騙多目標(biāo)跟蹤。使用我們的技術(shù),僅在一個(gè)幀上成功的對(duì)抗示例就可以將現(xiàn)有物體移入或移出自駕車輛的行駛區(qū)域,從而造成潛在的安全危險(xiǎn)。我們使用Berkeley Deep Drive數(shù)據(jù)集進(jìn)行評(píng)估,發(fā)現(xiàn)平均而言,當(dāng)3幀受到攻擊時(shí),我們的攻擊可以有接近100%的成功率,而盲目針對(duì)目標(biāo)檢測(cè)的攻擊只有25%的成功率。

01

背景

自從Eykholt等人發(fā)現(xiàn)第一個(gè)針對(duì)交通標(biāo)志圖像分類的對(duì)抗示例以來(lái),對(duì)抗式機(jī)器學(xué)習(xí)中的若干研究工作開(kāi)始關(guān)注自動(dòng)駕駛中的視覺(jué)感知,并研究物體檢測(cè)模型上的對(duì)抗示例。例如,Eykholt等人和鐘等人針對(duì)YOLO物體探測(cè)器研究了停車標(biāo)志或前車背面的貼紙形式的對(duì)抗示例, 并進(jìn)行室內(nèi)實(shí)驗(yàn),以證明攻擊在現(xiàn)實(shí)世界中的可行性。在這些工作的基礎(chǔ)上,最近趙等人利用圖像變換技術(shù)來(lái)提高戶外環(huán)境中這種對(duì)抗式貼紙攻擊的魯棒性,并且能夠在真實(shí)道路上以30 km/h的恒定速度行駛的汽車上實(shí)現(xiàn)72%的攻擊成功率。雖然之前研究的結(jié)果令人擔(dān)憂,但在自動(dòng)駕駛或一般的機(jī)器人系統(tǒng)中,目標(biāo)檢測(cè)實(shí)際上只是視覺(jué)感知管道的前半部分——在后半部分,在一個(gè)稱為多目標(biāo)跟蹤的過(guò)程中,必須跟蹤檢測(cè)到的目標(biāo),以建立周圍障礙物的移動(dòng)軌跡。這對(duì)于隨后的駕駛決策過(guò)程是必需的,該過(guò)程需要構(gòu)建的軌跡來(lái)預(yù)測(cè)這些障礙物的未來(lái)移動(dòng)軌跡,然后相應(yīng)地規(guī)劃駕駛路徑以避免與它們碰撞。為了確保目標(biāo)檢測(cè)中的高跟蹤精度和對(duì)錯(cuò)誤的魯棒性,在多目標(biāo)跟蹤中,只有在多個(gè)幀中具有足夠一致性和穩(wěn)定性的檢測(cè)結(jié)果可以包括在跟蹤結(jié)果中,并且實(shí)際上影響駕駛決策。因此,自動(dòng)駕駛視覺(jué)感知中的多目標(biāo)跟蹤對(duì)現(xiàn)有的盲目針對(duì)目標(biāo)檢測(cè)的攻擊技術(shù)提出了新的挑戰(zhàn)。例如,正如我們稍后在第3節(jié)中的分析所示,對(duì)目標(biāo)檢測(cè)的攻擊需要連續(xù)成功至少60幀才能欺騙典型的多目標(biāo)跟蹤過(guò)程,這需要至少98%的攻擊成功率。據(jù)我們所知,沒(méi)有現(xiàn)有的針對(duì)目標(biāo)檢測(cè)的攻擊能夠達(dá)到如此高的成功率。在本文中,我們首次研究了自動(dòng)駕駛中考慮完全視覺(jué)感知管道的對(duì)抗性機(jī)器學(xué)習(xí)攻擊,即目標(biāo)檢測(cè)和目標(biāo)跟蹤,并發(fā)現(xiàn)了一種新的攻擊技術(shù),稱為跟蹤器劫持,它可以用在目標(biāo)檢測(cè)上的對(duì)抗示例有效地欺騙多目標(biāo)跟蹤過(guò)程。我們的關(guān)鍵見(jiàn)解是,雖然很難直接為假對(duì)象創(chuàng)建軌跡或刪除現(xiàn)有對(duì)象的軌跡,但我們可以仔細(xì)設(shè)計(jì)對(duì)抗示例來(lái)攻擊多目標(biāo)跟蹤中的跟蹤誤差減少過(guò)程,以使現(xiàn)有對(duì)象的跟蹤結(jié)果偏離攻擊者希望的移動(dòng)方向。這種過(guò)程旨在提高跟蹤結(jié)果的魯棒性和準(zhǔn)確性,但諷刺的是,我們發(fā)現(xiàn)攻擊者可以利用它來(lái)大大改變跟蹤結(jié)果。利用這種攻擊技術(shù),少至一幀的對(duì)抗示例足以將現(xiàn)有物體移入或移出自主車輛的行駛區(qū)域,從而導(dǎo)致潛在的安全危險(xiǎn)。我們從Berkeley Deep Drive數(shù)據(jù)集隨機(jī)抽樣的100個(gè)視頻片段中選擇20個(gè)進(jìn)行評(píng)估。在推薦的多目標(biāo)檢測(cè)配置和正常測(cè)量噪聲水平下,我們發(fā)現(xiàn)我們的攻擊可以在少至一幀和平均2到3個(gè)連續(xù)幀的對(duì)抗示例中成功。我們重復(fù)并比較了之前盲目針對(duì)目標(biāo)檢測(cè)的攻擊,發(fā)現(xiàn)當(dāng)攻擊連續(xù)3幀時(shí),我們的攻擊成功率接近100%,而盲目針對(duì)對(duì)象檢測(cè)攻擊的成功率只有25%。

o4YBAGASFbmAKs6tAABlExttAtM489.jpg

圖表 1自動(dòng)駕駛中的完整視覺(jué)感知管道,即目標(biāo)檢測(cè)和多目標(biāo)跟蹤

本文貢獻(xiàn)

考慮到自動(dòng)駕駛中完整的視覺(jué)感知管道,即目標(biāo)檢測(cè)和運(yùn)動(dòng)檢測(cè),我們首次研究了對(duì)抗性機(jī)器學(xué)習(xí)攻擊。我們發(fā)現(xiàn),在不考慮多目標(biāo)跟蹤的情況下,盲目針對(duì)目標(biāo)檢測(cè)的攻擊至少需要98%的成功率才能真正影響自動(dòng)駕駛中的完整視覺(jué)感知管道,這是任何現(xiàn)有攻擊技術(shù)都無(wú)法達(dá)到的?!の覀儼l(fā)現(xiàn)了一種新的攻擊技術(shù)——軌跡劫持,它可以有效地利用物體檢測(cè)中的對(duì)抗示例來(lái)欺騙移動(dòng)終端。這種技術(shù)利用了多目標(biāo)跟蹤中的跟蹤誤差減少過(guò)程,并且可以使僅在一幀內(nèi)成功的對(duì)抗示例將現(xiàn)有物體移入或移出自主車輛的行駛距離,從而導(dǎo)致潛在的安全危險(xiǎn)。·使用Berkeley Deep Drive數(shù)據(jù)集進(jìn)行的攻擊評(píng)估表明,我們的攻擊可以在少至一幀、平均只有2到3個(gè)連續(xù)幀的情況下獲得成功,當(dāng)3個(gè)連續(xù)幀受到攻擊時(shí),我們的攻擊成功率接近100%,而盲目針對(duì)目標(biāo)檢測(cè)的攻擊成功率僅為25%。

多目標(biāo)跟蹤

多目標(biāo)跟蹤的目的是識(shí)別視頻幀序列中的物體及其運(yùn)動(dòng)軌跡。隨著物體檢測(cè)的進(jìn)步,通過(guò)檢測(cè)進(jìn)行跟蹤已經(jīng)成為多目標(biāo)跟蹤的范例,其中檢測(cè)步驟識(shí)別圖像中的物體,跟蹤步驟將物體鏈接到軌跡(即軌跡)。如圖1所示,在時(shí)間t檢測(cè)到的每個(gè)物體將與動(dòng)態(tài)模型(例如,位置、速度)相關(guān)聯(lián),動(dòng)態(tài)模型表示物體的過(guò)去軌跡(track| t1)。,每一條軌跡都用卡爾曼濾波器來(lái)維護(hù)狀態(tài)模型,其以預(yù)測(cè)-更新循環(huán)運(yùn)行:預(yù)測(cè)步驟根據(jù)運(yùn)動(dòng)模型估計(jì)當(dāng)前對(duì)象狀態(tài),更新步驟采用檢測(cè)結(jié)果detc|t 作為測(cè)量值來(lái)更新其狀態(tài)估計(jì)結(jié)果track|t。檢測(cè)到的物體與現(xiàn)有跟蹤器之間的關(guān)聯(lián)被公式化為二分匹配問(wèn)題, 基于軌跡和被檢測(cè)對(duì)象之間的成對(duì)相似性損失,最常用的相似性度量是基于空間的損失,它測(cè)量邊界框或bbox之間的重疊量。為了減少這種關(guān)聯(lián)中的誤差,在卡爾曼濾波預(yù)測(cè)中需要精確的速度估計(jì)。由于攝像機(jī)幀的離散性,卡爾曼濾波器使用速度模型來(lái)估計(jì)下一幀中被跟蹤對(duì)象的位置,以補(bǔ)償幀間對(duì)象的運(yùn)動(dòng)。然而,如后面第3節(jié)中所述,這種錯(cuò)誤減少過(guò)程意外地使得進(jìn)行跟蹤者劫持成為可能。多目標(biāo)跟蹤通過(guò)兩個(gè)閾值管理軌跡的創(chuàng)建和刪除。具體來(lái)說(shuō),只有當(dāng)對(duì)象被持續(xù)檢測(cè)到一定數(shù)量的幀時(shí),才會(huì)創(chuàng)建一個(gè)新的軌跡,該閾值將被稱為命中數(shù),或用H指代,這有助于過(guò)濾掉物體檢測(cè)器偶爾產(chǎn)生的誤報(bào)。另一方面,如果在R幀的持續(xù)時(shí)間(或者稱為保留時(shí)間)內(nèi)沒(méi)有對(duì)象與軌跡相關(guān)聯(lián),軌跡將被刪除。它可以防止軌跡由于物體檢測(cè)器罕見(jiàn)的假陰性而被意外刪除。R和H的配置通常既取決于檢測(cè)模型的精度,也取決于幀速率(fps)。先前的研究提出了R = 2幀/秒和H = 0.2幀/秒的配置,對(duì)于普通的30幀/秒視覺(jué)感知系統(tǒng)給出了R = 60幀和H = 6幀。第3節(jié)的評(píng)估將表明,一個(gè)盲目地以目標(biāo)檢測(cè)為目標(biāo)的攻擊需要不斷地欺騙至少60幀(R)來(lái)擦除一個(gè)對(duì)象,而我們提出的軌跡劫持攻擊可以通過(guò)少到一幀,平均只有2~3幀的攻擊,來(lái)偽造持續(xù)R幀的對(duì)象,或在跟蹤結(jié)果中抹除H幀的目標(biāo)對(duì)象。

02

軌道劫持攻擊

多目標(biāo)跟蹤可以選擇包括一個(gè)或多個(gè)相似性度量來(lái)匹配跨幀的對(duì)象。常見(jiàn)的度量包括邊界框重疊、對(duì)象外觀、視覺(jué)表示和其他統(tǒng)計(jì)度量。作為多目標(biāo)跟蹤對(duì)抗威脅的首次研究,我們選擇了基于并集的交集(IoU)的匈牙利匹配作為我們的目標(biāo)算法,因?yàn)樗亲顝V泛采用和標(biāo)準(zhǔn)化的相似性度量,不僅是最近的研究,兩個(gè)真實(shí)世界的自動(dòng)駕駛系統(tǒng),百度阿波羅和Autoware也采用了這一度量 ,這確保了我們工作的代表性和實(shí)際意義。

pIYBAGASFbmAO5TBAACJsmZWVT4940.jpg

圖表 2描述軌跡劫持攻擊流程(a),以及兩種不同的攻擊場(chǎng)景:對(duì)象移入(b)和移出(c),其中軌跡劫持可能導(dǎo)致嚴(yán)重的安全后果,包括急停和追尾。

圖2a展示了本文發(fā)現(xiàn)的軌跡劫持攻擊,其中用于對(duì)象檢測(cè)的對(duì)抗示例(例如,前車上的對(duì)抗補(bǔ)丁)可以欺騙檢測(cè)結(jié)果,只用一幀就極大地偏離多目標(biāo)跟蹤中目標(biāo)對(duì)象(例如,前車)的軌跡。如圖所示,目標(biāo)汽車最初在t0時(shí)被跟蹤到以預(yù)測(cè)的速度向左。攻擊開(kāi)始于時(shí)間t1,在汽車后部貼上對(duì)抗的補(bǔ)丁。該補(bǔ)丁是精心生成的,以兩個(gè)對(duì)立的目標(biāo)欺騙目標(biāo)檢測(cè)器:(1)從檢測(cè)結(jié)果中刪除目標(biāo)對(duì)象的邊界框;(2)制作一個(gè)類似形狀的邊界框,但稍微向攻擊者指定的方向移動(dòng)。所構(gòu)造的邊界框(t1處檢測(cè)結(jié)果中的紅色邊界框)將與跟蹤結(jié)果中的目標(biāo)對(duì)象的原始軌跡相關(guān)聯(lián),我們稱之為軌跡劫持,并且因此將向軌跡給出朝向攻擊者期望的方向的假速度。圖2a中所示的軌跡劫持僅持續(xù)一幀,但其對(duì)抗效果可能持續(xù)數(shù)十幀,這取決于MOT參數(shù)R和H(在第2節(jié)中介紹)。例如,在攻擊后的時(shí)間t2,所有的檢測(cè)邊界框都恢復(fù)正常,但是,兩個(gè)不利影響持續(xù)存在: (1)目標(biāo)對(duì)象雖然在檢測(cè)結(jié)果中被恢復(fù),但是將不會(huì)被跟蹤,直到達(dá)到命中計(jì)數(shù)(H),并且在此之前,該對(duì)象在跟蹤結(jié)果中仍然丟失;(2)受攻擊者誘導(dǎo)速度劫持的軌跡將不會(huì)被刪除,直到一個(gè)保留時(shí)間(R)過(guò)去。然而,值得注意的是,我們的攻擊在實(shí)踐中并不總是成功的,因?yàn)槿绻壽E在短時(shí)間的攻擊期間沒(méi)有偏離對(duì)象的真實(shí)位置足夠遠(yuǎn),恢復(fù)的對(duì)象可能仍然與其原始軌跡相關(guān)聯(lián)。我們的實(shí)驗(yàn)結(jié)果表明,當(dāng)使用對(duì)抗示例成功攻擊3個(gè)連續(xù)幀時(shí),我們的攻擊通常達(dá)到接近100%的成功率。這種持續(xù)的不良效應(yīng)可能會(huì)在自動(dòng)駕駛場(chǎng)景中造成嚴(yán)重的安全后果。我們強(qiáng)調(diào)兩種可能導(dǎo)致緊急停車甚至追尾事故的攻擊場(chǎng)景:

攻擊場(chǎng)景1: 目標(biāo)物體移入

如圖2b所示,可以在路邊物體(例如停放的車輛)上放置對(duì)抗貼片,以欺騙經(jīng)過(guò)的自駕車輛的視覺(jué)感知。在檢測(cè)結(jié)果中,生成對(duì)抗補(bǔ)丁以導(dǎo)致目標(biāo)邊緣框向道路中心平移,并且被劫持的軌跡將在受害車輛的感知中表現(xiàn)為在前方加塞的移動(dòng)車輛。如果按照朱等人的建議將R配置為2 fps,該跟蹤器將持續(xù)2秒鐘,并且這種情況下的軌跡劫持可能導(dǎo)致緊急停止和潛在的追尾碰撞。

攻擊場(chǎng)景2:目標(biāo)物體移出

同樣,軌跡劫持攻擊也可以使受害自駕車輛前方的物體偏離道路,導(dǎo)致撞車,如圖2c所示。如果H使用0.2 fps的推薦配置,則應(yīng)用于前車后部的對(duì)抗貼片可能會(huì)欺騙后面的自動(dòng)車輛的多目標(biāo)跟蹤器相信物體正在偏離其路線,并且前車將在200ms的持續(xù)時(shí)間內(nèi)從跟蹤結(jié)果中消失,這可能會(huì)導(dǎo)致受害者的自動(dòng)駕駛汽車撞上前車。

o4YBAGASFbmAGxPiAAC7Z-ZMgIE052.jpg

我們的攻擊目標(biāo)是一階卡爾曼濾波器,它預(yù)測(cè)一個(gè)狀態(tài)向量,包含檢測(cè)到的對(duì)象與時(shí)間相關(guān)的位置和速度。對(duì)于數(shù)據(jù)關(guān)聯(lián),我們采用最廣泛使用的并集的交集(IoU)作為相似性度量,通過(guò)匈牙利匹配算法計(jì)算邊緣框之間的IoU,以解決將連續(xù)幀中檢測(cè)到的邊緣框與現(xiàn)有軌跡關(guān)聯(lián)的二分匹配問(wèn)題。多目標(biāo)跟蹤中的這種算法組合在以前的研究和現(xiàn)實(shí)世界中是最常見(jiàn)的?,F(xiàn)在描述我們的方法,即生成一個(gè)敵對(duì)補(bǔ)丁,操縱檢測(cè)結(jié)果劫持軌跡。詳見(jiàn)Alg.1,給定一個(gè)目標(biāo)視頻圖像序列,攻擊迭代地找到成功劫持所需的最少干擾幀,并為這些幀生成對(duì)抗補(bǔ)丁。在每次攻擊迭代中,對(duì)原始視頻剪輯中的一個(gè)圖像幀進(jìn)行處理,給定目標(biāo)對(duì)象的索引K,該算法通過(guò)求解等式1找到放置對(duì)抗邊緣框的最佳位置pos,以劫持目標(biāo)對(duì)象的軌跡。然后,攻擊使用對(duì)抗補(bǔ)丁構(gòu)建針對(duì)目標(biāo)檢測(cè)模型的對(duì)抗幀,使用等式2作為損失函數(shù),擦除目標(biāo)對(duì)象的原始邊緣框,并在給定位置構(gòu)建對(duì)抗邊緣框。軌跡隨后被偏離其原始方向的對(duì)抗幀更新,如果下一幀中的目標(biāo)對(duì)象沒(méi)有通過(guò)多目標(biāo)跟蹤算法與其原始跟蹤器相關(guān)聯(lián),則攻擊成功;否則,對(duì)下一幀重復(fù)該過(guò)程。我們下面討論這個(gè)算法中的兩個(gè)關(guān)鍵步驟。

pIYBAGASFbqAVLJjAAB_DA8OInY135.jpg

圖表 3現(xiàn)有的目標(biāo)檢測(cè)攻擊和我們的軌跡劫持攻擊的比較。簡(jiǎn)單擦除bbox的攻擊對(duì)跟蹤輸出沒(méi)有影響(b),而利用精心選擇的位置偽造bbox的軌跡劫持攻擊成功地將軌跡重定向到攻擊者指定的方向(c)。

尋找對(duì)抗包圍盒的最佳位置

為了偏離目標(biāo)對(duì)象K的跟蹤器,除了移除其原始邊界框detc|t[K] 之外,攻擊還需要制造一個(gè)向指定方向移動(dòng)δ的對(duì)抗框。這就變成了優(yōu)化問(wèn)題(Eq.1),即找到使檢測(cè)框和現(xiàn)有跟蹤器之間的匈牙利匹配(M())的損失最大化的平移向量δ,使得邊界框仍然與其原始跟蹤器相關(guān)聯(lián)(M ≤ λ),但是偏移足夠大,以給軌跡提供對(duì)抗速度。請(qǐng)注意,我們還將移動(dòng)的邊界框限制為與補(bǔ)丁重疊,以方便對(duì)抗示例的生成,因?yàn)閿硨?duì)擾動(dòng)通常更容易影響其附近的預(yù)測(cè)結(jié)果,尤其是在物理環(huán)境中。

o4YBAGASFbqAY4PPAAAaMyOL3Qo998.jpg

生成對(duì)抗目標(biāo)檢測(cè)的補(bǔ)丁

類似于現(xiàn)有的針對(duì)目標(biāo)檢測(cè)模型的對(duì)抗性攻擊,我們還將對(duì)抗性補(bǔ)丁生成公式化為等式2中所示的優(yōu)化問(wèn)題?,F(xiàn)有的不考慮多目標(biāo)跟蹤的攻擊直接將目標(biāo)類(如停止標(biāo)志) 的概率降到最低從而在檢測(cè)結(jié)果中抹去對(duì)象。然而,如圖3b所示,這種對(duì)抗示例在欺騙多目標(biāo)跟蹤方面非常無(wú)效,因?yàn)榧词乖跈z測(cè)邊界框被擦除之后,跟蹤器仍將跟蹤R幀。相反,我們的跟蹤器劫持攻擊的損失函數(shù)包含兩個(gè)優(yōu)化目標(biāo):(1)最小化目標(biāo)類概率以擦除目標(biāo)對(duì)象的邊緣框;(2)在攻擊者想要的位置以特定的形狀偽造對(duì)抗邊緣框以劫持軌跡。

pIYBAGASFbuAXouKAAA2LaSHwTg786.jpg

03

攻擊評(píng)估

評(píng)估指標(biāo)

我們將成功的攻擊定義為當(dāng)攻擊停止時(shí),檢測(cè)到的目標(biāo)對(duì)象的邊界框不再與任何現(xiàn)有的跟蹤器相關(guān)聯(lián)。我們使用物體檢測(cè)的對(duì)抗示例成功所需的最小幀數(shù)來(lái)衡量我們的軌跡劫持攻擊的有效性。攻擊效果高度依賴于原軌跡的方向向量與敵手目標(biāo)的差異。例如,如果選擇對(duì)抗方向與其原始方向相反,攻擊者可以在只有一幀的情況下對(duì)跟蹤器進(jìn)行大的移動(dòng),而如果敵手方向恰好與目標(biāo)的原始方向相同,則很難使跟蹤器偏離其已建立的軌跡。為了控制變量,我們?cè)谇懊娑x的兩種攻擊場(chǎng)景中測(cè)量攻擊所需的幀數(shù):即目標(biāo)對(duì)象移入和移出。具體來(lái)說(shuō),在所有的移入場(chǎng)景中,我們選擇沿著道路停放的車輛作為目標(biāo),攻擊目標(biāo)是將軌跡移動(dòng)到中心,而在所有的移出場(chǎng)景中,我們選擇向前移動(dòng)的車輛,攻擊目標(biāo)是將目標(biāo)軌跡移離道路。

數(shù)據(jù)集

我們從Berkeley Deep Drive數(shù)據(jù)集中隨機(jī)采樣了100個(gè)視頻片段,然后手動(dòng)選擇10個(gè)適合對(duì)象移入場(chǎng)景,另外10個(gè)適合對(duì)象移出場(chǎng)景。對(duì)于每個(gè)片段,我們手動(dòng)標(biāo)記一個(gè)目標(biāo)車輛,并將補(bǔ)丁區(qū)域標(biāo)注為其后面的一個(gè)小區(qū)域,如圖3c所示。所有視頻每秒30幀。

實(shí)施細(xì)節(jié)

我們使用Python實(shí)現(xiàn)了我們的目標(biāo)視覺(jué)感知管道,使用YOLOv3作為目標(biāo)檢測(cè)模型,因?yàn)樗趯?shí)時(shí)系統(tǒng)中非常受歡迎。對(duì)于多目標(biāo)跟蹤實(shí)現(xiàn),我們?cè)趕klearn包中使用了稱為線性賦值的匈牙利匹配實(shí)現(xiàn)來(lái)進(jìn)行數(shù)據(jù)關(guān)聯(lián),并在OpenCV中使用的基礎(chǔ)上提供了卡爾曼濾波器的參考實(shí)現(xiàn)。攻擊的有效性取決于卡爾曼濾波器的配置參數(shù),稱為測(cè)量噪聲協(xié)方差(cov)。cov是對(duì)系統(tǒng)中有多少噪聲的估計(jì),當(dāng)更新軌跡時(shí),較低的cov值將使卡爾曼濾波器對(duì)在時(shí)間t的檢測(cè)結(jié)果更有信心,而較高的cov值將使卡爾曼濾波器在時(shí)間t 更信任它先前在時(shí)間t- 1的預(yù)測(cè)。這種測(cè)量噪聲協(xié)方差通?;趯?shí)際中檢測(cè)模型的性能來(lái)調(diào)整。如圖4a所示,我們?cè)趶姆浅P?103)到非常大(10)的不同cov配置下評(píng)估我們的方法,而在實(shí)踐中cov通常設(shè)置在0.01和10之間。

圖表 4 在正常的測(cè)量噪聲協(xié)方差范圍(a)中,盡管有(R,H)設(shè)置,我們的軌跡劫持攻擊僅需要對(duì)抗示例平均只欺騙2~3個(gè)連續(xù)的幀來(lái)成功地帶偏目標(biāo)軌跡。我們還比較了在不同的攻擊者能力下,軌跡劫持的成功率與以前對(duì)目標(biāo)檢測(cè)器的敵對(duì)攻擊的成功率,即對(duì)抗示例可以可靠地欺騙目標(biāo)檢測(cè)器所需的連續(xù)幀的數(shù)量(b)

評(píng)估結(jié)果

圖4a表明了在20個(gè)視頻剪輯上成功的軌道劫持,物體檢測(cè)上的對(duì)抗示例需要欺騙的平均幀數(shù)。雖然在fps為30時(shí)推薦R = 60、H = 6的配置,我們?nèi)匀粶y(cè)試不同的保留時(shí)間(R)和命中數(shù)(H)組合,這是因?yàn)楝F(xiàn)實(shí)部署通常比較保守,使用較小的R和H。結(jié)果表明,盡管有(R,H)配置,軌跡劫持攻擊僅需要平均在2到3個(gè)連續(xù)幀中成功的目標(biāo)檢測(cè)對(duì)抗示例就能成功。我們還發(fā)現(xiàn),即使只有一幀成功的對(duì)抗示例,當(dāng)cov分別為0.1和0.01時(shí),我們的攻擊仍有50%和30%的成功率。有趣的是,我們發(fā)現(xiàn)對(duì)象移入通常比對(duì)象移出需要更少的幀。原因是,在駛?cè)雸?chǎng)景中停放的車輛(圖2b)相對(duì)于自主車輛自然具有駛離速度。因此,與移出攻擊相比,移入攻擊觸發(fā)了攻擊者期望的速度和原始速度之間的較大差異。這使得原始對(duì)象一旦恢復(fù),就更難正確關(guān)聯(lián),使得劫持更容易。圖4b顯示了我們的攻擊和以前盲目針對(duì)目標(biāo)檢測(cè)的攻擊(稱為檢測(cè)攻擊)的成功率。我們復(fù)制了鐘等人最近針對(duì)目標(biāo)檢測(cè)的對(duì)抗性補(bǔ)丁攻擊,該攻擊針對(duì)自動(dòng)駕駛環(huán)境,并通過(guò)真實(shí)世界的汽車測(cè)試顯示了其有效性。在這種攻擊中,目標(biāo)是從每一幀的檢測(cè)結(jié)果中擦除目標(biāo)類。在兩種(R,H)設(shè)置下進(jìn)行評(píng)估,我們發(fā)現(xiàn)我們的軌跡劫持攻擊即使只攻擊3幀也能達(dá)到優(yōu)越的攻擊成功率(100%),而檢測(cè)攻擊需要可靠地欺騙至少R個(gè)連續(xù)幀。當(dāng)按照30 fps的幀率將R設(shè)置為60時(shí),檢測(cè)攻擊需要在受害自駕車行駛的同時(shí)對(duì)抗性補(bǔ)丁能夠持續(xù)成功至少60幀。這意味著超過(guò)98.3% (59/60)的對(duì)抗示例成功率,這在以前的研究中從未達(dá)到。請(qǐng)注意,檢測(cè)攻擊在R之前仍然可以有高達(dá)約25%的成功率。這是因?yàn)闄z測(cè)攻擊導(dǎo)致對(duì)象在某些幀中消失,并且當(dāng)車輛航向在此消失期間發(fā)生變化時(shí),仍然有可能導(dǎo)致原始對(duì)象在恢復(fù)時(shí)與原始軌跡中的軌跡預(yù)測(cè)不匹配。然而,由于我們的攻擊是為了故意誤導(dǎo)多目標(biāo)跟蹤中的軌跡預(yù)測(cè),我們的成功率要高得多(3-4倍),并且可以在少至3幀的攻擊下達(dá)到100%。

04

討論與總結(jié)

對(duì)該領(lǐng)域未來(lái)研究的啟示

如今,針對(duì)自動(dòng)駕駛中視覺(jué)感知的對(duì)抗性機(jī)器學(xué)習(xí)研究,無(wú)論是攻擊還是防御,都使用目標(biāo)檢測(cè)的準(zhǔn)確性作為事實(shí)上的評(píng)估指標(biāo)。然而,正如在我們的工作中具體顯示的,在不考慮多目標(biāo)跟蹤的情況下,對(duì)檢測(cè)結(jié)果的成功攻擊并不意味著對(duì)多目標(biāo)跟蹤結(jié)果的同等或接近成功的攻擊,多目標(biāo)跟蹤結(jié)果是真實(shí)世界自動(dòng)駕駛中視覺(jué)感知任務(wù)的最終輸出。因此,我們認(rèn)為這一領(lǐng)域的未來(lái)研究應(yīng)考慮:(1)使用多目標(biāo)跟蹤準(zhǔn)確度作為評(píng)估指標(biāo);(2)不僅僅關(guān)注目標(biāo)檢測(cè),還應(yīng)研究多目標(biāo)跟蹤特有的弱點(diǎn)或多目標(biāo)跟蹤與目標(biāo)檢測(cè)之間的相互作用,這是一個(gè)目前尚未充分探索的研究領(lǐng)域。這篇論文標(biāo)志著第一次朝兩個(gè)方向努力的研究。

實(shí)用性提升

我們的評(píng)估目前都是用捕獲的視頻幀進(jìn)行數(shù)字處理的,而我們的方法在應(yīng)用于生成物理補(bǔ)丁時(shí)應(yīng)該仍然有效。例如,我們提出的對(duì)抗補(bǔ)丁生成方法可以自然地與以前工作提出的不同技術(shù)相結(jié)合,以增強(qiáng)物理世界中的可靠性。

通用性提高

雖然在這項(xiàng)工作中,我們側(cè)重于使用基于IoU的數(shù)據(jù)關(guān)聯(lián)的多目標(biāo)跟蹤算法,但我們尋找位置來(lái)放置對(duì)抗邊界框的方法通常適用于其他關(guān)聯(lián)機(jī)制(例如,基于外觀的匹配)。我們針對(duì)YOLOv3的對(duì)抗示例生成算法也應(yīng)該適用于其他具有適度適應(yīng)性的目標(biāo)檢測(cè)模型。我們計(jì)劃提供更多真實(shí)世界端到端視覺(jué)感知管道的參考實(shí)現(xiàn),為未來(lái)自動(dòng)駕駛場(chǎng)景中的對(duì)抗學(xué)習(xí)研究鋪平道路。

fqj

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 跟蹤器
    +關(guān)注

    關(guān)注

    0

    文章

    128

    瀏覽量

    19983
  • 自動(dòng)駕駛
    +關(guān)注

    關(guān)注

    782

    文章

    13535

    瀏覽量

    165742
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    ARMxy嵌入計(jì)算機(jī)在機(jī)器視覺(jué)的卓越表現(xiàn)

    嵌入視覺(jué)是指在嵌入系統(tǒng)中使用計(jì)算機(jī)視覺(jué)技術(shù),與經(jīng)常所說(shuō)的機(jī)器視覺(jué)系統(tǒng)的區(qū)別在于嵌入
    的頭像 發(fā)表于 10-10 14:47 ?153次閱讀
    ARMxy嵌入<b class='flag-5'>式</b>計(jì)算機(jī)在<b class='flag-5'>機(jī)器</b><b class='flag-5'>視覺(jué)</b><b class='flag-5'>中</b>的卓越表現(xiàn)

    人形機(jī)器感知系統(tǒng)的特點(diǎn):多模態(tài)感知、高精度、實(shí)時(shí)性

    電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)感知系統(tǒng)是人形機(jī)器人實(shí)現(xiàn)智能交互和自主行動(dòng)的關(guān)鍵組成部分。該系統(tǒng)通常包括多種傳感器和算法,用于收集、處理和分析來(lái)自外部環(huán)境的信息。不同企業(yè)所采用的感知系統(tǒng)
    的頭像 發(fā)表于 07-30 01:05 ?4019次閱讀

    機(jī)器視覺(jué)在嵌入的應(yīng)用

    機(jī)器視覺(jué)在嵌入系統(tǒng)的應(yīng)用是一個(gè)廣泛而深入的話題,涉及到許多不同的領(lǐng)域和技術(shù)。 機(jī)器視覺(jué)在嵌入
    的頭像 發(fā)表于 07-16 10:30 ?383次閱讀

    機(jī)器視覺(jué)與計(jì)算機(jī)視覺(jué)的區(qū)別與聯(lián)系

    機(jī)器視覺(jué)與計(jì)算機(jī)視覺(jué)是兩個(gè)密切相關(guān)但又有所區(qū)別的領(lǐng)域。 1. 引言 在當(dāng)今科技迅猛發(fā)展的時(shí)代,機(jī)器人和計(jì)算機(jī)視覺(jué)技術(shù)在各個(gè)領(lǐng)域發(fā)揮著越來(lái)越
    的頭像 發(fā)表于 07-09 09:27 ?452次閱讀

    計(jì)算機(jī)視覺(jué)與智能感知是干嘛的

    引言 計(jì)算機(jī)視覺(jué)(Computer Vision)是一門研究如何使計(jì)算機(jī)能夠理解和解釋視覺(jué)信息的學(xué)科。它涉及到圖像處理、模式識(shí)別、機(jī)器學(xué)習(xí)等多個(gè)領(lǐng)域,是人工智能的重要組成部分。智能
    的頭像 發(fā)表于 07-09 09:23 ?549次閱讀

    深度學(xué)習(xí)在工業(yè)機(jī)器視覺(jué)檢測(cè)的應(yīng)用

    隨著深度學(xué)習(xí)技術(shù)的快速發(fā)展,其在工業(yè)機(jī)器視覺(jué)檢測(cè)的應(yīng)用日益廣泛,并展現(xiàn)出巨大的潛力。工業(yè)機(jī)器視覺(jué)
    的頭像 發(fā)表于 07-08 10:40 ?796次閱讀

    機(jī)器視覺(jué)的應(yīng)用范圍

    機(jī)器視覺(jué)是一種將計(jì)算機(jī)視覺(jué)技術(shù)應(yīng)用于機(jī)器人領(lǐng)域的技術(shù),它使得機(jī)器人能夠感知和理解周圍環(huán)境,實(shí)現(xiàn)
    的頭像 發(fā)表于 07-04 11:33 ?413次閱讀

    機(jī)器視覺(jué)的作用是什么

    一、引言 機(jī)器視覺(jué)機(jī)器人技術(shù)的重要組成部分,它利用計(jì)算機(jī)視覺(jué)技術(shù)對(duì)機(jī)器人周圍環(huán)境進(jìn)行感知、識(shí)
    的頭像 發(fā)表于 07-04 11:24 ?462次閱讀

    深度學(xué)習(xí)在自動(dòng)駕駛的關(guān)鍵技術(shù)

    隨著人工智能技術(shù)的飛速發(fā)展,自動(dòng)駕駛技術(shù)作為其中的重要分支,正逐漸走向成熟。在自動(dòng)駕駛系統(tǒng),深度學(xué)習(xí)技術(shù)發(fā)揮著至關(guān)重要的作用。它通過(guò)模擬人腦的學(xué)習(xí)
    的頭像 發(fā)表于 07-01 11:40 ?565次閱讀

    什么是機(jī)器視覺(jué)的圖像采集?

    機(jī)器視覺(jué)已成為工業(yè)自動(dòng)化的眼睛。盡管它的出現(xiàn)相對(duì)較新,但由于它能夠同時(shí)提供增強(qiáng)的準(zhǔn)確性和更快的周轉(zhuǎn),因此在相當(dāng)多的行業(yè)獲得了關(guān)注。機(jī)器視覺(jué)
    的頭像 發(fā)表于 04-22 16:22 ?400次閱讀
    什么是<b class='flag-5'>機(jī)器</b><b class='flag-5'>視覺(jué)</b><b class='flag-5'>中</b>的圖像采集?

    未來(lái)已來(lái),多傳感器融合感知是自動(dòng)駕駛破局的關(guān)鍵

    巨大的進(jìn)展;自動(dòng)駕駛開(kāi)始摒棄手動(dòng)編碼規(guī)則和機(jī)器學(xué)習(xí)模型的方法,轉(zhuǎn)向全面采用端到端的神經(jīng)網(wǎng)絡(luò)AI系統(tǒng),它能模仿學(xué)習(xí)人類司機(jī)的駕駛,遇到場(chǎng)景直接
    發(fā)表于 04-11 10:26

    機(jī)器視覺(jué)網(wǎng)卡:連接攝像頭和計(jì)算設(shè)備之間的橋梁

    機(jī)器視覺(jué)是一門涉及計(jì)算機(jī)科學(xué)和人工智能的領(lǐng)域,它致力于讓計(jì)算機(jī)系統(tǒng)具備類似于人類視覺(jué)的能力。通過(guò)使用攝像頭和圖像處理算法,機(jī)器視覺(jué)系統(tǒng)可以
    的頭像 發(fā)表于 03-25 17:59 ?813次閱讀
    <b class='flag-5'>機(jī)器</b><b class='flag-5'>視覺(jué)</b>網(wǎng)卡:連接攝像頭和計(jì)算設(shè)備之間的橋梁

    技術(shù)基因+自主創(chuàng)新,光鑒科技塑造3D視覺(jué)感知新范式

    感知技術(shù)已經(jīng)滲透到智能汽車、工業(yè)機(jī)器人、服務(wù)機(jī)器人、智慧城市、新零售和智能家居等廣泛領(lǐng)域,憑借精度高、速度快、適配性強(qiáng)、抗干擾能力強(qiáng)等突出優(yōu)勢(shì),3D視覺(jué)
    的頭像 發(fā)表于 01-16 00:22 ?1206次閱讀
    技術(shù)基因+<b class='flag-5'>自主</b>創(chuàng)新,光鑒科技塑造3D<b class='flag-5'>視覺(jué)</b><b class='flag-5'>感知</b>新范式

    大牛談如何學(xué)習(xí)機(jī)器視覺(jué)?

    國(guó)內(nèi)外機(jī)器視覺(jué)發(fā)展的不同。我本人認(rèn)為,只有先搞清了兩邊的不一樣,才便于說(shuō)清如何下手學(xué)習(xí)。國(guó)外機(jī)器視覺(jué)發(fā)展到今天,已經(jīng)從“一包到底”
    發(fā)表于 01-15 11:02 ?345次閱讀
    大牛談如何<b class='flag-5'>學(xué)習(xí)機(jī)器</b><b class='flag-5'>視覺(jué)</b>?

    計(jì)算機(jī)視覺(jué)的立體視覺(jué)和深度感知Python示例實(shí)現(xiàn)

    在人工智能和圖像處理的迷人世界,這些概念在使機(jī)器能夠像我們的眼睛一樣感知我們周圍的三維世界起著關(guān)鍵作用。和我們一起探索立體視覺(jué)和深度
    的頭像 發(fā)表于 11-21 10:50 ?542次閱讀