3.2 視覺(jué)技術(shù)
視覺(jué)技術(shù)主要用計(jì)算機(jī)來(lái)模擬人的視覺(jué)功能,但并不僅是人眼的簡(jiǎn)單延伸,更重要的是具有大腦的一部分視覺(jué)分析功能,即從客觀事物的圖像中提取特征信息,對(duì)特征借息降維處理后加以分析、理解,最終用于實(shí)際檢測(cè)、工業(yè)測(cè)量和控制。
計(jì)算機(jī)視覺(jué)作為視覺(jué)技術(shù)的關(guān)鍵代表和組成部分,諸如圖像檢測(cè)、分類、識(shí)別和定位等功能的實(shí)現(xiàn)均依賴計(jì)算機(jī)視覺(jué)技術(shù)。下面介紹幾種基于計(jì)算機(jī)視覺(jué)技術(shù)的重要應(yīng)用及其學(xué)習(xí)模型。
3.2.1圖像分類
圖3-4圖像分類
對(duì)于給定一組被標(biāo)記為單一類別的圖像,對(duì)一組新的測(cè)試圖像的類別進(jìn)行預(yù)測(cè),并測(cè)量預(yù)測(cè)的準(zhǔn)確性結(jié)果,這就是圖像分類向題。計(jì)算機(jī)視覺(jué)技術(shù)研究提出了一種基于數(shù)據(jù)驅(qū)動(dòng)的方法。該方法并不是直接在算法程序中指定每個(gè)感興趣的圖像類別,而是為計(jì)算機(jī)的每個(gè)圖像類別都提供許多示例,然后設(shè)計(jì)一個(gè)學(xué)習(xí)算法,查看這些示例并學(xué)習(xí)每個(gè)類別的視覺(jué)外觀。也就是說(shuō),首先積累一個(gè)帶有標(biāo)記圖像的訓(xùn)練集,然后將其輸入計(jì)算機(jī)中,由計(jì)算機(jī)來(lái)處理這些數(shù)據(jù)。
可以按照下面的步驟來(lái)分解。
(1)輸入是由N個(gè)圖像組成的訓(xùn)練集,共有K個(gè)類別,每個(gè)圖像都被標(biāo)記為其中一個(gè)類別。
(2)使用該訓(xùn)練集訓(xùn)練一個(gè)分類器,來(lái)學(xué)習(xí)每個(gè)類別的外部特征。
(3)預(yù)測(cè)一組新圖像的類標(biāo)簽,評(píng)估分類器的性能,用分類器預(yù)測(cè)的類別標(biāo)簽與其真實(shí)的類別標(biāo)簽進(jìn)行比較。
目前較為流行的圖像分類架構(gòu)是卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)-將圖像送入網(wǎng)絡(luò),然后網(wǎng)絡(luò)對(duì)圖像數(shù)據(jù)進(jìn)行分類。
-
智慧燈桿
+關(guān)注
關(guān)注
1文章
797瀏覽量
11688
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論