視頻人臉識別是計算機視覺、模式識別、視頻分析與理解等領(lǐng)域的重要研究課題。視頻人臉識別的研究不僅在理論上具有重大意義,同時在生物特征鑒別、視頻監(jiān)控、信息安全等領(lǐng)域具有廣泛的應(yīng)用前景,已經(jīng)成為人臉識別領(lǐng)域的研究熱點和難點問題。
目前,絕大多數(shù)的視頻人臉識別都是通過提取視頻序列中包含人臉的關(guān)鍵幀,采用基于靜態(tài)圖像的人臉識別算法達到視頻分類的目的,這其中就包括多視角融合、子空間或流形分析等。該類方法中關(guān)鍵幀的選擇歧義性較大,需要對整個視頻進行分析才能實現(xiàn)關(guān)鍵幀的準(zhǔn)確定位,降低了視頻人臉識別系統(tǒng)的效率和實時性要求,適合于人物目標(biāo)配合、光照及視角良好并且視頻質(zhì)量較高的環(huán)境下的應(yīng)用。
近年來,基于圖像集合和基于視頻序列的視頻人臉識別方法得到了廣泛關(guān)注。其中,基于圖像集合的視頻人臉識別方法是將視頻作為一個無序的幀圖像集合,通過流形、子空間、Affine Hull、協(xié)方差矩陣等對圖像集合進行建模以實現(xiàn)視頻人臉的識別?;谝曨l序列的視頻人臉識別算法是通過設(shè)計視頻紋理描述算子、引入視頻上下文信息等方式提高識別精度和效率。但是,視頻紋理算子及視頻上下文信息的獲取十分困難,計算復(fù)雜度較高,同時,這類算法對人臉表情變化、目標(biāo)姿態(tài)變化等影響識別性能的因素不夠魯棒。
自然視頻大多數(shù)是非專業(yè)人員采集的,視頻采集設(shè)備有限,視頻環(huán)境光照條件較差,目標(biāo)姿態(tài)多變并且伴隨運動模糊,同時,為了便于存儲及傳輸,通常還以壓縮格式存儲,這些噪音因素的存在都使得解決視頻人臉識別問題具有極大的挑戰(zhàn)性。為實現(xiàn)這種低分辨率、目標(biāo)姿態(tài)多變條件下的視頻人臉的魯棒識別,設(shè)計能夠適應(yīng)這種復(fù)雜環(huán)境下的視頻人臉識別學(xué)習(xí)算法就變得尤為重要。
為解決視頻環(huán)境下人臉識別問題中關(guān)鍵幀難以準(zhǔn)確定位導(dǎo)致的識別率偏低等問題,我們提出了一種基于多示例學(xué)習(xí)的視頻人臉識別算法。該算法將復(fù)雜環(huán)境下的視頻人臉識別問題視為一個多示例問題,將訓(xùn)練集合中的每個視頻視為一個包,將視頻包中歸一化處理后的視頻幀圖像視為包中的示例。視頻包帶有標(biāo)記而視頻包中的示例是沒有標(biāo)記的,利用有效的多示例學(xué)習(xí)算法在訓(xùn)練集合樣本空間中學(xué)習(xí)并生成分類器,以實現(xiàn)對測試包的預(yù)測及分類。
另外,視頻采集環(huán)境的光照變化、目標(biāo)的姿態(tài)變化等,都在一定程度上造成了視頻人臉識別上的困難,為此,我們在算法實現(xiàn)過程中還采用了基于改進的Fisher加權(quán)準(zhǔn)則的TPLBP進行示例的紋理特征表示,該算子具有較強的可辨別能力,并且對均勻光照變化是魯棒的。
目前,關(guān)于視頻人臉識別問題主要結(jié)合實際應(yīng)用場景進行分析,鑒于此,我們提出了一種適用于低信噪比環(huán)境下的基于加權(quán)Fisher準(zhǔn)則的多示例學(xué)習(xí)視頻人臉識別算法,算法在得到較高的識別精度的同時,有效解決了目標(biāo)姿態(tài)多變視頻環(huán)境中的人臉視頻關(guān)鍵幀難以定位的問題,并且具有較強的抗干擾能力,對均勻光照變化、姿態(tài)變化等也具有較好的魯棒性。如何解決算法時間復(fù)雜度較高,學(xué)習(xí)算法的泛化能力等問題成為我們今后研究工作的重點。
-
人臉識別
+關(guān)注
關(guān)注
76文章
4000瀏覽量
81590 -
計算機視覺
+關(guān)注
關(guān)注
8文章
1690瀏覽量
45876
發(fā)布評論請先 登錄
相關(guān)推薦
評論