0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

人臉識別的主流方法介紹

1bGT_GKYXT1508 ? 來源:YXQ ? 2019-07-15 16:53 ? 次閱讀

人臉識別的基本思想是比較類似的,都是要將圖像中的特征提取出來,轉(zhuǎn)換到一個(gè)合適的子空間里,然后在這個(gè)子空間里衡量類似性或分類學(xué)習(xí)。但問題在于,對客觀世界采用怎樣協(xié)調(diào)統(tǒng)一且有成效的表示法?我們要找到怎樣合適的子空間,怎樣去分類,才能區(qū)分不同類,聚集相似的類別?為解決這些問題,衍生出了很多種方法和解決方案。

所以說,我們所說的人臉識別技術(shù)是籠統(tǒng)的,事實(shí)上,這是一個(gè)很多技術(shù)和方法的集合。我們不妨依據(jù)上面的邏輯結(jié)構(gòu)圖來逐步說明。

預(yù)處理

人臉圖像的預(yù)處理,這一步?jīng)]有太多可說的,主要包括消除噪聲、灰度歸一化、幾何校正等,這些操作一般有現(xiàn)成的算法可以實(shí)現(xiàn),屬于比較基本的操作。不過要說明的是,這里主要說的是靜態(tài)人臉圖像的預(yù)處理,如果是動(dòng)態(tài)人臉圖像的預(yù)處理,就比較復(fù)雜了,一般是要先將動(dòng)態(tài)人臉圖像分割成一組靜態(tài)人臉圖像,然后對人臉進(jìn)行邊緣檢測和定位,在做一系列的處理,這里就不展開了。

特征提取

圖像特征的提取是比較關(guān)鍵的一步(上文所說的模式空間向特征空間的跨越),但對于圖像處理來說也是比較初級的一步。目前關(guān)于圖像特征提取的方法有很多,但其實(shí)我們想一想,通常而言圖像的特征還是可以歸類的,例如顏色特征、紋理特征、空間關(guān)系特征、形狀特征等,每一種特征都有匹配的方法,其中有一些比較經(jīng)典、好用的方法,例如HOG特征法,LBP特征法,Haar特征法等,這里就不一一講解,所以選取了其中一種——HOG特征法。

HOG特征也叫方向梯度直方圖,它是由Navneet Dalal和Bill Triggs在2005年的一篇博士論文中提出的。我們簡單來看它是怎么進(jìn)行的。

我們以這張照片為例,第一步是要將它變成黑白的照片,因?yàn)樯?a target="_blank">信息在這里對識別并沒有幫助。

在這張黑白照片中,我們從單個(gè)像素看起,觀察它周圍的像素,看它是往哪個(gè)方向逐漸變暗的,然后用箭頭表示這個(gè)像素變暗的方向。

如果對每個(gè)像素執(zhí)行這樣的操作,這樣所有像素都會被這樣的箭頭取代,它們表示了像素明暗變化的方向。每一個(gè)這樣的箭頭表示明暗梯度。

事實(shí)上,對于每一個(gè)像素,給定坐標(biāo)系,我們能夠求出它的梯度方向值。計(jì)算的方法比較復(fù)雜,我們不需要了解,只需要知道這一步是為了捕獲目標(biāo)的輪廓信息,同時(shí)進(jìn)一步弱化光照的干擾。

如果是以這樣的方式做提取的話,計(jì)算量會很大。所以我們會把圖像分割成8x8像素的小方塊,叫做一個(gè)Cell,然后對每個(gè)Cell計(jì)算梯度信息,包括梯度的大小和方向。得到的是這個(gè)Cell的9維特征向量。

相信到這里大家有些不懂了。在這里再為小伙伴們稍微解釋一下,其實(shí)這一步的目的是為每個(gè)Cell構(gòu)建梯度方向直方圖,直方圖就是我們大家熟知的條形統(tǒng)計(jì)圖,這個(gè)直方圖中,X軸是將方向劃分的區(qū)間,Navneet Dalal等人研究表示劃分9個(gè)區(qū)間效果是最好的,如果是180°的方向,每個(gè)區(qū)間就代表20°。y軸表示某個(gè)方向區(qū)間內(nèi)的梯度大小。這樣就等于是每個(gè)Cell的特征描述符。

圖片來源:加州大學(xué)舊金山分校圖像處理論文

大致就是這個(gè)意思。

這里還有一步,就是如果你的圖像受到光照的影響比較大,那么還可以將一定的Cell組成一個(gè)block,例如2x2個(gè)Cell,這樣每個(gè)block上就是36維的特征向量,然后對這36維特征向量做規(guī)范化(具體怎樣規(guī)范,涉及到高等數(shù)學(xué)的知識,大家也不需要知道)。

如果我們輸入的圖像大小是256x512像素,那么就有32x64=2048個(gè)Cell,有31x63=1953個(gè)block,每個(gè)block有36維向量,那么這個(gè)圖像就有1953x36=70308維向量。這70308維向量就是這個(gè)圖像的HOG特征向量了。

當(dāng)然,上面這些步驟你也可都不了解,你只需要知道,最后原始的圖像被表示成了HOG的形式,如下圖:

然后根據(jù)這個(gè)HOG形式,在我們的庫中找到與已知的一些HOG樣式中,看起來最相似的部分。

圖像識別

人臉識別技術(shù)經(jīng)過科學(xué)家多年的研究和發(fā)展,已經(jīng)形成了多種研究方向和更多種的研究方法,如果我們梳理一下,主要包括基于幾何特征的方法、基于模板的方法、基于模型的方法以及其他方法。

基于幾何特征的方法是比較早期、傳統(tǒng)的方法了,它主要是研究人臉眼睛、鼻子等器官的形狀和結(jié)構(gòu)關(guān)系的幾何描述,以此作為人臉識別的重要特征。

基于模板的方法基本思想是拿已有的模板和圖像中同樣大小的區(qū)域去比對,包括基于相關(guān)匹配的方法、特征臉方法、線性判別分析方法、神經(jīng)網(wǎng)絡(luò)方法等。

基于模型的方法的方向是對人臉的顯著特征進(jìn)行特征點(diǎn)定位,然后進(jìn)行人臉的編碼,再利用相應(yīng)的模型進(jìn)行處理實(shí)現(xiàn)人臉識別,例如隱馬爾柯夫模型,主動(dòng)形狀模型和主動(dòng)外觀模型的方法等。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 圖像處理
    +關(guān)注

    關(guān)注

    27

    文章

    1272

    瀏覽量

    56500
  • 人臉識別
    +關(guān)注

    關(guān)注

    76

    文章

    4000

    瀏覽量

    81578

原文標(biāo)題:工控幫-7月電氣工程師班火熱報(bào)名中!

文章出處:【微信號:GKYXT1508,微信公眾號:工控云學(xué)堂】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    人臉識別技術(shù)的可行性在于矛盾具有什么性

    矛盾的普遍性角度,探討人臉識別技術(shù)的可行性,并分析其在實(shí)際應(yīng)用中所面臨的矛盾和問題。 二、人臉識別技術(shù)概述 人臉
    的頭像 發(fā)表于 07-04 09:28 ?365次閱讀

    人臉識別技術(shù)的優(yōu)缺點(diǎn)有哪些

    人臉識別技術(shù)是一種基于人臉特征信息進(jìn)行身份識別的生物識別技術(shù)。隨著計(jì)算機(jī)視覺、深度學(xué)習(xí)等技術(shù)的發(fā)展,人臉
    的頭像 發(fā)表于 07-04 09:25 ?1442次閱讀

    人臉識別技術(shù)將應(yīng)用在哪些領(lǐng)域

    人臉識別技術(shù)是一種基于人臉特征信息進(jìn)行身份識別的生物識別技術(shù)。隨著科技的發(fā)展,人臉
    的頭像 發(fā)表于 07-04 09:24 ?1808次閱讀

    人臉識別技術(shù)的原理介紹

    的應(yīng)用。本文將詳細(xì)介紹人臉識別技術(shù)的原理,包括人臉檢測、人臉特征提取、人臉匹配等關(guān)鍵步驟。 一、人臉
    的頭像 發(fā)表于 07-04 09:22 ?880次閱讀

    如何設(shè)計(jì)人臉識別的神經(jīng)網(wǎng)絡(luò)

    人臉識別技術(shù)是一種基于人臉特征信息進(jìn)行身份識別的技術(shù),廣泛應(yīng)用于安全監(jiān)控、身份認(rèn)證、智能門禁等領(lǐng)域。神經(jīng)網(wǎng)絡(luò)是實(shí)現(xiàn)人臉
    的頭像 發(fā)表于 07-04 09:20 ?440次閱讀

    人臉識別模型訓(xùn)練流程

    人臉識別模型訓(xùn)練流程是計(jì)算機(jī)視覺領(lǐng)域中的一項(xiàng)重要技術(shù)。本文將詳細(xì)介紹人臉識別模型的訓(xùn)練流程,包括數(shù)據(jù)準(zhǔn)備、模型選擇、模型訓(xùn)練、模型評估和應(yīng)用部署等環(huán)節(jié)。 數(shù)據(jù)準(zhǔn)備 數(shù)據(jù)是訓(xùn)練
    的頭像 發(fā)表于 07-04 09:19 ?655次閱讀

    人臉識別模型訓(xùn)練是什么意思

    人臉識別模型訓(xùn)練是指通過大量的人臉數(shù)據(jù),使用機(jī)器學(xué)習(xí)或深度學(xué)習(xí)算法,訓(xùn)練出一個(gè)能夠識別和分類人臉的模型。這個(gè)模型可以應(yīng)用于各種場景,如安防監(jiān)
    的頭像 發(fā)表于 07-04 09:16 ?392次閱讀

    人臉檢測和人臉識別的區(qū)別是什么

    人臉檢測和人臉識別是計(jì)算機(jī)視覺領(lǐng)域的兩個(gè)重要技術(shù),它們在許多應(yīng)用場景中都有廣泛的應(yīng)用,如安全監(jiān)控、身份驗(yàn)證、社交媒體等。盡管它們在某些方面有相似之處,但它們之間存在一些關(guān)鍵的區(qū)別。本文將詳細(xì)
    的頭像 發(fā)表于 07-03 14:49 ?676次閱讀

    人臉檢測與識別的方法有哪些

    人臉檢測與識別是計(jì)算機(jī)視覺領(lǐng)域中的一個(gè)重要研究方向,具有廣泛的應(yīng)用前景,如安全監(jiān)控、身份認(rèn)證、智能視頻分析等。本文將詳細(xì)介紹人臉檢測與識別的方法
    的頭像 發(fā)表于 07-03 14:45 ?556次閱讀

    請問esp who人臉識別的臉部信息如何保存在sd卡中?

    esp who人臉識別的臉部信息如何保存在sd卡中?
    發(fā)表于 06-28 08:09

    人臉識別終端 10寸人臉機(jī)

    終端人臉識別
    深圳市遠(yuǎn)景達(dá)物聯(lián)網(wǎng)技術(shù)有限公司
    發(fā)布于 :2024年04月22日 16:01:46

    人臉識別技術(shù)的原理是什么 人臉識別技術(shù)的特點(diǎn)有哪些

    人臉檢測是人臉識別的首要步驟。其目標(biāo)是在圖像或視頻中準(zhǔn)確地定位人臉的位置。人臉檢測算法常用的方法
    的頭像 發(fā)表于 02-18 13:52 ?1442次閱讀

    情感語音識別的研究方法與實(shí)踐

    一、引言 情感語音識別是指通過計(jì)算機(jī)技術(shù)和人工智能算法自動(dòng)識別和理解人類語音中的情感信息。為了提高情感語音識別的準(zhǔn)確性,本文將探討情感語音識別的研究
    的頭像 發(fā)表于 11-16 16:26 ?756次閱讀

    什么是人臉識別門禁系統(tǒng),它能用來做什么?

    智能門禁建設(shè)在近些年已形成主流,不少出入卡口或單元門都在不同程度地進(jìn)行門禁信息化建設(shè)優(yōu)化,比如把人臉識別門禁系統(tǒng)應(yīng)用到一些旅游景區(qū)、小區(qū)住宅、辦公寫字樓以及學(xué)校等出入的場所并為其提供門禁管理功能
    的頭像 發(fā)表于 11-06 15:21 ?2801次閱讀
    什么是<b class='flag-5'>人臉</b><b class='flag-5'>識別</b>門禁系統(tǒng),它能用來做什么?

    人臉識別依然火熱,AI技術(shù)進(jìn)化帶來全新挑戰(zhàn)

    電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)人臉識別,是基于人的臉部特征信息進(jìn)行身份識別的一種生物識別技術(shù)。用攝像機(jī)或攝像頭采集含有人臉的圖像或視頻流,并
    的頭像 發(fā)表于 10-28 01:34 ?2420次閱讀
    <b class='flag-5'>人臉</b><b class='flag-5'>識別</b>依然火熱,AI技術(shù)進(jìn)化帶來全新挑戰(zhàn)