国产午夜福利在线永久视频 ,亚洲乱轮视频

在目標(biāo)檢測(cè)領(lǐng)域，可以劃分為人臉檢測(cè)與通用目標(biāo)檢測(cè)，往往人臉這方面會(huì)有專門的算法（包括人臉檢測(cè)、人臉識(shí)別、人臉其他屬性的識(shí)別等），并且和通用目標(biāo)檢測(cè)（識(shí)別）會(huì)有一定的差別。這主要來(lái)源于人臉的特殊性（譬如有時(shí)候目標(biāo)比較小、人臉之間特征不明顯、遮擋問(wèn)題等），本文將主要從人臉檢測(cè)方面來(lái)講解目標(biāo)檢測(cè)。

目前主要的人臉檢測(cè)方法分類

當(dāng)前，人臉檢測(cè)方法主要包含兩個(gè)區(qū)域：傳統(tǒng)人臉檢測(cè)算法和基于深度學(xué)習(xí)的人臉檢測(cè)算法。傳統(tǒng)人臉檢測(cè)算法主要可以分為 4 類：

基于知識(shí)的人臉檢測(cè)方法；

基于模型的人臉檢測(cè)方法；

基于特征的人臉檢測(cè)方法；

基于外觀的人臉檢測(cè)方法。

2006 年，Hinton 首次提出深度學(xué)習(xí)（Deep Learning）的概念，它是通過(guò)組合低層的特征形成更高層的抽象特征。隨后研究者將深度學(xué)習(xí)應(yīng)用在人臉檢測(cè)領(lǐng)域，主要集中在基于卷積神經(jīng)網(wǎng)絡(luò)（CNN）的人臉檢測(cè)研究，如基于級(jí)聯(lián)卷積神經(jīng)網(wǎng)絡(luò)的人臉檢測(cè)（Cascade CNN）、基于多任務(wù)卷積神經(jīng)網(wǎng)絡(luò)的人臉檢測(cè)（MTCNN）、Facebox 等，很大程度上提高了人臉檢測(cè)的魯棒性。

當(dāng)然，像Faster RCNN、YOLO、SSD等通用目標(biāo)檢測(cè)算法也有用在人臉檢測(cè)領(lǐng)域，也可以實(shí)現(xiàn)比較不錯(cuò)的結(jié)果，但是和專門人臉檢測(cè)算法比還是有差別。

如何檢測(cè)圖片中不同大小的人臉？

傳統(tǒng)人臉檢測(cè)算法中針對(duì)不同大小人臉主要有兩個(gè)策略：

縮放圖片的大?。▓D像金字塔如圖 1 所示）；

圖1 圖像金字塔

縮放滑動(dòng)窗的大?。ㄈ鐖D 2 所示）。

圖 2 縮放滑動(dòng)窗口

基于深度學(xué)習(xí)的人臉檢測(cè)算法中，針對(duì)不同大小人臉主要也有兩個(gè)策略，但和傳統(tǒng)人臉檢測(cè)算法有點(diǎn)區(qū)別，主要包括：

縮放圖片大?。?/strong>不過(guò)也可以通過(guò)縮放滑動(dòng)窗的方式，基于深度學(xué)習(xí)的滑動(dòng)窗人臉檢測(cè)方式效率會(huì)很慢存在多次重復(fù)卷積，所以要采用全卷積神經(jīng)網(wǎng)絡(luò)（FCN），用 FCN 將不能用滑動(dòng)窗的方法。

通過(guò) anchor box 的方法：如圖 3 所示，不要和圖 2 混淆，這里是通過(guò)特征圖預(yù)測(cè)原圖的 anchorbox 區(qū)域，具體在 Facebox 中有描述。

圖 3 anchor box

如何設(shè)定算法檢測(cè)最小人臉尺寸？

主要是看滑動(dòng)窗的最小窗口和 anchorbox 的最小窗口。

滑動(dòng)窗的方法

假設(shè)通過(guò) 12×12 的滑動(dòng)窗，不對(duì)原圖做縮放的話，就可以檢測(cè)原圖中 12×12 的最小人臉。

但是往往通常給定最小人臉 a=40、或者 a=80，以這么大的輸入訓(xùn)練 CNN 進(jìn)行人臉檢測(cè)不太現(xiàn)實(shí)，速度會(huì)很慢，并且下一次需求最小人臉 a=30*30 又要去重新訓(xùn)練，通常還會(huì)是 12×12 的輸入，為滿足最小人臉框 a，只需要在檢測(cè)的時(shí)候?qū)υ瓐D進(jìn)行縮放即可：w=w×12/a。

anchorbox 的方法

原理類似，這里主要看 anchorbox 的最小 box，通過(guò)可以通過(guò)縮放輸入圖片實(shí)現(xiàn)最小人臉的設(shè)定。

如何定位人臉的位置

滑動(dòng)窗的方式：

滑動(dòng)窗的方式是基于分類器識(shí)別為人臉的框的位置確定最終的人臉。

圖 4 滑動(dòng)窗

FCN 的方式：

通過(guò)特征圖映射到原圖的方式確定最終識(shí)別為人臉的位置，特征圖映射到原圖人臉框是要看特征圖相比較于原圖有多少次縮放（縮放主要查看卷積的步長(zhǎng)和池化層）。

假設(shè)特征圖上(2,3)的點(diǎn)，可粗略計(jì)算縮放比例為 8 倍，原圖中的點(diǎn)應(yīng)該是(16,24)；如果訓(xùn)練的 FCN 為 12*12 的輸入，對(duì)于原圖框位置應(yīng)該是(16,24,12,12)。

當(dāng)然這只是估計(jì)位置，具體的在構(gòu)建網(wǎng)絡(luò)時(shí)要加入回歸框的預(yù)測(cè)，主要是相對(duì)于原圖框的一個(gè)平移與縮放。

通過(guò) anchor box 的方式：

通過(guò)特征圖映射到圖的窗口，通過(guò)特征圖映射到原圖到多個(gè)框的方式確定最終識(shí)別為人臉的位置。

如何通過(guò)一個(gè)人臉的多個(gè)框確定最終人臉框位置？

圖 5 通過(guò) NMS 得到最終的人臉位置

NMS 改進(jìn)版本有很多，最原始的 NMS 就是判斷兩個(gè)框的交集。如果交集大于設(shè)定的閾值，將刪除其中一個(gè)框。

那么兩個(gè)框應(yīng)該怎么選擇刪除哪一個(gè)呢？因?yàn)槟Ｐ洼敵鲇懈怕手?，一般?huì)優(yōu)選選擇概率小的框刪除。

基于級(jí)聯(lián)卷積神經(jīng)網(wǎng)絡(luò)的人臉檢測(cè)（Cascade CNN）

Cascade CNN 的框架結(jié)構(gòu)是什么？

級(jí)聯(lián)結(jié)構(gòu)中有 6 個(gè) CNN，3 個(gè) CNN 用于人臉?lè)侨四樁诸?，另?3 個(gè) CNN 用于人臉區(qū)域的邊框校正。

給定一幅圖像，12-net 密集掃描整幅圖片，拒絕 90% 以上的窗口。剩余的窗口輸入到 12-calibration-net 中調(diào)整大小和位置，以接近真實(shí)目標(biāo)。接著輸入到 NMS 中，消除高度重疊窗口。下面網(wǎng)絡(luò)與上面類似。

Cascade CNN 人臉校驗(yàn)?zāi)K原理是什么？

該網(wǎng)絡(luò)用于窗口校正，使用三個(gè)偏移變量：

Xn:水平平移量，Yn:垂直平移量，Sn:寬高比縮放。

候選框口(x,y,w,h)中，(x,y)表示左上點(diǎn)坐標(biāo)，(w,h)表示寬和高。

我們要將窗口的控制坐標(biāo)調(diào)整為：

這項(xiàng)工作中，我們有種模式。偏移向量三個(gè)參數(shù)包括以下值：

同時(shí)對(duì)偏移向量三個(gè)參數(shù)進(jìn)行校正。

訓(xùn)練樣本應(yīng)該如何準(zhǔn)備？

人臉樣本；

非人臉樣本。

級(jí)聯(lián)的好處

最初階段的網(wǎng)絡(luò)可以比較簡(jiǎn)單，判別閾值可以設(shè)得寬松一點(diǎn)，這樣就可以在保持較高召回率的同時(shí)排除掉大量的非人臉窗口；

最后階段網(wǎng)絡(luò)為了保證足夠的性能，因此一般設(shè)計(jì)的比較復(fù)雜，但由于只需要處理前面剩下的窗口，因此可以保證足夠的效率；

級(jí)聯(lián)的思想可以幫助我們?nèi)ソM合利用性能較差的分類器，同時(shí)又可以獲得一定的效率保證。

基于多任務(wù)卷積神經(jīng)網(wǎng)絡(luò)的人臉檢測(cè)（MTCNN）

MTCNN 模型有三個(gè)子網(wǎng)絡(luò)，分別是 P-Net,R-Net,O-Net。

為了檢測(cè)不同大小的人臉，開始需要構(gòu)建圖像金字塔，先經(jīng)過(guò) PNet 模型，輸出人臉類別和邊界框（邊界框的預(yù)測(cè)為了對(duì)特征圖映射到原圖的框平移和縮放得到更準(zhǔn)確的框），將識(shí)別為人臉的框映射到原圖框位置可以獲取 patch，之后每一個(gè) patch 通過(guò) resize 的方式輸入到 RNet，識(shí)別為人臉的框并且預(yù)測(cè)更準(zhǔn)確的人臉框，最后 RNet 識(shí)別為人臉的的每一個(gè) patch 通過(guò) resize 的方式輸入到 ONet，跟 RNet 類似，關(guān)鍵點(diǎn)是為了在訓(xùn)練集有限情況下使模型更魯棒。

還要注意一點(diǎn)：構(gòu)建圖像金字塔的的縮放比例要保留，為了將邊界框映射到最開始原圖上。

Facebox

（1）Rapidly Digested Convolutional Layers（RDCL）

在網(wǎng)絡(luò)前期，使用 RDCL 快速的縮小 feature map 的大小。主要設(shè)計(jì)原則如下：

Conv1, Pool1, Conv2 和 Pool2 的 stride 分別是 4, 2, 2 和 2。這樣整個(gè) RDCL 的 stride 就是 32，可以很快把 feature map 的尺寸變小。

卷積（或 pooling）核太大速度就慢，太小覆蓋信息又不足。權(quán)衡之后，將 Conv1, Pool1, Conv2 和 Pool2 的核大小分別設(shè)為 7x7,3x3,5x5,3x3。

使用 CReLU 來(lái)保證輸出維度不變的情況下，減少卷積核數(shù)量。

（2）Multiple Scale Convolutional Layers（MSCL）

在網(wǎng)絡(luò)后期，使用 MSCL 更好地檢測(cè)不同尺度的人臉。主要設(shè)計(jì)原則有：

類似于 SSD，在網(wǎng)絡(luò)的不同層進(jìn)行檢測(cè)；

采用 Inception 模塊。由于 Inception 包含多個(gè)不同的卷積分支，因此可以進(jìn)一步使得感受野多樣化。

（3）Anchor densification strategy

為了 anchor 密度均衡，可以對(duì)密度不足的 anchor 以中心進(jìn)行偏移加倍，如下圖所示：

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

人臉識(shí)別

人臉識(shí)別

+關(guān)注

關(guān)注
76

文章
4000

瀏覽量
81596

深度學(xué)習(xí)

深度學(xué)習(xí)

+關(guān)注

關(guān)注
73

文章
5449

瀏覽量
120814

原文標(biāo)題：深度學(xué)習(xí)在人臉檢測(cè)中的應(yīng)用 | CSDN 博文精選

文章出處：【微信號(hào)：rgznai100，微信公眾號(hào)：rgznai100】歡迎添加關(guān)注！文章轉(zhuǎn)載請(qǐng)注明出處。

收藏人收藏

掃一掃，分享給好友

復(fù)制鏈接分享

評(píng)論

發(fā)布評(píng)論請(qǐng)先登錄

相關(guān)推薦

GPU深度學(xué)習(xí)應(yīng)用案例

GPU在深度學(xué)習(xí)中的應(yīng)用廣泛且重要，以下是一些GPU深度學(xué)習(xí)應(yīng)用案例：一、圖像識(shí)別圖像識(shí)別是

發(fā)表于 10-27 11:13 ?184次閱讀

深度偽造人臉檢測(cè)項(xiàng)目

各位 AI 愛好者們，準(zhǔn)備好通過(guò)各種 AI 技術(shù)來(lái)應(yīng)對(duì)一個(gè)迫切需要被解決的全球問(wèn)題了嗎？MathWorks 誠(chéng)邀您參加 2025 IEEE Signal Processing Cup 挑戰(zhàn)賽：“野外深度偽造人臉檢測(cè)”（DFWil

發(fā)表于 10-17 10:46 ?156次閱讀

深度識(shí)別人臉識(shí)別有什么重要作用嗎

深度學(xué)習(xí)人臉識(shí)別技術(shù)是人工智能領(lǐng)域的一個(gè)重要分支，它利用深度學(xué)習(xí)算法來(lái)識(shí)別和驗(yàn)證個(gè)人身份。這項(xiàng)技術(shù)在

發(fā)表于 09-10 14:55 ?297次閱讀

深度識(shí)別人臉識(shí)別在任務(wù)中為什么有很強(qiáng)大的建模能力

深度學(xué)習(xí)人臉識(shí)別技術(shù)是人工智能領(lǐng)域中的一個(gè)重要分支，它利用深度學(xué)習(xí)算法來(lái)識(shí)別和驗(yàn)證人臉。這項(xiàng)技術(shù)

發(fā)表于 09-10 14:53 ?227次閱讀

基于Python的深度學(xué)習(xí)人臉識(shí)別方法

基于Python的深度學(xué)習(xí)人臉識(shí)別方法是一個(gè)涉及多個(gè)技術(shù)領(lǐng)域的復(fù)雜話題，包括計(jì)算機(jī)視覺、深度學(xué)習(xí)、以及圖像處理等。在這里，我將概述一個(gè)基本的

發(fā)表于 07-14 11:52 ?1070次閱讀

深度學(xué)習(xí)中的時(shí)間序列分類方法

的發(fā)展，基于深度學(xué)習(xí)的TSC方法逐漸展現(xiàn)出其強(qiáng)大的自動(dòng)特征提取和分類能力。本文將從多個(gè)角度對(duì)深度學(xué)習(xí)在時(shí)間序列分類

發(fā)表于 07-09 15:54 ?564次閱讀

深度學(xué)習(xí)中的無(wú)監(jiān)督學(xué)習(xí)方法綜述

應(yīng)用中往往難以實(shí)現(xiàn)。因此，無(wú)監(jiān)督學(xué)習(xí)在深度學(xué)習(xí)中扮演著越來(lái)越重要的角色。本文旨在綜述

發(fā)表于 07-09 10:50 ?303次閱讀

深度學(xué)習(xí)在工業(yè)機(jī)器視覺檢測(cè)中的應(yīng)用

隨著深度學(xué)習(xí)技術(shù)的快速發(fā)展，其在工業(yè)機(jī)器視覺檢測(cè)中的應(yīng)用日益廣泛，并展現(xiàn)出巨大的潛力。工業(yè)機(jī)器視覺檢測(cè)

發(fā)表于 07-08 10:40 ?822次閱讀

基于AI深度學(xué)習(xí)的缺陷檢測(cè)系統(tǒng)

在工業(yè)生產(chǎn)中，缺陷檢測(cè)是確保產(chǎn)品質(zhì)量的關(guān)鍵環(huán)節(jié)。傳統(tǒng)的人工檢測(cè)方法不僅效率低下，且易受人為因素影響，導(dǎo)致誤檢和漏檢問(wèn)題頻發(fā)。隨著人工智能技術(shù)的飛速發(fā)展，特別是深度

發(fā)表于 07-08 10:30 ?817次閱讀

深度學(xué)習(xí)在視覺檢測(cè)中的應(yīng)用

深度學(xué)習(xí)是機(jī)器學(xué)習(xí)領(lǐng)域中的一個(gè)重要分支，其核心在于通過(guò)構(gòu)建具有多層次的神經(jīng)網(wǎng)絡(luò)模型，使計(jì)算機(jī)能夠從大量數(shù)據(jù)中自動(dòng)學(xué)習(xí)并提取特征，進(jìn)而實(shí)現(xiàn)對(duì)復(fù)

發(fā)表于 07-08 10:27 ?531次閱讀

基于深度學(xué)習(xí)的小目標(biāo)檢測(cè)

在計(jì)算機(jī)視覺領(lǐng)域，目標(biāo)檢測(cè)一直是研究的熱點(diǎn)和難點(diǎn)之一。特別是在小目標(biāo)檢測(cè)方面，由于小目標(biāo)在圖像中所占比例小、特征不明顯，使得

發(fā)表于 07-04 17:25 ?651次閱讀

人臉檢測(cè)模型有哪些

人臉檢測(cè)是計(jì)算機(jī)視覺領(lǐng)域的一個(gè)重要研究方向，它涉及到從圖像或視頻中檢測(cè)出人臉的位置和大小。隨著深度學(xué)習(xí)

發(fā)表于 07-03 17:05 ?815次閱讀

人臉檢測(cè)和人臉識(shí)別的區(qū)別是什么

人臉檢測(cè)和人臉識(shí)別是計(jì)算機(jī)視覺領(lǐng)域的兩個(gè)重要技術(shù)，它們在許多應(yīng)用場(chǎng)景中都有廣泛的應(yīng)用，如安全監(jiān)控、身份驗(yàn)證、社交媒體等。盡管它們在某些方面有

發(fā)表于 07-03 14:49 ?732次閱讀

深度學(xué)習(xí)在自動(dòng)駕駛中的關(guān)鍵技術(shù)

隨著人工智能技術(shù)的飛速發(fā)展，自動(dòng)駕駛技術(shù)作為其中的重要分支，正逐漸走向成熟。在自動(dòng)駕駛系統(tǒng)中，深度學(xué)習(xí)技術(shù)發(fā)揮著至關(guān)重要的作用。它通過(guò)模擬人腦的學(xué)習(xí)

發(fā)表于 07-01 11:40 ?583次閱讀

GPU在深度學(xué)習(xí)中的應(yīng)用與優(yōu)勢(shì)

人工智能的飛速發(fā)展，深度學(xué)習(xí)作為其重要分支，正在推動(dòng)著諸多領(lǐng)域的創(chuàng)新。在這個(gè)過(guò)程中，GPU扮演著不可或缺的角色。就像超級(jí)英雄電影中的主角一樣，GPU

發(fā)表于 12-06 08:27 ?1159次閱讀

搜索歷史

深度學(xué)習(xí)在人臉檢測(cè)中的應(yīng)用

評(píng)論

GPU深度學(xué)習(xí)應(yīng)用案例

深度偽造人臉檢測(cè)項(xiàng)目

深度識(shí)別人臉識(shí)別有什么重要作用嗎

深度識(shí)別人臉識(shí)別在任務(wù)中為什么有很強(qiáng)大的建模能力

基于Python的深度學(xué)習(xí)人臉識(shí)別方法

深度學(xué)習(xí)中的時(shí)間序列分類方法

深度學(xué)習(xí)中的無(wú)監(jiān)督學(xué)習(xí)方法綜述

深度學(xué)習(xí)在工業(yè)機(jī)器視覺檢測(cè)中的應(yīng)用

基于AI深度學(xué)習(xí)的缺陷檢測(cè)系統(tǒng)

深度學(xué)習(xí)在視覺檢測(cè)中的應(yīng)用

基于深度學(xué)習(xí)的小目標(biāo)檢測(cè)

人臉檢測(cè)模型有哪些

人臉檢測(cè)和人臉識(shí)別的區(qū)別是什么

深度學(xué)習(xí)在自動(dòng)駕駛中的關(guān)鍵技術(shù)

GPU在深度學(xué)習(xí)中的應(yīng)用與優(yōu)勢(shì)