卷積神經(jīng)網(wǎng)絡(luò)目標(biāo)檢測中的YOLO算法詳解

YOLO的全拼是You Only Look Once，顧名思義就是只看一次，把目標(biāo)區(qū)域預(yù)測和目標(biāo)類別預(yù)測合二為一，作者將目標(biāo)檢測任務(wù)看作目標(biāo)區(qū)域預(yù)測和類別預(yù)測的回歸問題。該方法采用單個(gè)神經(jīng)網(wǎng)絡(luò)直接預(yù)測物品邊界和類別概率，實(shí)現(xiàn)端到端的物品檢測。因此識別性能有了很大提升，達(dá)到每秒45幀，而在快速YOLO(Fast YOLO，卷積層更少)中，可以達(dá)到每秒155幀。

當(dāng)前最好系統(tǒng)相比，YOLO目標(biāo)區(qū)域定位誤差更大，但是背景預(yù)測的假陽性優(yōu)于當(dāng)前最好的方法。

一、引言

人類瞥了一眼圖像，立即知道圖像中的物體，它們在哪里以及它們?nèi)绾蜗嗷プ饔?。人類視覺系統(tǒng)快速而準(zhǔn)確，使我們能夠執(zhí)行復(fù)雜的任務(wù)，比如汽車駕駛。

傳統(tǒng)的目標(biāo)檢測系統(tǒng)利用分類器來執(zhí)行檢測。為了檢測對象，這些系統(tǒng)在測試圖片的不同位置不同尺寸大小采用分類器對其進(jìn)行評估。如目標(biāo)檢測系統(tǒng)采用deformable parts models (DPM)方法，通過滑動框方法提出目標(biāo)區(qū)域，然后采用分類器來實(shí)現(xiàn)識別。近期的R-CNN類方法采用region proposal methods，首先生成潛在的bounding boxes，然后采用分類器識別這些bounding boxes區(qū)域。最后通過post-processing來去除重復(fù)bounding boxes來進(jìn)行優(yōu)化。這類方法流程復(fù)雜，存在速度慢和訓(xùn)練困難的問題。

我們將目標(biāo)檢測問題轉(zhuǎn)換為直接從圖像中提取bounding boxes和類別概率的單個(gè)回歸問題，只需一眼（you only look once，YOLO）即可檢測目標(biāo)類別和位置。

YOLO簡潔明了：見下圖。YOLO算法采用單個(gè)卷積神經(jīng)網(wǎng)絡(luò)來預(yù)測多個(gè)bounding boxes和類別概率。與傳統(tǒng)的物體檢測方法相比，這種統(tǒng)一模型具有以下優(yōu)點(diǎn)：

YOLO檢測系統(tǒng)。用YOLO處理圖像簡單直接。我們的系統(tǒng)（1）將輸入圖像調(diào)整為448×448，（2）在圖像上運(yùn)行單個(gè)卷積網(wǎng)絡(luò)，以及（3）由模型的置信度對所得到的檢測進(jìn)行閾值處理。

非?？臁OLO預(yù)測流程簡單，速度很快。我們的基礎(chǔ)版在Titan X GPU上可以達(dá)到45幀/s；快速版可以達(dá)到150幀/s。因此，YOLO可以實(shí)現(xiàn)實(shí)時(shí)檢測。

YOLO采用全圖信息來進(jìn)行預(yù)測。與滑動窗口方法和region proposal-based方法不同，YOLO在訓(xùn)練和預(yù)測過程中可以利用全圖信息。Fast R-CNN檢測方法會錯(cuò)誤的將背景中的斑塊檢測為目標(biāo)，原因在于Fast R-CNN在檢測中無法看到全局圖像。相對于Fast R-CNN，YOLO背景預(yù)測錯(cuò)誤率低一半。

YOLO可以學(xué)習(xí)到目標(biāo)的概括信息（generalizable representation），具有一定普適性。我們采用自然圖片訓(xùn)練YOLO，然后采用藝術(shù)圖像來預(yù)測。YOLO比其它目標(biāo)檢測方法（DPM和R-CNN）準(zhǔn)確率高很多。

在準(zhǔn)確性上，YOLO算法仍然落后于最先進(jìn)的檢測系統(tǒng)。雖然它可以快速識別圖像中的對象，但它很難精確定位某些對象，特別是小對象。

二統(tǒng)一檢測（Unified Detection）

我們將目標(biāo)檢測統(tǒng)一到一個(gè)神經(jīng)網(wǎng)絡(luò)。我們的網(wǎng)絡(luò)使用整個(gè)圖像中的特征來預(yù)測每個(gè)邊界框。它也是同時(shí)預(yù)測圖像的所有類的所有邊界框。這意味著我們的網(wǎng)絡(luò)學(xué)習(xí)到的完整圖像和圖中所有的對象.YOLO設(shè)計(jì)可實(shí)現(xiàn)端到端訓(xùn)練和實(shí)時(shí)的速度，同時(shí)保持較高的平均精度。

YOLO首先將圖像分為S×S的格子。如果一個(gè)目標(biāo)的中心落入格子，該格子就負(fù)責(zé)檢測該目標(biāo)。每一個(gè)網(wǎng)格中預(yù)測B個(gè)Bounding box 和置信值（confidence score）。這些置信度分?jǐn)?shù)反映了該模型對盒子是否包含目標(biāo)的信心，以及它預(yù)測盒子的準(zhǔn)確程度。然后，我們定義置信值為：

如果沒有目標(biāo)，置信值為零。另外，我們希望置信度分?jǐn)?shù)等于預(yù)測框與真實(shí)值之間聯(lián)合部分的交集（IOU）。

每一個(gè)bounding box包含5個(gè)值：x，y，w，h和confidence。（x，y）坐標(biāo)表示邊界框相對于網(wǎng)格單元邊界框的中心。寬度和高度是相對于整張圖像預(yù)測的。confidence表示預(yù)測的box與實(shí)際邊界框之間的IOU。每個(gè)網(wǎng)格單元還預(yù)測C個(gè)條件類別概率：

這些概率是以網(wǎng)格包含目標(biāo)為條件的，每個(gè)網(wǎng)格單元我們只預(yù)測的一組類別概率，而不管邊界框的的數(shù)量B時(shí)多少。

在測試時(shí)，我們乘以條件類概率和單個(gè)盒子的置信度預(yù)測：

這些分?jǐn)?shù)編碼了該類出現(xiàn)在框中的概率以及預(yù)測框擬合目標(biāo)的程度。。在PASCAL VOC數(shù)據(jù)集上評價(jià)時(shí)，我們采用S=7,B=2，C=20（該數(shù)據(jù)集包含20個(gè)類別），最終預(yù)測結(jié)果為7×7×30(B*5+C)的tensor。

模型。?我們的系統(tǒng)將檢測建模為回歸問題。它將圖像分成SxS的網(wǎng)絡(luò)，并且每個(gè)網(wǎng)格單元預(yù)測B個(gè)邊界框，這些邊界框的置信度以及C個(gè)類別概率，這些預(yù)測被編碼為SxSx（B*5+C）的張量。

1、網(wǎng)絡(luò)模型

我們使用卷積神經(jīng)網(wǎng)絡(luò)來實(shí)現(xiàn)YOLO算法，并在Pascal VOC檢測數(shù)據(jù)集上進(jìn)行評估。網(wǎng)絡(luò)的初始卷積層從圖像中提取特征，而全連接層用來預(yù)測輸出概率和坐標(biāo)。

我們的網(wǎng)絡(luò)架構(gòu)受到GoogLeNet圖像分類模型的啟發(fā)。我們的網(wǎng)絡(luò)有24個(gè)卷積層，后面是2個(gè)全連接層。我們使用1x1降維層，后面是3x3卷積層，這與Lin等人類似，而不是GoogLeNet使用的Inception模塊。我們在ImageNet分類任務(wù)上以一半的分辨率(224x224的輸入圖像）預(yù)訓(xùn)練卷積層，然后將分辨率加倍來進(jìn)行檢測。完整的網(wǎng)絡(luò)如圖所示。

架構(gòu)。我們的檢測網(wǎng)絡(luò)有24個(gè)卷積層，其次是2個(gè)全連接層。交替1x1卷積層減少了前面層的特征空間。我們在ImageNet分類任務(wù)上以一半的分辨率(224x224的輸入圖像)預(yù)訓(xùn)練卷積層，然后將分辨率加倍來進(jìn)行檢測。

我們還訓(xùn)練了快速版本的YOLO，旨在推動快速目標(biāo)檢測的界限?？焖資OLO使用具有較少卷積層（9層而不是24層）的神經(jīng)網(wǎng)絡(luò)，在這些層中使用較少的濾波器。除了網(wǎng)絡(luò)規(guī)模之外，YOLO和Fast YOLO的所有訓(xùn)練和測試參數(shù)都是相同的。

我們網(wǎng)絡(luò)的最終輸出是7x7x30的預(yù)測張量。

2、訓(xùn)練

我們在ImageNet 1000類競賽數(shù)據(jù)集上預(yù)訓(xùn)練我們的卷積層。對于預(yù)訓(xùn)練，我們使用上圖中的前20個(gè)卷積層，外加平均池化層和全連接層。我們對這個(gè)網(wǎng)絡(luò)進(jìn)行了大約一周的訓(xùn)練，并且在ImageNet 2012驗(yàn)證集上獲得了單一裁剪圖像88%的top-5準(zhǔn)確率，與Caffe模型池中的GoogLeNet模型相當(dāng)。我們使用Darknet框架進(jìn)行所有的訓(xùn)練和推斷。

然后我們轉(zhuǎn)換模型來執(zhí)行檢測。Ren等人表明，預(yù)訓(xùn)練網(wǎng)絡(luò)中增加卷積層和連接層可以提高性能。按照他們的例子，我們添加了四個(gè)卷積層和兩個(gè)全連接層，并且具有隨機(jī)初始化的權(quán)重。檢測通常需要細(xì)粒度的視覺信息，因此我們將網(wǎng)絡(luò)的輸入分辨率從224x224變?yōu)?48x448。

我們的最后一層預(yù)測類概率和邊界框坐標(biāo)。我們通過圖像寬度和高度來規(guī)范邊界框的寬度和高度，使它們落在0和1之間。我們將邊界框x和y坐標(biāo)參數(shù)化為特定網(wǎng)格單元位置的偏移量，所以它們邊界也在0和1之間。

我們對最后一層使用線性激活函數(shù)，所有其它層使用下面的漏泄修正線性激活：

我們優(yōu)化了模型輸出中的平方和誤差。我們使用平方和誤差，因?yàn)樗苋菀走M(jìn)行優(yōu)化，但是它并不完全符合我們最大化平均精度的目標(biāo)。分類誤差與定位誤差的權(quán)重是一樣的，這可能并不理想。另外，在每張圖像中，許多網(wǎng)格單元不包含任何對象。這將這些單元格的“置信度”分?jǐn)?shù)推向零，通常壓倒了包含目標(biāo)的單元格的梯度。這可能導(dǎo)致模型不穩(wěn)定，從而導(dǎo)致訓(xùn)練早期發(fā)散。

為了改善這一點(diǎn)，我們增加了邊界框坐標(biāo)預(yù)測損失，并減少了不包含目標(biāo)邊界框的置信度預(yù)測損失。我們使用兩個(gè)參數(shù)λcoord和λnoobj來完成這個(gè)工作。我們設(shè)置λcoord=5和λnoobj=5。

平方和誤差也可以在大盒子和小盒子中同樣加權(quán)誤差。我們的錯(cuò)誤指標(biāo)應(yīng)該反映出，大盒子小偏差的重要性不如小盒子小偏差的重要性。為了部分解決這個(gè)問題，我們直接預(yù)測邊界框?qū)挾群透叨鹊钠椒礁皇菍挾群透叨取?/p>

YOLO每個(gè)網(wǎng)格單元預(yù)測多個(gè)邊界框。在訓(xùn)練時(shí)，每個(gè)目標(biāo)我們只需要一個(gè)邊界框預(yù)測器來負(fù)責(zé)。我們指定一個(gè)預(yù)測器“負(fù)責(zé)”，根據(jù)哪個(gè)預(yù)測與真實(shí)值之間具有當(dāng)前最高的IOU來預(yù)測目標(biāo)。這導(dǎo)致邊界框預(yù)測器之間的專業(yè)化。每個(gè)預(yù)測器可以更好地預(yù)測特定大小，方向角，或目標(biāo)的類別，從而改善整體召回率。

在訓(xùn)練期間，我們優(yōu)化以下多部分損失函數(shù)：

其中1iobj表示目標(biāo)是否出現(xiàn)在網(wǎng)格單元i中(是為1，否為0，根據(jù)該單元實(shí)際上是否有目標(biāo)確定)，1ijobj表示網(wǎng)格單元i的第j個(gè)邊界框預(yù)測器“負(fù)責(zé)”該預(yù)測(如果該單元真有目標(biāo)，并且該邊界框IOU最大，則值為1，否為0)。

注意，如果目標(biāo)存在于該網(wǎng)格單元中（前面討論的條件類別概率），則損失函數(shù)僅懲罰分類錯(cuò)誤。如果預(yù)測器“負(fù)責(zé)”實(shí)際邊界框（即該網(wǎng)格單元中具有最高IOU的預(yù)測器），則它也僅懲罰邊界框坐標(biāo)錯(cuò)誤。

我們對Pascal VOC 2007和2012的訓(xùn)練和驗(yàn)證數(shù)據(jù)集進(jìn)行了大約135個(gè)迭代周期的網(wǎng)絡(luò)訓(xùn)練。在Pascal VOC 2012上進(jìn)行測試時(shí)，我們的訓(xùn)練包含了Pascal VOC 2007的測試數(shù)據(jù)。在整個(gè)訓(xùn)練過程中，我們使用了64個(gè)批大小，0.9的動量和0.0005的衰減。

我們的學(xué)習(xí)率方案如下：對于第一個(gè)迭代周期，我們慢慢地將學(xué)習(xí)率從0.001提高到0.01，如果我們從高學(xué)習(xí)率開始，我們的模型往往會由于不穩(wěn)定的梯度而發(fā)散。我們繼續(xù)以0.01的學(xué)習(xí)率訓(xùn)練75個(gè)迭代周期，然后用0.001學(xué)習(xí)率訓(xùn)練30個(gè)迭代周期，最后用0.0001的學(xué)習(xí)率訓(xùn)練30個(gè)迭代周期。

為了避免過度擬合，我們使用棄權(quán)和大量的數(shù)據(jù)增強(qiáng)。在第一個(gè)連接層之后，棄權(quán)層使用0.5的比例，防止層之間的互相適應(yīng)。對于數(shù)據(jù)增強(qiáng)，我們引入高達(dá)原始圖像20%的大小的隨機(jī)縮放和轉(zhuǎn)換。我們還在HSV色彩空間中使用高達(dá)1.5的因子來隨機(jī)調(diào)整圖像的曝光和飽和度。

3、預(yù)測

就像在訓(xùn)練中一樣，預(yù)測測試圖像的檢測只需要一次網(wǎng)絡(luò)評估。在Pascal VOC上，每張圖像上網(wǎng)絡(luò)預(yù)測98個(gè)邊界框和每個(gè)框的類別概率。YOLO在測試時(shí)非?？?，因?yàn)樗恍枰淮尉W(wǎng)絡(luò)評估，不像基于分類器的方法。

網(wǎng)格設(shè)計(jì)強(qiáng)化了邊界框預(yù)測中的空間多樣性。通常很明顯一個(gè)目標(biāo)落在哪一個(gè)網(wǎng)格單元中，而網(wǎng)絡(luò)只能為每個(gè)目標(biāo)預(yù)測一個(gè)邊界框。然而，一些大的目標(biāo)或靠近多個(gè)網(wǎng)格單元邊界的目標(biāo)可以被多個(gè)網(wǎng)格單元很好地定位。非極大值抑制可以用來修正這些多重檢測。對于R-CNN或DPM而言，性能不是關(guān)鍵的，非最大抑制會增加2%-3%的mAP。

4、YOLO的限制

YOLO的每一個(gè)網(wǎng)格只預(yù)測兩個(gè)邊界框，一種類別。這導(dǎo)致模型對相鄰目標(biāo)預(yù)測準(zhǔn)確率下降。因此，YOLO對成隊(duì)列的目標(biāo)（如一群鳥）識別準(zhǔn)確率較低。

由于我們的模型學(xué)習(xí)從數(shù)據(jù)中預(yù)測邊界框，因此它很難泛化到新的、不常見角度的目標(biāo)。我們的模型使用相對較粗糙的特征來預(yù)測邊界框，因?yàn)槲覀兊募軜?gòu)具有來自輸入圖像的多個(gè)下采樣層。

YOLO的損失函數(shù)會同樣的對待小邊界框與大邊界框的誤差。大邊界框的小誤差通常是良性的，但小邊界框的小誤差對IOU的影響要大得多。我們的主要錯(cuò)誤來源是不正確的定位。

三與其他目標(biāo)檢測算法對比

目標(biāo)檢測是計(jì)算機(jī)視覺中的核心問題。檢測流程通常從輸入圖像上（Haar，SIFT ，HOG ，卷積特征）提取一組魯棒特征開始。然后，分類器或定位器被用來識別特征空間中的目標(biāo)。這些分類器或定位器在整個(gè)圖像上或在圖像中的一些子區(qū)域上以滑動窗口的方式運(yùn)行。我們將YOLO檢測系統(tǒng)與幾種頂級檢測框架進(jìn)行比較，突出了關(guān)鍵的相似性和差異性。

可變形部件模型。可變形零件模型（DPM）使用滑動窗口方法進(jìn)行目標(biāo)檢測。DPM使用不相交的流程來提取靜態(tài)特征，對區(qū)域進(jìn)行分類，預(yù)測高評分區(qū)域的邊界框等。我們的系統(tǒng)用單個(gè)卷積神經(jīng)網(wǎng)絡(luò)替換所有這些不同的部分。網(wǎng)絡(luò)同時(shí)進(jìn)行特征提取，邊界框預(yù)測，非極大值抑制和上下文推理。代替靜態(tài)特征，網(wǎng)絡(luò)內(nèi)嵌地訓(xùn)練特征并為檢測任務(wù)優(yōu)化它們。我們的統(tǒng)一架構(gòu)導(dǎo)致了比DPM更快，更準(zhǔn)確的模型。

R-CNN。R-CNN及其變種使用區(qū)域提名而不是滑動窗口來查找圖像中的目標(biāo)。選擇性搜索產(chǎn)生潛在的邊界框，卷積網(wǎng)絡(luò)提取特征，SVM對邊界框進(jìn)行評分，線性模型調(diào)整邊界框，非極大值抑制消除重復(fù)檢測。這個(gè)復(fù)雜流程的每個(gè)階段都必須獨(dú)立地進(jìn)行精確調(diào)整，所得到的系統(tǒng)非常慢，測試時(shí)每張圖像需要超過40秒。

YOLO與R-CNN有一些相似之處。每個(gè)網(wǎng)格單元提出潛在的邊界框并使用卷積特征對這些框進(jìn)行評分。但是，我們的系統(tǒng)對網(wǎng)格單元提出進(jìn)行了空間限制，這有助于緩解對同一目標(biāo)的多次檢測。我們的系統(tǒng)還提出了更少的邊界框，每張圖像只有98個(gè)，而選擇性搜索則只有2000個(gè)左右。最后，我們的系統(tǒng)將這些單獨(dú)的組件組合成一個(gè)單一的，共同優(yōu)化的模型。

其它快速檢測器。Fast和Faster的R-CNN通過共享計(jì)算和使用神經(jīng)網(wǎng)絡(luò)替代選擇性搜索來提出區(qū)域加速R-CNN框架。雖然它們提供了比R-CNN更快的速度和更高的準(zhǔn)確度，但兩者仍然不能達(dá)到實(shí)時(shí)性能。

許多研究工作集中在加快DPM流程上。它們加速HOG計(jì)算，使用級聯(lián)，并將計(jì)算推動到GPU上。但是，實(shí)際上只有30Hz的DPM可以實(shí)時(shí)運(yùn)行。

YOLO不是試圖優(yōu)化大型檢測流程的單個(gè)組件，而是完全拋棄流程，被設(shè)計(jì)為快速檢測。

像人臉或行人等單類別的檢測器可以高度優(yōu)化，因?yàn)樗麄儽仨毺幚砀俚淖兓?。YOLO是一種通用的檢測器，可以學(xué)習(xí)同時(shí)檢測多個(gè)目標(biāo)。

Deep MultiBox。與R-CNN不同，Szegedy等人訓(xùn)練了一個(gè)卷積神經(jīng)網(wǎng)絡(luò)來預(yù)測感興趣區(qū)域，而不是使用選擇性搜索。MultiBox還可以通過用單類預(yù)測替換置信度預(yù)測來執(zhí)行單目標(biāo)檢測。然而，MultiBox無法執(zhí)行通用的目標(biāo)檢測，并且仍然只是一個(gè)較大的檢測流程中的一部分，需要進(jìn)一步的圖像塊分類。YOLO和MultiBox都使用卷積網(wǎng)絡(luò)來預(yù)測圖像中的邊界框，但是YOLO是一個(gè)完整的檢測系統(tǒng)。

OverFeat。Sermanet等人訓(xùn)練了一個(gè)卷積神經(jīng)網(wǎng)絡(luò)來執(zhí)行定位，并使該定位器進(jìn)行檢測。OverFeat高效地執(zhí)行滑動窗口檢測，但它仍然是一個(gè)不相交的系統(tǒng)。OverFeat優(yōu)化了定位，而不是檢測性能。像DPM一樣，定位器在進(jìn)行預(yù)測時(shí)只能看到局部信息。OverFeat不能推斷全局上下文，因此需要大量的后處理來產(chǎn)生連貫的檢測。

MultiGrasp。我們的工作在設(shè)計(jì)上類似于Redmon等的抓取檢測。我們對邊界框預(yù)測的網(wǎng)格方法是基于MultiGrasp系統(tǒng)抓取的回歸分析。然而，抓取檢測比目標(biāo)檢測任務(wù)要簡單得多。MultiGrasp只需要為包含一個(gè)目標(biāo)的圖像預(yù)測一個(gè)可以抓取的區(qū)域。不必估計(jì)目標(biāo)的大小，位置或目標(biāo)邊界或預(yù)測目標(biāo)的類別，只找到適合抓取的區(qū)域。YOLO預(yù)測圖像中多個(gè)類別的多個(gè)目標(biāo)的邊界框和類別概率。

四實(shí)驗(yàn)

首先，我們在PASCAL VOC 2007上比較YOLO和其它的實(shí)時(shí)檢測系統(tǒng)。為了理解YOLO和R-CNN變種之間的差異，我們探索了YOLO和R-CNN性能最高的版本之一Fast R-CNN在VOC 2007上錯(cuò)誤率。根據(jù)不同的誤差曲線，我們顯示YOLO可以用來重新評估Fast R-CNN檢測，并減少背景假陽性帶來的錯(cuò)誤，從而顯著提升性能。我們還展示了在VOC 2012上的結(jié)果，并與目前最先進(jìn)的方法比較了mAP。最后，在兩個(gè)藝術(shù)品數(shù)據(jù)集上我們顯示了YOLO可以比其它檢測器更好地泛化到新領(lǐng)域。

1、與其他實(shí)時(shí)系統(tǒng)的比較

目標(biāo)檢測方面的許多研究工作都集中在快速制定標(biāo)準(zhǔn)檢測流程上。然而，只有Sadeghi等實(shí)際上產(chǎn)生了一個(gè)實(shí)時(shí)運(yùn)行的檢測系統(tǒng)（每秒30幀或更好）。我們將YOLO與DPM的GPU實(shí)現(xiàn)進(jìn)行了比較，其在30Hz或100Hz下運(yùn)行。雖然其它的努力沒有達(dá)到實(shí)時(shí)性的里程碑，我們也比較了它們的相對mAP和速度來檢查目標(biāo)檢測系統(tǒng)中精度——性能權(quán)衡。

Fast YOLO是PASCAL上最快的目標(biāo)檢測方法；據(jù)我們所知，它是現(xiàn)有的最快的目標(biāo)檢測器。具有52.7%mAP，實(shí)時(shí)檢測的精度是以前工作的兩倍以上。YOLO將mAP推到63.4%同時(shí)保持了實(shí)時(shí)性能。

我們還使用VGG-16訓(xùn)練YOLO。這個(gè)模型比YOLO更準(zhǔn)確，但也比它慢得多。對于依賴于VGG-16的其它檢測系統(tǒng)來說，它是比較有用的，但由于它比實(shí)時(shí)的YOLO更慢，本文的其它部分將重點(diǎn)放在我們更快的模型上。

Fastest DPM可以在不犧牲太多mAP的情況下有效地加速DPM，但仍然會將實(shí)時(shí)性能降低2倍。與神經(jīng)網(wǎng)絡(luò)方法相比，DPM相對低的檢測精度也受到限制。

R-CNN Minus R用靜態(tài)邊界框提出取代選擇性搜索。雖然速度比R-CNN更快，但仍然不能實(shí)時(shí)，并且由于沒有好的邊界框提出，準(zhǔn)確性受到了嚴(yán)重影響。

Fast R-CNN加快了R-CNN的分類階段，但是仍然依賴選擇性搜索，每張圖像需要花費(fèi)大約2秒來生成邊界框提出。因此，它具有很高的mAP，但是0.5的fps仍離實(shí)時(shí)性很遠(yuǎn)。

Faster R-CNN用神經(jīng)網(wǎng)絡(luò)替代了選擇性搜索來提出邊界框，類似于Szegedy等。在我們的測試中，他們最精確的模型達(dá)到了7fps，而較小的，不太精確的模型以18fps運(yùn)行。VGG-16版本的Faster R-CNN要高出10mAP，但比YOLO慢6倍。Zeiler-Fergus的Faster R-CNN只比YOLO慢了2.5倍，但也不太準(zhǔn)確。

Pascal VOC 2007上的實(shí)時(shí)系統(tǒng)。比較快速檢測器的性能和速度?？焖資OLO是Pascal VOC檢測記錄中速度最快的檢測器，其精度仍然是其它實(shí)時(shí)檢測器的兩倍。YOLO比快速版本更精確10mAP，同時(shí)在速度上仍保持實(shí)時(shí)性。

2、VOC 2007錯(cuò)誤率分析

為了進(jìn)一步檢查YOLO和最先進(jìn)的檢測器之間的差異，我們詳細(xì)分析了VOC 2007的結(jié)果。我們將YOLO與Fast R-CNN進(jìn)行比較，因?yàn)镕ast R-CNN是PASCAL上性能最高的檢測器之一并且它的檢測代碼是可公開得到的。

我們使用Hoiem等人的方法和工具。對于測試時(shí)的每個(gè)類別，我們看這個(gè)類別的前N個(gè)預(yù)測。每個(gè)預(yù)測或者是正確的，或者根據(jù)錯(cuò)誤類型進(jìn)行分類：

Correct：正確的類別而且IOU>0.5

Localization：正確的類別,0.1

Similar：類別相似，IOU>0.1

Other：類別錯(cuò)誤，IOU>0.1

Background：任何IOU<0.1的目標(biāo)

下圖顯示了在所有的20個(gè)類別上每種錯(cuò)誤類型平均值的分解圖。

誤差分析：Fast R-CNN vs. YOLO。這張圖顯示了各種類別的前N個(gè)預(yù)測中定位錯(cuò)誤和背景錯(cuò)誤的百分比（N = #表示目標(biāo)在那個(gè)類別中）。

YOLO努力地正確定位目標(biāo)。定位錯(cuò)誤占YOLO錯(cuò)誤的大多數(shù)，比其它錯(cuò)誤源加起來都多。Fast R-CNN使定位錯(cuò)誤少得多，但背景錯(cuò)誤更多。它的檢測的13.6%是不包含任何目標(biāo)的誤報(bào)。Fast R-CNN比YOLO預(yù)測背景檢測的可能性高出近3倍。

3、結(jié)合Fast R-CNN和YOLO

YOLO比Fast R-CNN的背景誤檢要少得多。通過使用YOLO消除Fast R-CNN的背景檢測，我們獲得了顯著的性能提升。對于R-CNN預(yù)測的每個(gè)邊界框，我們檢查YOLO是否預(yù)測一個(gè)類似的框。如果是這樣，我們根據(jù)YOLO預(yù)測的概率和兩個(gè)盒子之間的重疊來對這個(gè)預(yù)測進(jìn)行提升。

最好的Fast R-CNN模型在VOC 2007測試集上達(dá)到了71.8%的mAP。當(dāng)與YOLO結(jié)合時(shí)，其mAP增加了3.2%達(dá)到了75%，我們也嘗試將最好的Fast R-CNN模型與其它幾個(gè)版本的Fast R-CNN結(jié)合起來。這些模型組合產(chǎn)生了0.3%到0.6%之間的小增幅。

VOC 2007模型組合實(shí)驗(yàn)。我們檢驗(yàn)了各種模型與Fast R-CNN最佳版本結(jié)合的效果。Fast R-CNN的其它版本只提供很小的好處，而YOLO則提供了顯著的性能提升。

來自YOLO的提升不僅僅是模型組合的副產(chǎn)品，因?yàn)榻M合不同版本的Fast R-CNN幾乎沒有什么好處。相反，正是因?yàn)閅OLO在測試時(shí)出現(xiàn)了各種各樣的錯(cuò)誤，所以在提高Fast R-CNN的性能方面非常有效。

遺憾的是，這個(gè)組合并沒有從YOLO的速度中受益，因?yàn)槲覀兎謩e運(yùn)行每個(gè)模型，然后結(jié)合結(jié)果。但是，由于YOLO速度如此之快，與Fast R-CNN相比，不會增加任何顯著的計(jì)算時(shí)間。

4、VOC 2012結(jié)果

在VOC 2012測試集上，YOLO得分為57.9%mAP,這低于現(xiàn)有的最新技術(shù)，接近于使用VGG-16的原始R-CNN，見表3。我們的系統(tǒng)與其最接近的競爭對手相比，在小目標(biāo)上努力。在bottle，sheep和tv/monitor等類別上，YOLO的得分比R-CNN或Feature Edit低8%-10%，然而，在cat和train等其它類別上YOLO實(shí)現(xiàn)了更高的性能。

PASCAL VOC 2012排行榜。截至2015年11月6日，YOLO與完整comp4（允許外部數(shù)據(jù)）公開排行榜進(jìn)行了比較。顯示了各種檢測方法的平均精度均值和每類的平均精度。YOLO是唯一的實(shí)時(shí)檢測器。Fast R-CNN + YOLO是評分第四高的方法，比Fast R-CNN提升了2.3%。

我們聯(lián)合的Fast R-CNN + YOLO模型是性能最高的檢測方法之一。Fast R-CNN從與YOLO的組合中獲得了2.3%提高，在公開排行榜上上移了5位。

5、泛化能力，藝術(shù)品中的行人檢測

用于目標(biāo)檢測的學(xué)術(shù)數(shù)據(jù)集以相同分布獲取訓(xùn)練和測試數(shù)據(jù)。在現(xiàn)實(shí)世界的應(yīng)用中，很難預(yù)測所有可能的用例，而且測試數(shù)據(jù)可能與系統(tǒng)之前看到的不同[3]。我們在Picasso數(shù)據(jù)集上和People-Art數(shù)據(jù)集上將YOLO與其它的檢測系統(tǒng)進(jìn)行比較，這兩個(gè)數(shù)據(jù)集用于測試藝術(shù)品中的行人檢測。

下圖顯示了YOLO和其它檢測方法之間的比較性能。作為參考，我們在person上提供VOC 2007的檢測AP，其中所有模型僅在VOC 2007數(shù)據(jù)上訓(xùn)練。在Picasso數(shù)據(jù)集上的模型在VOC 2012上訓(xùn)練，而People-Art數(shù)據(jù)集上的模型則在VOC 2010上訓(xùn)練。

Picasso和People-Art數(shù)據(jù)集上的泛化結(jié)果。

R-CNN在VOC 2007上有高AP。然而，當(dāng)應(yīng)用于藝術(shù)品時(shí)，R-CNN明顯下降。R-CNN使用選擇性搜索來調(diào)整自然圖像的邊界框提出。R-CNN中的分類器步驟只能看到小區(qū)域，并且需要很好的邊界框提出。

DPM在應(yīng)用于藝術(shù)品時(shí)保持了其AP。之前的工作認(rèn)為DPM表現(xiàn)良好，因?yàn)樗哂心繕?biāo)形狀和布局的強(qiáng)大空間模型。雖然DPM不會像R-CNN那樣退化，但它開始時(shí)的AP較低。

YOLO在VOC 2007上有很好的性能，在應(yīng)用于藝術(shù)品時(shí)其AP下降低于其它方法。像DPM一樣，YOLO建模目標(biāo)的大小和形狀，以及目標(biāo)和目標(biāo)通常出現(xiàn)的位置之間的關(guān)系。藝術(shù)品和自然圖像在像素級別上有很大不同，但是它們在目標(biāo)的大小和形狀方面是相似的，因此YOLO仍然可以預(yù)測好的邊界框和檢測結(jié)果。

定性結(jié)果。YOLO在網(wǎng)絡(luò)采樣的藝術(shù)品和自然圖像上的運(yùn)行結(jié)果。雖然它將人誤檢成了飛機(jī)，但它大部分上是準(zhǔn)確的。

四實(shí)時(shí)目標(biāo)檢測

YOLO是一種快速，精確的目標(biāo)檢測器，非常適合計(jì)算機(jī)視覺應(yīng)用。我們將YOLO連接到網(wǎng)絡(luò)攝像頭，并驗(yàn)證它是否能保持實(shí)時(shí)性能，包括從攝像頭獲取圖像并顯示檢測結(jié)果的時(shí)間。

由此產(chǎn)生的系統(tǒng)是交互式和參與式的。雖然YOLO單獨(dú)處理圖像，但當(dāng)連接到網(wǎng)絡(luò)攝像頭時(shí)，其功能類似于跟蹤系統(tǒng)，可在目標(biāo)移動和外觀變化時(shí)檢測目標(biāo)。系統(tǒng)演示和源代碼可以在項(xiàng)目網(wǎng)站上找到：http://pjreddie.com/yolo/。

五結(jié)論

我們介紹了YOLO，一種統(tǒng)一的目標(biāo)檢測模型。我們的模型構(gòu)建簡單，可以直接在整張圖像上進(jìn)行訓(xùn)練。與基于分類器的方法不同，YOLO直接在對應(yīng)檢測性能的損失函數(shù)上訓(xùn)練，并且整個(gè)模型聯(lián)合訓(xùn)練。

快速YOLO是文獻(xiàn)中最快的通用目的的目標(biāo)檢測器，YOLO推動了實(shí)時(shí)目標(biāo)檢測的最新技術(shù)。YOLO還很好地泛化到新領(lǐng)域，使其成為依賴快速，強(qiáng)大的目標(biāo)檢測應(yīng)用的理想選擇。

編輯：黃飛

閱讀全文

檢測器(47234) 檢測器(47234)
神經(jīng)網(wǎng)絡(luò)(98386) 神經(jīng)網(wǎng)絡(luò)(98386)
卷積神經(jīng)網(wǎng)絡(luò)(11634)

什么是卷積神經(jīng)網(wǎng)絡(luò)？完整的卷積神經(jīng)網(wǎng)絡(luò)（CNNS）解析

卷積神經(jīng)網(wǎng)絡(luò)（CNN）是一種特殊類型的神經(jīng)網(wǎng)絡(luò)，在圖像上表現(xiàn)特別出色。卷積神經(jīng)網(wǎng)絡(luò)由Yan LeCun在1998年提出，可以識別給定輸入圖像中存在的數(shù)字。

2022-08-10 11:49:06

18294

詳解深度學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)與卷積神經(jīng)網(wǎng)絡(luò)的應(yīng)用

處理技術(shù)也可以通過深度學(xué)習(xí)來獲得更優(yōu)異的效果，比如去噪、超分辨率和跟蹤算法等。為了跟上時(shí)代的步伐，必須對深度學(xué)習(xí)與神經(jīng)網(wǎng)絡(luò)技術(shù)有所學(xué)習(xí)和研究。本文將介紹深度學(xué)習(xí)技術(shù)、神經(jīng)網(wǎng)絡(luò)與卷積神經(jīng)網(wǎng)絡(luò)以及它們在相關(guān)領(lǐng)域中的應(yīng)用。

2024-01-11 10:51:32

596

基于PVANet卷積神經(jīng)網(wǎng)絡(luò)模型的交通標(biāo)志識別算法

（Tsinghua-Tencent 100K）數(shù)據(jù)集上進(jìn)行了交通標(biāo)志檢測算法驗(yàn)證實(shí)驗(yàn)。結(jié)果表明，所構(gòu)建的卷積神經(jīng)網(wǎng)絡(luò)具有優(yōu)秀的小目標(biāo)

2020-11-30 14:14:36

2246

卷積神經(jīng)網(wǎng)絡(luò)CNN介紹

【深度學(xué)習(xí)】卷積神經(jīng)網(wǎng)絡(luò)CNN

2020-06-14 18:55:37

卷積神經(jīng)網(wǎng)絡(luò)—深度卷積網(wǎng)絡(luò)：實(shí)例探究及學(xué)習(xí)總結(jié)

《深度學(xué)習(xí)工程師-吳恩達(dá)》03卷積神經(jīng)網(wǎng)絡(luò)—深度卷積網(wǎng)絡(luò)：實(shí)例探究學(xué)習(xí)總結(jié)

2020-05-22 17:15:57

卷積神經(jīng)網(wǎng)絡(luò)一維卷積的處理過程

。本文就以一維卷積神經(jīng)網(wǎng)絡(luò)為例談?wù)勗趺磥磉M(jìn)一步優(yōu)化卷積神經(jīng)網(wǎng)絡(luò)使用的memory。文章（卷積神經(jīng)網(wǎng)絡(luò)中一維卷.

2021-12-23 06:16:40

卷積神經(jīng)網(wǎng)絡(luò)為什么適合圖像處理？

卷積神經(jīng)網(wǎng)絡(luò)為什么適合圖像處理？

2022-09-08 10:23:10

卷積神經(jīng)網(wǎng)絡(luò)入門資料

卷積神經(jīng)網(wǎng)絡(luò)入門詳解

2019-02-12 13:58:26

卷積神經(jīng)網(wǎng)絡(luò)原理及發(fā)展過程

Top100論文導(dǎo)讀：深入理解卷積神經(jīng)網(wǎng)絡(luò)CNN（Part Ⅰ）

2019-09-06 17:25:54

卷積神經(jīng)網(wǎng)絡(luò)如何使用

卷積神經(jīng)網(wǎng)絡(luò)(CNN)究竟是什么，鑒于神經(jīng)網(wǎng)絡(luò)在工程上經(jīng)歷了曲折的歷史，您為什么還會在意它呢? 對于這些非常中肯的問題，我們似乎可以給出相對簡明的答案。

2019-07-17 07:21:50

卷積神經(jīng)網(wǎng)絡(luò)模型發(fā)展及應(yīng)用

網(wǎng)絡(luò) GhostNet。由于卷積神經(jīng)網(wǎng)絡(luò)的一系列突破性研究成果，并根據(jù)不同的任務(wù)需求不斷改進(jìn)，使其在目標(biāo)檢測、語義分割、自然語言處理等不同的任務(wù)中均獲得了成功的應(yīng)用。基于以上認(rèn)識，本文首先概括性

2022-08-02 10:39:39

卷積神經(jīng)網(wǎng)絡(luò)的優(yōu)點(diǎn)是什么

卷積神經(jīng)網(wǎng)絡(luò)的優(yōu)點(diǎn)

2020-05-05 18:12:50

卷積神經(jīng)網(wǎng)絡(luò)的層級結(jié)構(gòu)和常用框架

　　卷積神經(jīng)網(wǎng)絡(luò)的層級結(jié)構(gòu)　　卷積神經(jīng)網(wǎng)絡(luò)的常用框架

2020-12-29 06:16:44

卷積神經(jīng)網(wǎng)絡(luò)的整體網(wǎng)絡(luò)結(jié)構(gòu)和發(fā)展過程

Top100論文導(dǎo)讀：深入理解卷積神經(jīng)網(wǎng)絡(luò)CNN（Part Ⅱ）

2019-08-22 14:20:39

卷積神經(jīng)網(wǎng)絡(luò)簡介：什么是機(jī)器學(xué)習(xí)？

抽象人工智能（AI）的世界正在迅速發(fā)展，人工智能越來越多地支持以前無法實(shí)現(xiàn)或非常難以實(shí)現(xiàn)的應(yīng)用程序。本系列文章解釋了卷積神經(jīng)網(wǎng)絡(luò) （CNN）及其在 AI 系統(tǒng)中機(jī)器學(xué)習(xí)中的重要性。CNN 是從

2023-02-23 20:11:10

卷積神經(jīng)網(wǎng)絡(luò)（CNN）是如何定義的？

什么是卷積神經(jīng)網(wǎng)絡(luò)？ImageNet-2010網(wǎng)絡(luò)結(jié)構(gòu)是如何構(gòu)成的？有哪些基本參數(shù)？

2021-06-17 11:48:22

CV之YOLO：深度學(xué)習(xí)之計(jì)算機(jī)視覺神經(jīng)網(wǎng)絡(luò)tiny-yolo-5clessses訓(xùn)練自己的數(shù)據(jù)集全程記錄

CV之YOLO：深度學(xué)習(xí)之計(jì)算機(jī)視覺神經(jīng)網(wǎng)絡(luò)tiny-yolo-5clessses訓(xùn)練自己的數(shù)據(jù)集全程記錄

2018-12-24 11:50:57

《 AI加速器架構(gòu)設(shè)計(jì)與實(shí)現(xiàn)》+第一章卷積神經(jīng)網(wǎng)絡(luò)觀后感

對應(yīng)的神經(jīng)網(wǎng)絡(luò)有哪些，也看到了自己在k210中用到的FAST RCNN和RestNet18分類網(wǎng)絡(luò)，需要保證硬件實(shí)現(xiàn)和算法一致，這樣才事半功倍，否則，可能會差別比較大。對于神經(jīng)網(wǎng)絡(luò)算法的執(zhí)行，加速器

2023-09-11 20:34:01

【HarmonyOS HiSpark AI Camera】基于深度學(xué)習(xí)的目標(biāo)檢測系統(tǒng)設(shè)計(jì)

項(xiàng)目名稱：基于深度學(xué)習(xí)的目標(biāo)檢測系統(tǒng)設(shè)計(jì)試用計(jì)劃：嘗試在硬件平臺實(shí)現(xiàn)對Yolo卷積神經(jīng)網(wǎng)絡(luò)的加速運(yùn)算，期望提出的方法能夠使目標(biāo)檢測技術(shù)更便捷，運(yùn)用領(lǐng)域更廣泛。針對課題的研究一是研究基于開發(fā)板低功耗

2020-09-25 10:11:49

【PYNQ-Z2申請】基于PYNQ的卷積神經(jīng)網(wǎng)絡(luò)加速

項(xiàng)目名稱：基于PYNQ的卷積神經(jīng)網(wǎng)絡(luò)加速試用計(jì)劃：申請理由：本人研究生在讀，想要利用PYNQ深入探索卷積神經(jīng)網(wǎng)絡(luò)的硬件加速，在PYNQ上實(shí)現(xiàn)圖像的快速處理項(xiàng)目計(jì)劃：1、在PC端實(shí)現(xiàn)Lnet網(wǎng)絡(luò)的訓(xùn)練

2018-12-19 11:37:22

【uFun試用申請】基于cortex-m系列核和卷積神經(jīng)網(wǎng)絡(luò)算法的圖像識別

項(xiàng)目名稱：基于cortex-m系列核和卷積神經(jīng)網(wǎng)絡(luò)算法的圖像識別試用計(jì)劃：本人在圖像識別領(lǐng)域有三年多的學(xué)習(xí)和開發(fā)經(jīng)驗(yàn)，曾利用nesys4ddr的fpga開發(fā)板，設(shè)計(jì)過基于cortex-m3的軟核

2019-04-09 14:12:24

【專輯精選】人工智能之神經(jīng)網(wǎng)絡(luò)教程與資料

電子發(fā)燒友總結(jié)了以“神經(jīng)網(wǎng)絡(luò)”為主題的精選干貨，今后每天一個(gè)主題為一期，希望對各位有所幫助?。c(diǎn)擊標(biāo)題即可進(jìn)入頁面下載相關(guān)資料）人工神經(jīng)網(wǎng)絡(luò)算法的學(xué)習(xí)方法與應(yīng)用實(shí)例（pdf彩版）卷積神經(jīng)網(wǎng)絡(luò)入門資料MATLAB神經(jīng)網(wǎng)絡(luò)30個(gè)案例分析《matlab神經(jīng)網(wǎng)絡(luò)應(yīng)用設(shè)計(jì)》深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)

2019-05-07 19:18:14

【案例分享】基于BP算法的前饋神經(jīng)網(wǎng)絡(luò)

傳播的，不會回流），區(qū)別于循環(huán)神經(jīng)網(wǎng)絡(luò)RNN。BP算法（Back Propagation）：誤差反向傳播算法，用于更新網(wǎng)絡(luò)中的權(quán)重。BP神經(jīng)網(wǎng)絡(luò)思想：表面上：1. 數(shù)據(jù)信息的前向傳播，從輸入層到隱含層

2019-07-21 04:00:00

什么是圖卷積神經(jīng)網(wǎng)絡(luò)？

圖卷積神經(jīng)網(wǎng)絡(luò)

2019-08-20 12:05:29

全連接神經(jīng)網(wǎng)絡(luò)和卷積神經(jīng)網(wǎng)絡(luò)有什么區(qū)別

全連接神經(jīng)網(wǎng)絡(luò)和卷積神經(jīng)網(wǎng)絡(luò)的區(qū)別

2019-06-06 14:21:42

關(guān)于卷積神經(jīng)網(wǎng)絡(luò)探秘的簡單了解

卷積神經(jīng)網(wǎng)絡(luò)探秘

2019-06-04 11:59:35

分享機(jī)器學(xué)習(xí)卷積神經(jīng)網(wǎng)絡(luò)的工作流程和相關(guān)操作

機(jī)器學(xué)習(xí)算法篇--卷積神經(jīng)網(wǎng)絡(luò)基礎(chǔ)（Convolutional Neural Network）

2019-02-14 16:37:29

反饋神經(jīng)網(wǎng)絡(luò)算法是什么

反饋神經(jīng)網(wǎng)絡(luò)算法

2020-04-28 08:36:58

可分離卷積神經(jīng)網(wǎng)絡(luò)在 Cortex-M 處理器上實(shí)現(xiàn)關(guān)鍵詞識別

?！?卷積神經(jīng)網(wǎng)絡(luò) (CNN)基于 DNN 的 KWS 的一大主要缺陷是無法為語音功能中的局域關(guān)聯(lián)性、時(shí)域關(guān)聯(lián)性、頻域關(guān)聯(lián)性建模。CNN 則可將輸入時(shí)域和頻域特征當(dāng)作圖像處理，并且在上面執(zhí)行 2D

2021-07-26 09:46:37

基于 FPGA 的目標(biāo)檢測網(wǎng)絡(luò)加速電路設(shè)計(jì)

，這個(gè)尺寸既可以盡量保留圖片的信息以防止目標(biāo)檢測準(zhǔn)確率下降，又可以在神經(jīng)網(wǎng)絡(luò)運(yùn)算過程中很方便地通過 Max pooling 進(jìn)行降采樣。經(jīng)過三層 Max pooling 后特征圖的大小為 20×40

2023-06-20 19:45:12

基于賽靈思FPGA的卷積神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)設(shè)計(jì)

FPGA 上實(shí)現(xiàn)卷積神經(jīng)網(wǎng)絡(luò) (CNN)。CNN 是一類深度神經(jīng)網(wǎng)絡(luò)，在處理大規(guī)模圖像識別任務(wù)以及與機(jī)器學(xué)習(xí)類似的其他問題方面已大獲成功。在當(dāng)前案例中,針對在 FPGA 上實(shí)現(xiàn) CNN 做一個(gè)可行性研究

2019-06-19 07:24:41

如何利用卷積神經(jīng)網(wǎng)絡(luò)去更好地控制巡線智能車呢

巡線智能車控制中的CNN網(wǎng)絡(luò)有何應(yīng)用？嵌入式單片機(jī)中的神經(jīng)網(wǎng)絡(luò)該怎樣去使用？如何利用卷積神經(jīng)網(wǎng)絡(luò)去更好地控制巡線智能車呢？

2021-12-21 07:47:24

如何用卷積神經(jīng)網(wǎng)絡(luò)方法去解決機(jī)器監(jiān)督學(xué)習(xí)下面的分類問題？

人工智能下面有哪些機(jī)器學(xué)習(xí)分支？如何用卷積神經(jīng)網(wǎng)絡(luò)（CNN）方法去解決機(jī)器學(xué)習(xí)監(jiān)督學(xué)習(xí)下面的分類問題？

2021-06-16 08:09:03

如何設(shè)計(jì)BP神經(jīng)網(wǎng)絡(luò)圖像壓縮算法？

，并能在腦海中重現(xiàn)這些圖像信息，這不僅與人腦的海量信息存儲能力有關(guān)，還與人腦的信息處理能力，包括數(shù)據(jù)壓縮能力有關(guān)。在各種神經(jīng)網(wǎng)絡(luò)中，多層前饋神經(jīng)網(wǎng)絡(luò)具有很強(qiáng)的信息處理能力，由于其采用BP算法，因此也

2019-08-08 06:11:30

求基于labview的BP神經(jīng)網(wǎng)絡(luò)算法的實(shí)現(xiàn)過程

求高手，基于labview的BP神經(jīng)網(wǎng)絡(luò)算法的實(shí)現(xiàn)過程，最好有程序哈，謝謝！！

2012-12-10 14:55:50

解析深度學(xué)習(xí)：卷積神經(jīng)網(wǎng)絡(luò)原理與視覺實(shí)踐

解析深度學(xué)習(xí)：卷積神經(jīng)網(wǎng)絡(luò)原理與視覺實(shí)踐

2020-06-14 22:21:12

請問為什么要用卷積神經(jīng)網(wǎng)絡(luò)？

為什么要用卷積神經(jīng)網(wǎng)絡(luò)？

2020-06-13 13:11:39

遺傳算法神經(jīng)網(wǎng)絡(luò) 解析

關(guān)于遺傳算法和神經(jīng)網(wǎng)絡(luò)的

2013-05-19 10:22:16

非局部神經(jīng)網(wǎng)絡(luò)，打造未來神經(jīng)網(wǎng)絡(luò)基本組件

時(shí)空記憶。增加了幾個(gè)非局部模塊后，我們的“非局部神經(jīng)網(wǎng)絡(luò)”結(jié)構(gòu)能比二維和三維卷積網(wǎng)絡(luò)在視頻分類中取得更準(zhǔn)確的結(jié)果。另外，非局部神經(jīng)網(wǎng)絡(luò)在計(jì)算上也比三維卷積神經(jīng)網(wǎng)絡(luò)更加經(jīng)濟(jì)。我們在 Kinetics

2018-11-12 14:52:50

【科普】卷積神經(jīng)網(wǎng)絡(luò)(CNN)基礎(chǔ)介紹

對卷積神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)進(jìn)行介紹，主要內(nèi)容包括卷積神經(jīng)網(wǎng)絡(luò)概念、卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)、卷積神經(jīng)網(wǎng)絡(luò)求解、卷積神經(jīng)網(wǎng)絡(luò)LeNet-5結(jié)構(gòu)分析、卷積神經(jīng)網(wǎng)絡(luò)注意事項(xiàng)。一、卷積神經(jīng)網(wǎng)絡(luò)概念上世紀(jì)60年代

2017-11-16 01:00:02

10694

深度卷積神經(jīng)網(wǎng)絡(luò)在目標(biāo)檢測中的進(jìn)展

深度卷積神經(jīng)網(wǎng)絡(luò)（DCNN）在圖像分類和識別上取得了很顯著的提高?；仡檹?014到2016這兩年多的時(shí)間，先后涌現(xiàn)出了R-CNN，F(xiàn)ast R-CNN, Faster R-CNN, ION

2017-11-16 01:41:55

4952

卷積神經(jīng)網(wǎng)絡(luò)檢測臉部關(guān)鍵點(diǎn)的教程之卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練與數(shù)據(jù)擴(kuò)充

上一次我們用了單隱層的神經(jīng)網(wǎng)絡(luò)，效果還可以改善，這一次就使用CNN。卷積神經(jīng)網(wǎng)絡(luò) 上圖演示了卷積操作 LeNet-5式的卷積神經(jīng)網(wǎng)絡(luò)，是計(jì)算機(jī)視覺領(lǐng)域近期取得的巨大突破的核心。卷積層和之前的全連接

2017-11-16 11:45:07

2012

卷積神經(jīng)網(wǎng)絡(luò)CNN圖解

。于是在這里記錄下所學(xué)到的知識，關(guān)于CNN 卷積神經(jīng)網(wǎng)絡(luò)，需要總結(jié)深入的知識有很多：人工神經(jīng)網(wǎng)絡(luò) ANN 卷積神經(jīng)網(wǎng)絡(luò) CNN 卷積神經(jīng)網(wǎng)絡(luò) CNN - BP算法卷積神經(jīng)網(wǎng)絡(luò) CNN - LetNet分析卷積神經(jīng)網(wǎng)絡(luò) CNN - caffe應(yīng)用全卷積神經(jīng)網(wǎng) FCN 如果對于人工神經(jīng)網(wǎng)絡(luò)。

2017-11-16 13:18:40

56168

卷積神經(jīng)網(wǎng)絡(luò)CNN架構(gòu)分析-LeNet

對于神經(jīng)網(wǎng)絡(luò)和卷積有了粗淺的了解,關(guān)于CNN 卷積神經(jīng)網(wǎng)絡(luò)，需要總結(jié)深入的知識有很多：人工神經(jīng)網(wǎng)絡(luò) ANN卷積神經(jīng)網(wǎng)絡(luò)CNN 卷積神經(jīng)網(wǎng)絡(luò)CNN-BP算法卷積神經(jīng)網(wǎng)絡(luò)CNN-caffe應(yīng)用卷積神經(jīng)網(wǎng)絡(luò)CNN-LetNet分析 LetNet網(wǎng)絡(luò).

2017-11-16 13:28:01

2562

基于深度卷積神經(jīng)網(wǎng)絡(luò)的航空器目標(biāo)檢測與識別

的bounding-box的回歸問題，用一個(gè)24層卷積神經(jīng)網(wǎng)絡(luò)模型來完成bounding-box的預(yù)測；然后，利用圖像分類網(wǎng)絡(luò)來完成目標(biāo)切片的分類任務(wù)。大尺寸圖像上的傳統(tǒng)目標(biāo)檢測識別算法通常在時(shí)間效率上很難突破，而基于卷積神經(jīng)網(wǎng)絡(luò)的航空器目標(biāo)檢

2017-12-01 15:55:09

從概念到結(jié)構(gòu)、算法解析卷積神經(jīng)網(wǎng)絡(luò)

本文是對卷積神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)進(jìn)行介紹，主要內(nèi)容包含卷積神經(jīng)網(wǎng)絡(luò)概念、卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)、卷積神經(jīng)網(wǎng)絡(luò)求解、卷積神經(jīng)網(wǎng)絡(luò)LeNet-5結(jié)構(gòu)分析、卷積神經(jīng)網(wǎng)絡(luò)注意事項(xiàng)。一、卷積神經(jīng)網(wǎng)絡(luò)概念上世紀(jì)60年代

2017-12-05 11:32:59

基于卷積神經(jīng)網(wǎng)絡(luò)的圖像目標(biāo)識別算法

針對圖像在平移、旋轉(zhuǎn)或局部形變等復(fù)雜情況下的識別問題，提出一種基于非監(jiān)督預(yù)訓(xùn)練和多尺度分塊的卷積神經(jīng)網(wǎng)絡(luò)（CNN）目標(biāo)識別算法。算法首先利用不合標(biāo)簽的圖像訓(xùn)練一個(gè)稀疏自動編碼器，得到符合數(shù)據(jù)集特性

2017-12-20 15:37:25

卷積神經(jīng)網(wǎng)絡(luò)在車輛目標(biāo)快速檢測中的應(yīng)用

而準(zhǔn)確的車輛目標(biāo)檢測方法意義重大．在YOLO目標(biāo)檢測框架的基礎(chǔ)上，設(shè)計(jì)了一種卷積神經(jīng)網(wǎng)絡(luò)的車輛檢測及其車型粗粒度識別方法．網(wǎng)絡(luò)結(jié)構(gòu)采用多層感知機(jī)卷積層，增加特征映射的非線性處理能力：移除原來模型中的全連接層，利用

2017-12-22 16:22:12

詳解卷積神經(jīng)網(wǎng)絡(luò)卷積過程

卷積過程是卷積神經(jīng)網(wǎng)絡(luò)最主要的特征。然而卷積過程有比較多的細(xì)節(jié)，初學(xué)者常會有比較多的問題，這篇文章對卷積過程進(jìn)行比較詳細(xì)的解釋。

2019-05-02 15:39:00

15154

基于神經(jīng)網(wǎng)絡(luò)的遙感圖像飛機(jī)目標(biāo)檢測模型

針對遙感圖像飛機(jī)檢測中存在的背景復(fù)雜和目標(biāo)尺度變化大等問題，提出基于深度神經(jīng)網(wǎng)絡(luò)的遙感圖像飛機(jī)目標(biāo)檢測模型DC-DNN。利用圖像底層特征制作像素級標(biāo)簽完成全卷積神經(jīng)網(wǎng)絡(luò)（FCN）模型訓(xùn)練，將FCN

2021-03-30 09:24:40

基于剪枝與量化的卷積神經(jīng)網(wǎng)絡(luò)壓縮算法

隨著深度學(xué)習(xí)的發(fā)展，卷積神經(jīng)網(wǎng)絡(luò)作為其重要算法被廣泛應(yīng)用到計(jì)算機(jī)視覺、自然語言處理及語音處理等各個(gè)領(lǐng)域，并取得了比傳統(tǒng)算法更為優(yōu)秀的成績。但是，卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)復(fù)雜，參數(shù)量和計(jì)算量巨大，使得很多算法

2021-05-17 15:44:05

基于卷積神經(jīng)網(wǎng)絡(luò)的雷達(dá)目標(biāo)檢測方法綜述

基于卷積神經(jīng)網(wǎng)絡(luò)的雷達(dá)目標(biāo)檢測方法綜述

2021-06-23 14:43:01

基于深度卷積神經(jīng)網(wǎng)絡(luò)的目標(biāo)檢測研究

作為計(jì)算機(jī)視覺中的基本視覺識別問題，目標(biāo)檢測在過去的幾十年中得到了廣泛地研究。目標(biāo)檢測旨在給定圖像中找到具有準(zhǔn)確定位的特定對象，并為每個(gè)對象分配一個(gè)對應(yīng)的標(biāo)簽。近年來，深度卷積神經(jīng)網(wǎng)絡(luò)DCNN

2022-02-11 08:51:11

1144

卷積神經(jīng)網(wǎng)絡(luò)入門詳解

在本文中將對卷積神經(jīng)網(wǎng)絡(luò)中的多個(gè)問題具體展開講解。

2022-10-24 15:17:36

卷積神經(jīng)網(wǎng)絡(luò)的應(yīng)用分析

【源碼】卷積神經(jīng)網(wǎng)絡(luò)在Tensorflow文本分類中的應(yīng)用

2022-11-14 11:15:31

393

什么是神經(jīng)網(wǎng)絡(luò)？什么是卷積神經(jīng)網(wǎng)絡(luò)？

在介紹卷積神經(jīng)網(wǎng)絡(luò)之前，我們先回顧一下神經(jīng)網(wǎng)絡(luò)的基本知識。就目前而言，神經(jīng)網(wǎng)絡(luò)是深度學(xué)習(xí)算法的核心，我們所熟知的很多深度學(xué)習(xí)算法的背后其實(shí)都是神經(jīng)網(wǎng)絡(luò)。

2023-02-23 09:14:44

2256

卷積神經(jīng)網(wǎng)絡(luò)通俗理解

卷積神經(jīng)網(wǎng)絡(luò)通俗理解卷積神經(jīng)網(wǎng)絡(luò)，英文名為Convolutional Neural Network，成為了當(dāng)前深度學(xué)習(xí)領(lǐng)域最重要的算法之一，也是很多圖像和語音領(lǐng)域任務(wù)中最常用的深度學(xué)習(xí)模型之一

2023-08-17 16:30:25

2062

卷積神經(jīng)網(wǎng)絡(luò)原理：卷積神經(jīng)網(wǎng)絡(luò)模型和卷積神經(jīng)網(wǎng)絡(luò)算法

卷積神經(jīng)網(wǎng)絡(luò)原理：卷積神經(jīng)網(wǎng)絡(luò)模型和卷積神經(jīng)網(wǎng)絡(luò)算法卷積神經(jīng)網(wǎng)絡(luò)（Convolutional Neural Network，CNN）是一種基于深度學(xué)習(xí)的人工神經(jīng)網(wǎng)絡(luò)，是深度學(xué)習(xí)技術(shù)的重要應(yīng)用之

2023-08-17 16:30:30

806

卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)

Learning）的應(yīng)用，通過運(yùn)用多層卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)，可以自動地進(jìn)行特征提取和學(xué)習(xí)，進(jìn)而實(shí)現(xiàn)圖像分類、物體識別、目標(biāo)檢測、語音識別和自然語言翻譯等任務(wù)。卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)包括：輸入層、卷積層、激活函數(shù)、池化層和全連接層。在CNN中，輸入層通常是代表圖像的矩陣或向量，而卷積層是卷積神

2023-08-17 16:30:35

804

卷積神經(jīng)網(wǎng)絡(luò)python代碼

的卷積操作，將不同層次的特征進(jìn)行提取，從而通過反向傳播算法不斷優(yōu)化網(wǎng)絡(luò)權(quán)重，最終實(shí)現(xiàn)分類和預(yù)測等任務(wù)。在本文中，我們將介紹如何使用Python實(shí)現(xiàn)卷積神經(jīng)網(wǎng)絡(luò)，并詳細(xì)說明每一個(gè)步驟及其原理。第一步：導(dǎo)入必要的庫在開始編寫代碼前，我們需要先導(dǎo)入一些必要的Python庫。具體如

2023-08-21 16:41:35

615

卷積神經(jīng)網(wǎng)絡(luò)詳解卷積神經(jīng)網(wǎng)絡(luò)包括哪幾層及各層功能

卷積神經(jīng)網(wǎng)絡(luò)詳解卷積神經(jīng)網(wǎng)絡(luò)包括哪幾層及各層功能卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks, CNNs)是一個(gè)用于圖像和語音識別的深度學(xué)習(xí)技術(shù)。它是一種專門為處理

2023-08-21 16:41:40

4402

卷積神經(jīng)網(wǎng)絡(luò)的應(yīng)用卷積神經(jīng)網(wǎng)絡(luò)通常用來處理什么

卷積神經(jīng)網(wǎng)絡(luò)的應(yīng)用卷積神經(jīng)網(wǎng)絡(luò)通常用來處理什么卷積神經(jīng)網(wǎng)絡(luò)（Convolutional Neural Network，簡稱CNN）是一種在神經(jīng)網(wǎng)絡(luò)領(lǐng)域內(nèi)廣泛應(yīng)用的神經(jīng)網(wǎng)絡(luò)模型。相較于傳統(tǒng)

2023-08-21 16:41:45

3487

卷積神經(jīng)網(wǎng)絡(luò)概述卷積神經(jīng)網(wǎng)絡(luò)的特點(diǎn) cnn卷積神經(jīng)網(wǎng)絡(luò)的優(yōu)點(diǎn)

卷積神經(jīng)網(wǎng)絡(luò)概述卷積神經(jīng)網(wǎng)絡(luò)的特點(diǎn) cnn卷積神經(jīng)網(wǎng)絡(luò)的優(yōu)點(diǎn)? 卷積神經(jīng)網(wǎng)絡(luò)（Convolutional neural network，CNN）是一種基于深度學(xué)習(xí)技術(shù)的神經(jīng)網(wǎng)絡(luò)，由于其出色的性能

2023-08-21 16:41:48

1662

卷積神經(jīng)網(wǎng)絡(luò)模型有哪些？卷積神經(jīng)網(wǎng)絡(luò)包括哪幾層內(nèi)容？

卷積神經(jīng)網(wǎng)絡(luò)模型有哪些？卷積神經(jīng)網(wǎng)絡(luò)包括哪幾層內(nèi)容？卷積神經(jīng)網(wǎng)絡(luò)（Convolutional Neural Networks，CNN）是深度學(xué)習(xí)領(lǐng)域中最廣泛應(yīng)用的模型之一，主要應(yīng)用于圖像、語音

2023-08-21 16:41:52

1305

卷積神經(jīng)網(wǎng)絡(luò)模型原理卷積神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)

卷積神經(jīng)網(wǎng)絡(luò)模型原理卷積神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)? 卷積神經(jīng)網(wǎng)絡(luò)是一種深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)，是在圖像、語音、文本和視頻等方面的任務(wù)中最有效的神經(jīng)網(wǎng)絡(luò)之一。它的總體思想是使用在輸入數(shù)據(jù)之上的一系列過濾器來捕捉

2023-08-21 16:41:58

604

卷積神經(jīng)網(wǎng)絡(luò)的工作原理卷積神經(jīng)網(wǎng)絡(luò)通俗解釋

卷積神經(jīng)網(wǎng)絡(luò)的工作原理卷積神經(jīng)網(wǎng)絡(luò)通俗解釋? 卷積神經(jīng)網(wǎng)絡(luò)（Convolutional Neural Network, CNN）是一種眾所周知的深度學(xué)習(xí)算法，是人工智能領(lǐng)域中最受歡迎的技術(shù)之一

2023-08-21 16:49:24

2216

卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用領(lǐng)域

卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用領(lǐng)域卷積神經(jīng)網(wǎng)絡(luò)(CNN)是一種廣泛應(yīng)用于圖像、視頻和自然語言處理領(lǐng)域的深度學(xué)習(xí)算法。它最初是用于圖像識別領(lǐng)域，但目前已經(jīng)擴(kuò)展到了許多其他應(yīng)用領(lǐng)域。本文將詳細(xì)介紹卷積神經(jīng)網(wǎng)絡(luò)

2023-08-21 16:49:29

2029

卷積神經(jīng)網(wǎng)絡(luò)三大特點(diǎn)

卷積神經(jīng)網(wǎng)絡(luò)三大特點(diǎn)? 卷積神經(jīng)網(wǎng)絡(luò)（Convolutional Neural Network，CNN）是一種深度學(xué)習(xí)模型，其具有三大特點(diǎn)：局部感知、參數(shù)共享和下采樣。一、局部感知卷積神經(jīng)網(wǎng)絡(luò)

2023-08-21 16:49:32

3049

卷積神經(jīng)網(wǎng)絡(luò)的基本原理卷積神經(jīng)網(wǎng)絡(luò)發(fā)展卷積神經(jīng)網(wǎng)絡(luò)三大特點(diǎn)

卷積神經(jīng)網(wǎng)絡(luò)的基本原理卷積神經(jīng)網(wǎng)絡(luò)發(fā)展歷程卷積神經(jīng)網(wǎng)絡(luò)三大特點(diǎn)? 卷積神經(jīng)網(wǎng)絡(luò)的基本原理卷積神經(jīng)網(wǎng)絡(luò)（Convolutional Neural Networks，CNN）是深度學(xué)習(xí)領(lǐng)域

2023-08-21 16:49:39

1144

卷積神經(jīng)網(wǎng)絡(luò)層級結(jié)構(gòu) 卷積神經(jīng)網(wǎng)絡(luò)的卷積層講解

像分類、目標(biāo)檢測、人臉識別等。卷積神經(jīng)網(wǎng)絡(luò)的核心是卷積層和池化層，它們構(gòu)成了網(wǎng)絡(luò)的主干，實(shí)現(xiàn)了對圖像特征的提取和抽象。一、卷積神經(jīng)網(wǎng)絡(luò)的層級結(jié)構(gòu) 卷積神經(jīng)網(wǎng)絡(luò)主要分為四個(gè)層級，分別是輸入層、卷積層、池化層和全連接層。 1. 輸入層輸入層是卷積神經(jīng)網(wǎng)絡(luò)的第

2023-08-21 16:49:42

3760

卷積神經(jīng)網(wǎng)絡(luò)的介紹什么是卷積神經(jīng)網(wǎng)絡(luò)算法

卷積神經(jīng)網(wǎng)絡(luò)的介紹什么是卷積神經(jīng)網(wǎng)絡(luò)算法卷積神經(jīng)網(wǎng)絡(luò)涉及的關(guān)鍵技術(shù) 卷積神經(jīng)網(wǎng)絡(luò)（Convolutional Neural Network，CNN）是一種用于圖像分類、物體識別、語音識別等領(lǐng)域

2023-08-21 16:49:46

1229

卷積神經(jīng)網(wǎng)絡(luò)算法是機(jī)器算法嗎

卷積神經(jīng)網(wǎng)絡(luò)算法是機(jī)器算法嗎? 卷積神經(jīng)網(wǎng)絡(luò)算法是機(jī)器算法的一種，它通常被用于圖像、語音、文本等數(shù)據(jù)的處理和分類。隨著深度學(xué)習(xí)的興起，卷積神經(jīng)網(wǎng)絡(luò)逐漸成為了圖像、語音等領(lǐng)域中最熱門的算法之一。卷積

2023-08-21 16:49:48

437

卷積神經(jīng)網(wǎng)絡(luò)算法比其他算法好嗎

卷積神經(jīng)網(wǎng)絡(luò)算法比其他算法好嗎卷積神經(jīng)網(wǎng)絡(luò)（Convolutional Neural Networks, CNN）是一種用于圖像識別和處理等領(lǐng)域的深度學(xué)習(xí)算法。相對于傳統(tǒng)的圖像識別算法，如SIFT

2023-08-21 16:49:51

407

卷積神經(jīng)網(wǎng)絡(luò)算法原理

卷積神經(jīng)網(wǎng)絡(luò)算法原理? 卷積神經(jīng)網(wǎng)絡(luò)（Convolutional Neural Network，CNN）是一種深度學(xué)習(xí)（Deep Learning）的模型，它能夠自動地從圖片、音頻、文本等數(shù)據(jù)中提

2023-08-21 16:49:54

690

卷積神經(jīng)網(wǎng)絡(luò)是什么？卷積神經(jīng)網(wǎng)絡(luò)的工作原理和應(yīng)用

　　卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network，CNN)是一種深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)，主要用于圖像和視頻的識別、分類和預(yù)測，是計(jì)算機(jī)視覺領(lǐng)域中應(yīng)用最廣泛的深度學(xué)習(xí)算法之一。該網(wǎng)絡(luò)模型可以自動從原始數(shù)據(jù)中學(xué)習(xí)有用的特征，并將其映射到相應(yīng)的類別。

2023-08-21 17:03:46

1064

卷積神經(jīng)網(wǎng)絡(luò)算法有哪些？

卷積神經(jīng)網(wǎng)絡(luò)算法有哪些？? 卷積神經(jīng)網(wǎng)絡(luò)（Convolutional Neural Network, CNN) 是一種基于多層感知器（multilayer perceptron, MLP）的深度學(xué)習(xí)

2023-08-21 16:50:01

977

卷積神經(jīng)網(wǎng)絡(luò)算法的優(yōu)缺點(diǎn)

卷積神經(jīng)網(wǎng)絡(luò)算法的優(yōu)缺點(diǎn) 卷積神經(jīng)網(wǎng)絡(luò)是一種廣泛應(yīng)用于圖像、語音等領(lǐng)域的深度學(xué)習(xí)算法。在過去幾年里，CNN的研究和應(yīng)用有了飛速的發(fā)展，取得了許多重要的成果，如在圖像分類、目標(biāo)識別、人臉識別、自然語言

2023-08-21 16:50:04

5473

卷積神經(jīng)網(wǎng)絡(luò)和深度神經(jīng)網(wǎng)絡(luò)的優(yōu)缺點(diǎn) 卷積神經(jīng)網(wǎng)絡(luò)和深度神經(jīng)網(wǎng)絡(luò)的區(qū)別

深度神經(jīng)網(wǎng)絡(luò)是一種基于神經(jīng)網(wǎng)絡(luò)的機(jī)器學(xué)習(xí)算法，其主要特點(diǎn)是由多層神經(jīng)元構(gòu)成，可以根據(jù)數(shù)據(jù)自動調(diào)整神經(jīng)元之間的權(quán)重，從而實(shí)現(xiàn)對大規(guī)模數(shù)據(jù)進(jìn)行預(yù)測和分類。卷積神經(jīng)網(wǎng)絡(luò)是深度神經(jīng)網(wǎng)絡(luò)的一種，主要應(yīng)用于圖像和視頻處理領(lǐng)域。

2023-08-21 17:07:36

1869

卷積神經(jīng)網(wǎng)絡(luò)算法三大類

卷積神經(jīng)網(wǎng)絡(luò)算法三大類卷積神經(jīng)網(wǎng)絡(luò)（Convolutional Neural Network，簡稱CNN）是一種常用的人工神經(jīng)網(wǎng)絡(luò)，它的主要應(yīng)用領(lǐng)域是圖像識別和計(jì)算機(jī)視覺方面。CNN通過卷積

2023-08-21 16:50:07

757

卷積神經(jīng)網(wǎng)絡(luò)算法代碼python

卷積神經(jīng)網(wǎng)絡(luò)算法代碼python? 卷積神經(jīng)網(wǎng)絡(luò)（Convolutional Neural Network，CNN）是深度學(xué)習(xí)中最為重要的算法之一。它在計(jì)算機(jī)視覺、自然語言處理、語音識別等領(lǐng)域有著

2023-08-21 16:50:09

514

卷積神經(jīng)網(wǎng)絡(luò)算法代碼matlab

卷積神經(jīng)網(wǎng)絡(luò)算法代碼matlab 卷積神經(jīng)網(wǎng)絡(luò)（Convolutional Neural Network，CNN）是一種深度學(xué)習(xí)網(wǎng)絡(luò)模型，其特點(diǎn)是具有卷積層（Convolutional Layer

2023-08-21 16:50:11

745

卷積神經(jīng)網(wǎng)絡(luò)算法的核心思想

廣泛應(yīng)用的神經(jīng)網(wǎng)絡(luò)模型。本文將從以下幾個(gè)方面詳細(xì)介紹CNN的核心思想和算法原理。一、CNN簡介 CNN是一種類似于人類視覺系統(tǒng)的神經(jīng)網(wǎng)絡(luò)模型，它利用卷積層、池化層、全連接層等多個(gè)層次對輸入數(shù)據(jù)進(jìn)行處理和特征提取，最終實(shí)現(xiàn)特定目標(biāo)的分類和識別。CNN的典型應(yīng)用包括圖片識

2023-08-21 16:50:17

797

卷積神經(jīng)網(wǎng)絡(luò)算法流程卷積神經(jīng)網(wǎng)絡(luò)模型工作流程

卷積神經(jīng)網(wǎng)絡(luò)算法流程卷積神經(jīng)網(wǎng)絡(luò)模型工作流程? 卷積神經(jīng)網(wǎng)絡(luò)（Convolutional Neural Network，CNN）是一種廣泛應(yīng)用于目標(biāo)跟蹤、圖像識別和語音識別等領(lǐng)域的深度學(xué)習(xí)模型

2023-08-21 16:50:19

1316

常見的卷積神經(jīng)網(wǎng)絡(luò)模型典型的卷積神經(jīng)網(wǎng)絡(luò)模型

常見的卷積神經(jīng)網(wǎng)絡(luò)模型典型的卷積神經(jīng)網(wǎng)絡(luò)模型卷積神經(jīng)網(wǎng)絡(luò)（Convolutional Neural Network, CNN）是深度學(xué)習(xí)中最流行的模型之一，其結(jié)構(gòu)靈活，處理圖像、音頻、自然語言

2023-08-21 17:11:41

1646

cnn卷積神經(jīng)網(wǎng)絡(luò)模型卷積神經(jīng)網(wǎng)絡(luò)預(yù)測模型生成卷積神經(jīng)網(wǎng)絡(luò)模型

cnn卷積神經(jīng)網(wǎng)絡(luò)模型卷積神經(jīng)網(wǎng)絡(luò)預(yù)測模型生成卷積神經(jīng)網(wǎng)絡(luò)模型? 卷積神經(jīng)網(wǎng)絡(luò)（Convolutional Neural Network，CNN）是一種深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)，最初被廣泛應(yīng)用于計(jì)算機(jī)

2023-08-21 17:11:47

681

卷積神經(jīng)網(wǎng)絡(luò)模型搭建

卷積神經(jīng)網(wǎng)絡(luò)模型搭建卷積神經(jīng)網(wǎng)絡(luò)模型是一種深度學(xué)習(xí)算法。它已經(jīng)成為了計(jì)算機(jī)視覺和自然語言處理等各種領(lǐng)域的主流算法，具有很大的應(yīng)用前景。本篇文章將詳細(xì)介紹卷積神經(jīng)網(wǎng)絡(luò)模型的搭建過程，為讀者提供一份

2023-08-21 17:11:49

543

卷積神經(jīng)網(wǎng)絡(luò)一共有幾層卷積神經(jīng)網(wǎng)絡(luò)模型三層

卷積神經(jīng)網(wǎng)絡(luò)一共有幾層卷積神經(jīng)網(wǎng)絡(luò)模型三層? 卷積神經(jīng)網(wǎng)絡(luò) (Convolutional Neural Networks，CNNs) 是一種在深度學(xué)習(xí)領(lǐng)域中發(fā)揮重要作用的模型。它是一種有層次結(jié)構(gòu)

2023-08-21 17:11:53

3338

卷積神經(jīng)網(wǎng)絡(luò)模型的優(yōu)缺點(diǎn)

等領(lǐng)域中非常流行，可用于分類、分割、檢測等任務(wù)。而在實(shí)際應(yīng)用中，卷積神經(jīng)網(wǎng)絡(luò)模型有其優(yōu)點(diǎn)和缺點(diǎn)。這篇文章將詳細(xì)介紹卷積神經(jīng)網(wǎng)絡(luò)模型的特點(diǎn)、優(yōu)點(diǎn)和缺點(diǎn)。一、卷積神經(jīng)網(wǎng)絡(luò)模型的特點(diǎn) 卷積神經(jīng)網(wǎng)絡(luò)是一種前饋神經(jīng)網(wǎng)絡(luò)，包含了卷積層、池化層、全連接層等多個(gè)層

2023-08-21 17:15:19

1881

卷積神經(jīng)網(wǎng)絡(luò)主要包括哪些卷積神經(jīng)網(wǎng)絡(luò)組成部分

卷積神經(jīng)網(wǎng)絡(luò)主要包括哪些卷積神經(jīng)網(wǎng)絡(luò)組成部分卷積神經(jīng)網(wǎng)絡(luò)（CNN）是一類廣泛應(yīng)用于計(jì)算機(jī)視覺、自然語言處理等領(lǐng)域的人工神經(jīng)網(wǎng)絡(luò)。它具有良好的空間特征學(xué)習(xí)能力，能夠處理具有二維或三維形狀的輸入數(shù)據(jù)

2023-08-21 17:15:22

938

cnn卷積神經(jīng)網(wǎng)絡(luò)算法 cnn卷積神經(jīng)網(wǎng)絡(luò)模型

cnn卷積神經(jīng)網(wǎng)絡(luò)算法 cnn卷積神經(jīng)網(wǎng)絡(luò)模型卷積神經(jīng)網(wǎng)絡(luò)(CNN)是一種特殊的神經(jīng)網(wǎng)絡(luò)，具有很強(qiáng)的圖像識別和數(shù)據(jù)分類能力。它通過學(xué)習(xí)權(quán)重和過濾器，自動提取圖像和其他類型數(shù)據(jù)的特征。在過去的幾年

2023-08-21 17:15:57

946

卷積神經(jīng)網(wǎng)絡(luò)的定義、結(jié)構(gòu)和發(fā)展歷史

卷積神經(jīng)網(wǎng)絡(luò)（Convolutional Neural Network，CNN）是一種非常重要的機(jī)器學(xué)習(xí)算法，主要應(yīng)用于圖像處理領(lǐng)域，用于圖像分類、目標(biāo)識別、物體檢測等任務(wù)。該算法是深度學(xué)習(xí)領(lǐng)域的一個(gè)重要分支。下面具體介紹卷積神經(jīng)網(wǎng)絡(luò)的定義、結(jié)構(gòu)和發(fā)展歷史。

2023-08-21 17:26:04

406

卷積神經(jīng)網(wǎng)絡(luò)通俗理解

學(xué)習(xí)(deeplearning)的代表算法之一，卷積神經(jīng)網(wǎng)絡(luò)具有表征學(xué)習(xí)(representation learning)能力，能夠按其階層結(jié)構(gòu)對輸入信息進(jìn)行平移不變分類

2023-11-26 16:26:01

506

卷積神經(jīng)網(wǎng)絡(luò)的優(yōu)點(diǎn)

卷積神經(jīng)網(wǎng)絡(luò)的優(yōu)點(diǎn)? 卷積神經(jīng)網(wǎng)絡(luò)（Convolutional Neural Network，CNN）是一種基于深度學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)模型，在圖像識別、語音識別、自然語言處理等領(lǐng)域有著廣泛的應(yīng)用。相比

2023-12-07 15:37:25

2282

已全部加載完成

搜索歷史

卷積神經(jīng)網(wǎng)絡(luò)目標(biāo)檢測中的YOLO算法詳解

評論