0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

行人再識別,澎思科技 ReID算法的三大突破

WpOh_rgznai100 ? 來源:YXQ ? 2019-07-09 11:00 ? 次閱讀

不久前,江蘇省某市公安通過 AI 技術(shù)分析監(jiān)控攝像頭中的信息,抓獲了一個偷盜電動車的嫌疑人員。監(jiān)控攝像頭在現(xiàn)場拍到的是嫌疑人背對攝像頭的情況,未有清晰正面的人臉,但圖片顯示了他的穿著、發(fā)型、身高等信息,而警方運用的技術(shù)則是計算機視覺領(lǐng)域中的行人再識別技術(shù)(Re-ID),通過Re-ID技術(shù)警方找到了關(guān)聯(lián)攝像頭正好拍到他的正臉,以此確認身份,迅速將嫌疑人抓獲。這也是行人再識別技術(shù)在實戰(zhàn)場景中的一個典型應(yīng)用,而提供給警方技術(shù)支持的則是國內(nèi)人工智能企業(yè)澎思科技(Pensees)。

行人再識別,澎思科技 ReID算法的三大突破

行人再識別起源于多攝像頭跟蹤,指在非重疊視角域多攝像頭網(wǎng)絡(luò)下進行的行人匹配,即確認不同位置的攝像頭在不同的時刻拍攝到的行人目標是否為同一人。行人再識別涉及計算機視覺、機器學(xué)習(xí)、模式識別等多個學(xué)科領(lǐng)域。在行人再識別(ReID)技術(shù)研究領(lǐng)域,首位命中率(Rank-1 Accuracy)和平均精度均值(Mean Average Precision,mAP)是衡量算法水平的核心指標。

近日,在行人再識別(Person Re-identification,簡稱ReID)算法上澎思科技取得了突破,在三大主流ReID數(shù)據(jù)集測試 Market1501、DukeMTMC-reID 和 CUHK03 中,算法關(guān)鍵指標首位命中率(Rank-1 Accuracy)刷新了世界紀錄。

在三大數(shù)據(jù)集上,Rank-1 指標分別達到 96.73%、92.01% 和 84.57%超過了阿里巴巴、騰訊、大華、云從科技等頭部廠家;在 CUHK03 數(shù)據(jù)集的實驗中,mAP 也超過了之前的成績。

澎思科技 Market1501 部分測試結(jié)果

澎思科技通過對算法的自研創(chuàng)新和融合探索,算法上的突破有以下三點:

1、金字塔水平分塊策略:采用 human parsing 對人體分割,結(jié)合金字塔水平分塊策略,使得網(wǎng)絡(luò)準確提取細粒度區(qū)域特征的能力大幅提升;

如圖所示, 特征圖水平分割 6 等份,其冪集一共有種組合,去掉全集和空集以后還有種組合方式,這些特征區(qū)域可以組合成為新的特征圖。對每個新的特征圖進行常規(guī)操作(全局池化=>卷積=>批歸一化=>激活函數(shù)=>全連接層=>ID 監(jiān)督信號)。通過多監(jiān)督信號的參與,可以大幅提高模型的精度和魯棒性。

2、(1)漸進式訓(xùn)練策略;(2)圖網(wǎng)絡(luò)結(jié)構(gòu)

(1)訓(xùn)練階段,借鑒 curriculum learning 思路,難樣本比例逐步提升,使得損失函數(shù)更易收斂。參與訓(xùn)練的樣本按照學(xué)習(xí)難易度、按順序進入和退出訓(xùn)練循環(huán),模型在訓(xùn)練的同時評估各樣本的難度,如此可以保證模型能夠有效挖掘樣本特征完成ReID任務(wù)。

(2)通過圖網(wǎng)絡(luò)結(jié)構(gòu),學(xué)習(xí)得到各個細粒度特征的加權(quán)系數(shù),進一步提高特征的分辨能力。

如圖所示,網(wǎng)絡(luò)在學(xué)習(xí)行人特征提取的同時還要學(xué)習(xí)區(qū)分不同部分的人體結(jié)構(gòu),有的放矢地在這些區(qū)域提取特征并進行池化可以大大減少背景信息造成的干擾。同時使用圖卷積網(wǎng)絡(luò)對人體各部分的特征之關(guān)系經(jīng)行建??梢缘玫揭粋€人的整體表示,其效果要優(yōu)于直接垂直等分特征圖。

各部分的特征向量首先堆疊在一起形成特征矩陣,使用一維卷積分別混洗每行和每列的特征,讓信息在各部分、各通道之間流動,重復(fù)一定次數(shù)以后可以得到穩(wěn)定的整體特征。

3、重構(gòu)距離:最后在測試階段,除常規(guī)距離計算手段,引入重構(gòu)距離,提升網(wǎng)絡(luò)對未對齊、遮擋等技術(shù)難點的魯棒性。

為了解決遮擋帶來的精度下降問題,提出線性空間重構(gòu),利用參考圖片的信息嘗試盡可能地恢復(fù)殘缺特征圖,恢復(fù)后的特征圖和參考特征圖之間的距離即為重構(gòu)距離。由此可以保證相似的圖片之間可以互相重構(gòu),而不同個體的圖片不管怎么重構(gòu)都有一定的距離。從而提高了模型應(yīng)對遮擋情況的能力。

ReID 算法持續(xù)優(yōu)化,加速技術(shù)在多行業(yè)應(yīng)用落地

ReID 算法加速技術(shù)在多行業(yè)應(yīng)用落地

近年來受益于深度學(xué)習(xí)的發(fā)展,行人再識別(ReID)技術(shù)水平得到了巨大提升,超越人眼識別能力,并達到了商用的水平。作為人臉識別技術(shù)的重要補充,其發(fā)展內(nèi)核便是在不同視頻中,在無法獲取清晰人臉特征信息前提下,機器通過穿著、發(fā)型、體態(tài)等信息將同一個人識別出來,增強數(shù)據(jù)的時空連接性。在公共安全(如智能視頻監(jiān)控、安保、刑偵)、智能零售、智能交通以及智慧城市等領(lǐng)域有很高的應(yīng)用價值。

在公共安全領(lǐng)域,行人再識別技術(shù)在警務(wù)實戰(zhàn)中可以作為人臉識別技術(shù)的有力補充,幫助公安視頻偵查實現(xiàn)人臉、人體圖像與數(shù)據(jù)聯(lián)結(jié),強化軌跡追蹤功能,深化公安視頻圖像應(yīng)用能力。

在智慧零售領(lǐng)域,行人再識別技術(shù)可以幫助商超收集“人”與“場”之間的關(guān)系數(shù)據(jù)并以可視化的方式重現(xiàn)。通過行人再識別技術(shù)追蹤記錄顧客店內(nèi)行動軌跡,分析熱點區(qū)域和商品關(guān)注度,分析不同區(qū)域的客流駐足率,從而據(jù)此優(yōu)化商品陳列,獲取最佳客流動線;感知客流峰谷,最受歡迎區(qū)域,合理配備人員,提升服務(wù)。同時,也將有助于基于用戶行為畫像,實現(xiàn)線下廣告精準投放。

在智能制造、智慧園區(qū)等領(lǐng)域,行人再識別技術(shù)同樣可以在提高員工工作效率,管理規(guī)范生產(chǎn)過程,降低企業(yè)管理成本,提升企業(yè)安保等級等方面有很多的應(yīng)用場景。目前,澎思科技自研的 ReID 算法已經(jīng)在不同行業(yè)的多個業(yè)務(wù)場景中落地應(yīng)用。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 算法
    +關(guān)注

    關(guān)注

    23

    文章

    4576

    瀏覽量

    92343
  • 計算機視覺
    +關(guān)注

    關(guān)注

    8

    文章

    1689

    瀏覽量

    45875

原文標題:超阿里、大華,澎思科技行人再識別(ReID)技術(shù)刷新三大數(shù)據(jù)集記錄

文章出處:【微信號:rgznai100,微信公眾號:rgznai100】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    峰科技高性能大模型推理引擎PerfXLM解析

    自ChatGPT問世以來,大模型遍地開花,承載大模型應(yīng)用的高性能推理框架也不斷推出,大有百家爭鳴之勢。在這種情況下,峰科技作為全球領(lǐng)先的智能計算服務(wù)提供商,在2023年11月25日發(fā)布了針對大語言
    的頭像 發(fā)表于 09-29 10:14 ?265次閱讀
    <b class='flag-5'>澎</b>峰科技高性能大模型推理引擎PerfXLM解析

    峰科技攜大解決方案亮相WAIC 2024

    2024世界人工智能大會暨人工智能全球治理高級別會議(簡稱“WAIC 2024”)將在上海世博中心展覽館舉行。峰科技將在世博展覽館H1-D1022展位為您呈現(xiàn)前沿的技術(shù)成果和創(chuàng)新的產(chǎn)品解決方案。
    的頭像 發(fā)表于 09-29 10:05 ?302次閱讀

    深度識別算法包括哪些內(nèi)容

    深度識別算法是深度學(xué)習(xí)領(lǐng)域的一個重要組成部分,它利用深度神經(jīng)網(wǎng)絡(luò)模型對輸入數(shù)據(jù)進行高層次的理解和識別。深度識別算法涵蓋了多個方面的內(nèi)容,主要
    的頭像 發(fā)表于 09-10 15:28 ?202次閱讀

    中偉視界:礦山智能化——實時檢測識別井下行人車輛,人工智能賦能高風(fēng)險作業(yè)安全

    行車不行人檢測AI分析算法通過利用人工智能和深度學(xué)習(xí)技術(shù),對井下行人和車輛的行駛情況進行實時檢測和識別,應(yīng)用于礦山等高風(fēng)險作業(yè)環(huán)境中。該算法
    的頭像 發(fā)表于 07-16 19:37 ?364次閱讀
    中偉視界:礦山智能化——實時檢測<b class='flag-5'>識別</b>井下<b class='flag-5'>行人</b>車輛,人工智能賦能高風(fēng)險作業(yè)安全

    圖像識別算法有哪幾種

    圖像識別算法是計算機視覺領(lǐng)域的核心技術(shù)之一,它通過分析和處理圖像數(shù)據(jù),實現(xiàn)對圖像中的目標、場景和物體的識別和分類。 圖像識別算法的發(fā)展歷程
    的頭像 發(fā)表于 07-16 11:22 ?757次閱讀

    圖像識別算法都有哪些方法

    圖像識別算法是計算機視覺領(lǐng)域的核心任務(wù)之一,它涉及到從圖像中提取特征并進行分類、識別和分析的過程。隨著深度學(xué)習(xí)技術(shù)的不斷發(fā)展,圖像識別算法
    的頭像 發(fā)表于 07-16 11:14 ?4569次閱讀

    圖像識別算法的提升有哪些

    引言 圖像識別是計算機視覺領(lǐng)域的核心任務(wù)之一,旨在使計算機能夠自動地識別和理解圖像中的內(nèi)容。隨著計算機硬件的發(fā)展和深度學(xué)習(xí)技術(shù)的突破,圖像識別算法
    的頭像 發(fā)表于 07-16 11:12 ?504次閱讀

    圖像識別算法的優(yōu)缺點有哪些

    圖像識別算法是一種利用計算機視覺技術(shù)對圖像進行分析和理解的方法,它在許多領(lǐng)域都有廣泛的應(yīng)用,如自動駕駛、醫(yī)療診斷、安全監(jiān)控等。然而,圖像識別算法也存在一些優(yōu)缺點。 一、圖像
    的頭像 發(fā)表于 07-16 11:09 ?988次閱讀

    圖像識別算法的核心技術(shù)是什么

    圖像識別算法是計算機視覺領(lǐng)域的一個重要研究方向,其目標是使計算機能夠像人類一樣理解和識別圖像中的內(nèi)容。圖像識別算法的核心技術(shù)包括以下幾個方面
    的頭像 發(fā)表于 07-16 11:02 ?450次閱讀

    opencv圖像識別有什么算法

    圖像識別算法: 邊緣檢測 :邊緣檢測是圖像識別中的基本步驟之一,用于識別圖像中的邊緣。常見的邊緣檢測算法有Canny邊緣檢測器、Sobel邊
    的頭像 發(fā)表于 07-16 10:40 ?589次閱讀

    化工廠液體泄漏識別預(yù)警算法

    化工廠液體泄漏識別預(yù)警基于圖像識別算法是計算機視覺的基礎(chǔ)算法,例如VGG,GoogLeNet,ResNet等,化工廠液體泄漏識別這類
    的頭像 發(fā)表于 07-03 08:35 ?287次閱讀
    化工廠液體泄漏<b class='flag-5'>識別</b>預(yù)警<b class='flag-5'>算法</b>

    人員跌倒識別檢測算法

    人員跌倒識別檢測算法是基于視頻的檢測方法,通過對目標人體監(jiān)測,當(dāng)目標人體出現(xiàn)突然倒地行為時,自動監(jiān)測并觸發(fā)報警。人員跌倒識別檢測算法基于計算機識別
    的頭像 發(fā)表于 06-30 11:47 ?373次閱讀
    人員跌倒<b class='flag-5'>識別</b>檢測<b class='flag-5'>算法</b>

    峰科技與并行科技共拓AI大模型技術(shù)創(chuàng)新應(yīng)用服務(wù)

    4月17日,峰(北京)科技有限公司(以下簡稱“峰科技”)與北京并行科技股份有限公司(以下簡稱“并行科技”)簽署戰(zhàn)略合作協(xié)議。
    的頭像 發(fā)表于 04-23 09:54 ?356次閱讀
    <b class='flag-5'>澎</b>峰科技與并行科技共拓AI大模型技術(shù)創(chuàng)新應(yīng)用服務(wù)

    芯半導(dǎo)體主驅(qū)級SiC MOSFET產(chǎn)出良率達到75%

    近日,芯半導(dǎo)體在產(chǎn)品開拓方面取得了多項進展
    的頭像 發(fā)表于 12-28 13:40 ?727次閱讀
    <b class='flag-5'>澎</b>芯半導(dǎo)體主驅(qū)級SiC MOSFET產(chǎn)出良率達到75%

    基于LiDAR的行人識別的研究分析

    基于激光雷達(LiDAR)的行人識別。我們利用低成本的LiDAR設(shè)備解決了人員識別中的挑戰(zhàn),構(gòu)建了名為LReID的LiDAR數(shù)據(jù)集,并提出了一種名為
    發(fā)表于 12-11 10:41 ?582次閱讀
    基于LiDAR的<b class='flag-5'>行人</b>重<b class='flag-5'>識別</b>的研究分析