0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

自動駕駛領(lǐng)域的技術(shù)變革呼之欲出,深度學(xué)習(xí)進(jìn)入“視頻學(xué)習(xí)”時(shí)代

JsPm_robot_1hjq ? 來源:未知 ? 作者:李倩 ? 2018-04-20 11:06 ? 次閱讀

自動駕駛領(lǐng)域的技術(shù)變革呼之欲出。

如果說,自動駕駛大規(guī)模落地的痛點(diǎn)在于深度學(xué)習(xí)的范疇僅限于圖像等靜態(tài)材料,那很快,自動駕駛深度學(xué)習(xí)的范圍將擴(kuò)展到視頻領(lǐng)域。

近日,眾安信息技術(shù)服務(wù)有限公司(以下簡稱“眾安科技”)數(shù)據(jù)科學(xué)實(shí)驗(yàn)室的論文"Dense Dilated Network for Few Shot Action Recognition"(《基于密集擴(kuò)展網(wǎng)絡(luò)的少樣本視頻動作識別》)被ICMR(國際多媒體圖像分析峰會)錄用,這是深度學(xué)習(xí)在視頻分類領(lǐng)域的創(chuàng)新應(yīng)用,在駕駛行為分析、視頻檢索等領(lǐng)域有重要的業(yè)務(wù)價(jià)值。

深度學(xué)習(xí)進(jìn)入“視頻學(xué)習(xí)”時(shí)代

“讀圖”已經(jīng)無法滿足機(jī)器的學(xué)習(xí)胃口。深度學(xué)習(xí)是機(jī)器學(xué)習(xí)中一種基于對數(shù)據(jù)進(jìn)行表面特征的方法,其概念源于人工神經(jīng)網(wǎng)絡(luò)的研究。目前,深度學(xué)習(xí)的主要素材來源于文字、圖片,而隨著智能手機(jī)等設(shè)備的發(fā)展,視頻沉淀了大量深度學(xué)習(xí)素材。近年來人工智能、神經(jīng)網(wǎng)絡(luò)的發(fā)展更是促進(jìn)了視頻的分類、識別的研究。

不過,機(jī)器想要學(xué)習(xí)視頻素材絕非易事。一般來說,訓(xùn)練深度神經(jīng)網(wǎng)絡(luò)需要大量標(biāo)記良好的數(shù)據(jù)。對于機(jī)器來說,由于視頻動作、視角較多,且視頻每秒都包含了20-30幀畫面,數(shù)據(jù)規(guī)模較大,機(jī)器的標(biāo)注難度比標(biāo)注圖像復(fù)雜很多倍。另一方面,就視頻本身而言,雖然不同的視頻內(nèi)容差異很大,但同一類的視頻在語義上有著很高的相似性,對于機(jī)器學(xué)習(xí)來說,如何避免“重復(fù)勞動”也是擺在現(xiàn)實(shí)面前的一道難題。

針對上述難題,眾安科技通過在視頻多樣性中提取高層共有的特性來實(shí)現(xiàn)機(jī)器學(xué)習(xí)。

眾安科技方面表示,基于機(jī)器學(xué)習(xí)視頻的痛點(diǎn),數(shù)據(jù)科學(xué)實(shí)驗(yàn)室研發(fā)了一種新穎的神經(jīng)網(wǎng)絡(luò)架構(gòu)來同時(shí)捕獲局部信息和整體時(shí)空信息。具體來看,眾安科技采用了擴(kuò)張卷積網(wǎng)絡(luò),在這個(gè)網(wǎng)絡(luò)的不同層之間,使用密集連接的方式組合,由此可以融合每一層的輸出,從而學(xué)習(xí)視頻的高級特征。

和其他網(wǎng)絡(luò)架構(gòu)相比,眾安科技的這款神經(jīng)網(wǎng)絡(luò)架構(gòu)利用每層與之前所有層相連的方式,可以得到從最初局部特征到總體視頻的所有特征信息。而每層網(wǎng)絡(luò)使用了擴(kuò)張卷積(dilated convolution),相比原始的卷積方式,可以更加充分利用時(shí)空信息。因此不需要很深的層數(shù),在少量數(shù)據(jù)下就可以訓(xùn)練效果較好的網(wǎng)絡(luò)。

以目前動作類別數(shù)、樣本數(shù)較多的數(shù)據(jù)庫之一UCF101為例,眾安科技在此數(shù)據(jù)庫的通用視頻數(shù)據(jù)集上進(jìn)行了大量實(shí)驗(yàn),在僅有20%的訓(xùn)練數(shù)據(jù)時(shí)(模擬對新任務(wù)的快速學(xué)習(xí)),利用該神經(jīng)網(wǎng)絡(luò)架構(gòu),機(jī)器仍然可以學(xué)到每類視頻的高層語義特征。

視頻深度學(xué)習(xí)下個(gè)落地場景:出行、醫(yī)療

視頻深度學(xué)習(xí)有望率先在出行和醫(yī)療領(lǐng)域落地。

眾安科技研發(fā)的這款神經(jīng)網(wǎng)絡(luò)架構(gòu)在實(shí)戰(zhàn)中也有很高的應(yīng)用價(jià)值,由于該架構(gòu)只需要少量訓(xùn)練數(shù)據(jù)就可以促進(jìn)不同任務(wù)之間的遷移學(xué)習(xí),幫助系統(tǒng)快速上線,從而減少了大量采集數(shù)據(jù)和訓(xùn)練過程。

如在車險(xiǎn)領(lǐng)域,可以使用該方法對路口監(jiān)控或行車記錄儀等視頻進(jìn)行快速分析,識別碰撞和高危駕駛片段,從而對車主的駕駛行為進(jìn)行建模,實(shí)現(xiàn)車險(xiǎn)的自主定價(jià)。

此外,在醫(yī)療方面,目前人工智能輔助醫(yī)療的手段除了CT圖片等,還有許多造影等多樣的數(shù)據(jù)有待分析。該方法利用時(shí)序信息,可以針對造影進(jìn)行識別診斷,尤其是對于病例較少的罕見病分析更為高效。

眾安科技數(shù)據(jù)科學(xué)實(shí)驗(yàn)室認(rèn)為,該神經(jīng)網(wǎng)絡(luò)架構(gòu)針對出行和醫(yī)療領(lǐng)域會有較大的幫助,這也是該團(tuán)隊(duì)未來產(chǎn)學(xué)研結(jié)合的落地方向之一。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴

原文標(biāo)題:從圖像識別走向視頻識別,眾安科技推出視頻深度學(xué)習(xí)利器

文章出處:【微信號:robot-1hjqr,微信公眾號:1號機(jī)器人網(wǎng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    人工智能的應(yīng)用領(lǐng)域自動駕駛

    的核心技術(shù) 自動駕駛汽車的核心依賴于人工智能,尤其是機(jī)器學(xué)習(xí)深度學(xué)習(xí)技術(shù)。這些
    的頭像 發(fā)表于 10-22 16:18 ?211次閱讀

    Mobileye端到端自動駕駛解決方案的深度解析

    強(qiáng)大的技術(shù)優(yōu)勢。 Mobileye的端到端解決方案概述 1.1 什么是端到端自動駕駛? 端到端自動駕駛解決方案是一種新型的智能系統(tǒng)架構(gòu),旨在通過AI學(xué)習(xí)從感知到?jīng)Q策再到操作的全流程。M
    的頭像 發(fā)表于 10-17 09:35 ?181次閱讀
    Mobileye端到端<b class='flag-5'>自動駕駛</b>解決方案的<b class='flag-5'>深度</b>解析

    NVIDIA推出全新深度學(xué)習(xí)框架fVDB

    在 SIGGRAPH 上推出的全新深度學(xué)習(xí)框架可用于打造自動駕駛汽車、氣候科學(xué)和智慧城市的 AI 就緒型虛擬表示。
    的頭像 發(fā)表于 08-01 14:31 ?480次閱讀

    FPGA在自動駕駛領(lǐng)域有哪些優(yōu)勢?

    FPGA(Field-Programmable Gate Array,現(xiàn)場可編程門陣列)在自動駕駛領(lǐng)域具有顯著的優(yōu)勢,這些優(yōu)勢使得FPGA成為自動駕駛技術(shù)中不可或缺的一部分。以下是FP
    發(fā)表于 07-29 17:11

    FPGA在自動駕駛領(lǐng)域有哪些應(yīng)用?

    控制。在視覺算法方面,F(xiàn)PGA利用自身并行處理和高速存儲器的特點(diǎn),極大地加快了算法的執(zhí)行速度,提高了運(yùn)算效率。 五、未來發(fā)展趨勢隨著自動駕駛技術(shù)的不斷發(fā)展,F(xiàn)PGA在自動駕駛領(lǐng)域的應(yīng)用
    發(fā)表于 07-29 17:09

    深度學(xué)習(xí)自動駕駛中的關(guān)鍵技術(shù)

    隨著人工智能技術(shù)的飛速發(fā)展,自動駕駛技術(shù)作為其中的重要分支,正逐漸走向成熟。在自動駕駛系統(tǒng)中,深度學(xué)習(xí)
    的頭像 發(fā)表于 07-01 11:40 ?570次閱讀

    中級自動駕駛架構(gòu)師應(yīng)該學(xué)習(xí)哪些知識

    隨著自動駕駛技術(shù)的成熟,對系統(tǒng)架構(gòu)師的需求逐漸增加。自動駕駛系統(tǒng)架構(gòu)師負(fù)責(zé)設(shè)計(jì)整個(gè)系統(tǒng)的結(jié)構(gòu)、組件、接口和數(shù)據(jù)流;需要協(xié)調(diào)不同領(lǐng)域的專業(yè)知識,確保系統(tǒng)的可靠性、安全性和性能??傊?,
    的頭像 發(fā)表于 06-20 21:47 ?223次閱讀

    初級自動駕駛架構(gòu)師應(yīng)該學(xué)習(xí)哪些知識

    隨著自動駕駛技術(shù)的成熟,對系統(tǒng)架構(gòu)師的需求逐漸增加。自動駕駛系統(tǒng)架構(gòu)師負(fù)責(zé)設(shè)計(jì)整個(gè)系統(tǒng)的結(jié)構(gòu)、組件、接口和數(shù)據(jù)流;需要協(xié)調(diào)不同領(lǐng)域的專業(yè)知識,確保系統(tǒng)的可靠性、安全性和性能。總之,
    的頭像 發(fā)表于 06-20 21:45 ?219次閱讀

    智能駕駛大模型:有望顯著提升自動駕駛系統(tǒng)的性能和魯棒性

    智能駕駛大模型是近年來人工智能領(lǐng)域自動駕駛領(lǐng)域最為前沿的研究方向之一,它融合了深度學(xué)習(xí)、多模態(tài)
    的頭像 發(fā)表于 05-07 17:20 ?1414次閱讀
    智能<b class='flag-5'>駕駛</b>大模型:有望顯著提升<b class='flag-5'>自動駕駛</b>系統(tǒng)的性能和魯棒性

    未來已來,多傳感器融合感知是自動駕駛破局的關(guān)鍵

    /L4級自動駕駛賽跑的元年。 馬斯克評論FSD 12.3版本的左轉(zhuǎn)彎操作就像人類司機(jī)一樣。如果FSD 12.3版本成功,將基本顛覆目前市場上的智能駕駛技術(shù)路線?;凇皵?shù)據(jù)/算法/算力”的無人
    發(fā)表于 04-11 10:26

    FPGA在深度學(xué)習(xí)應(yīng)用中或?qū)⑷〈鶪PU

    、筆記本電腦或機(jī)架式服務(wù)器上訓(xùn)練神經(jīng)網(wǎng)絡(luò)時(shí),這不是什么大問題。但是,許多部署深度學(xué)習(xí)模型的環(huán)境對 GPU 并不友好,比如自動駕駛汽車、工廠、機(jī)器人和許多智慧城市環(huán)境,在這些環(huán)境中硬件必須忍受熱、灰塵、濕度
    發(fā)表于 03-21 15:19

    為什么深度學(xué)習(xí)的效果更好?

    導(dǎo)讀深度學(xué)習(xí)是機(jī)器學(xué)習(xí)的一個(gè)子集,已成為人工智能領(lǐng)域的一項(xiàng)變革技術(shù),在從計(jì)算機(jī)視覺、自然語言處
    的頭像 發(fā)表于 03-09 08:26 ?543次閱讀
    為什么<b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b>的效果更好?

    LabVIEW開發(fā)自動駕駛的雙目測距系統(tǒng)

    LabVIEW開發(fā)自動駕駛的雙目測距系統(tǒng) 隨著車輛駕駛技術(shù)的不斷發(fā)展,自動駕駛技術(shù)正日益成為現(xiàn)實(shí)。從L2級別的輔助
    發(fā)表于 12-19 18:02

    金龍汽車與華為達(dá)成自動駕駛領(lǐng)域深度合作

    另外,金龍汽車已進(jìn)入自動駕駛領(lǐng)域,旗下智能車覆蓋了從1.6米到1.8米各種尺寸機(jī)型,致力于打造最全面的智能網(wǎng)聯(lián)產(chǎn)品線,滿足各類市場以及使用場景的出行需求。同時(shí),其L4級自動駕駛
    的頭像 發(fā)表于 12-13 09:43 ?1749次閱讀

    深度學(xué)習(xí)技術(shù)與邊緣學(xué)習(xí)技術(shù)的不同之處

    如今,AI技術(shù)的廣泛應(yīng)用已經(jīng)成為推動制造和物流領(lǐng)域自動化的核心驅(qū)動力??的鸵曀瞥龅?b class='flag-5'>深度學(xué)習(xí)和邊緣學(xué)習(xí)
    的頭像 發(fā)表于 11-17 10:44 ?517次閱讀