0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

輕量級(jí)占用網(wǎng)絡(luò)FlashOcc:主打?qū)崟r(shí)性,高精度高效內(nèi)存

后摩智能 ? 來(lái)源:后摩智能 ? 2024-01-16 11:37 ? 次閱讀

特斯拉在2021 AI Day上提出BEV障礙物感知的思路后,BEV逐漸成為業(yè)界爭(zhēng)相落地的熱點(diǎn)。

但BEV也存在一些待解決問題,比如:

(1) 僅能對(duì)真實(shí)世界中類別限定的目標(biāo)進(jìn)行的感知(如圖1.b所示),如果想得到可行駛區(qū)域、環(huán)島、人行橫道、上方障礙物(如各類紅綠燈或攝像頭懸臂、地庫(kù)限高架等)、臨時(shí)廣告牌等,需要額外的感知模塊去進(jìn)行處理;

(2) 障礙物僅能用3D框描述,具體的形狀輪廓也丟失了;

(3) 如果行駛環(huán)境中出現(xiàn)沒見過(guò)的物體(如圖1.a中右下角的紅色移動(dòng)廣告牌或者紅綠燈懸臂),那障礙物檢測(cè)也會(huì)失效,只能通過(guò)多模態(tài)開放場(chǎng)景檢測(cè)技術(shù)來(lái)彌補(bǔ)這類問題,但是這在目前算力有限的自動(dòng)駕駛芯片上是無(wú)法實(shí)現(xiàn)的。

因此在2022的AI day上特斯拉提出占據(jù)預(yù)測(cè)的新思路,成功解決了上述問題。占據(jù)預(yù)測(cè)任務(wù)就是將以自車為中心的三維空間劃分成一個(gè)個(gè)小的體素柵格,然后預(yù)測(cè)每個(gè)柵格的語(yǔ)義類別。具體效果如圖1.c所示,可以看出占據(jù)預(yù)測(cè)可以對(duì)整個(gè)復(fù)雜世界的所有物體進(jìn)行有效感知,從而有效的解決上述障礙物預(yù)測(cè)的問題。

但是現(xiàn)有公開的占據(jù)預(yù)測(cè)方法都需要構(gòu)建三維體素級(jí)的特征表示,這不可避免地引入大量計(jì)算資源消耗,此外還需要硬件平臺(tái)對(duì)3D(可變形)卷積或者transformer模塊有較好的支持,這些都阻礙了業(yè)界將占用預(yù)測(cè)在實(shí)車上的部署落地。

553a0bb4-b420-11ee-8b88-92fbcf53809c.png

圖 1. 障礙物檢測(cè)與占據(jù)預(yù)測(cè)效果對(duì)比。受訓(xùn)練數(shù)據(jù)約束,預(yù)測(cè)范圍為前后左右40m,上下-1m到5.4m,柵格粒度0.4m。

與使模型變得更大、更復(fù)雜從而取得優(yōu)異性能的趨勢(shì)相反,理想的框架應(yīng)該對(duì)不同的端上芯片部署友好,并且保持高精度。本著輕量易部署且性能無(wú)損甚至還提升的初衷下,大連理工、后摩智能以及阿德萊德聯(lián)合提出了一種簡(jiǎn)單輕量的占據(jù)插件,稱之為FlashOCC。

通過(guò)在主流占據(jù)方法(BEVDetOcc、FBOcc、UniOcc等)上的驗(yàn)證,證明了FlashOCC在部署顯存需求、推理時(shí)間、訓(xùn)練耗時(shí)以及模型精度上都取得了最優(yōu)的權(quán)衡,并且對(duì)各類端上芯片部署友好。

554cdece-b420-11ee-8b88-92fbcf53809c.png

論文地址:https://arxiv.org/abs/2311.12058

代碼鏈接:https://github.com/Yzichen/FlashOCC

內(nèi)容簡(jiǎn)介

方法架構(gòu):

555f2d7c-b420-11ee-8b88-92fbcf53809c.png

圖 2插件概述以及綜合性能比對(duì)

FlashOcc以極優(yōu)的精度完成了實(shí)時(shí)環(huán)視3D占用預(yù)測(cè),代表了該領(lǐng)域的開創(chuàng)性貢獻(xiàn)。此外,它還展示了跨不同車載平臺(tái)部署的優(yōu)越性,因?yàn)?strong>不需要昂貴的體素級(jí)特征處理,從而避免了transformer或 3D(可變形)卷積算子。FlashOcc通過(guò)2類替換對(duì)現(xiàn)有基于體素級(jí)3D特征的占據(jù)任務(wù)進(jìn)行提升:

(1) 用2D卷積替換3D卷積;

(2) 用通道到高度變換替換從3D卷積得到的占用預(yù)測(cè),具體如圖1.(a)所示。圖1.(b)則通過(guò)圖表詳細(xì)說(shuō)明了模型精度與速度、推理內(nèi)存消耗以及訓(xùn)練時(shí)間等因素之間的權(quán)衡。

雖然FlashOcc專注于以即插即用的方式增強(qiáng)現(xiàn)有模型,但它仍然可以分為五個(gè)基本模塊,具體如圖2所示:

(1) 用于提取圖像特征的2D圖像編碼器。

(2) 將2D圖像特征映射到BEV表征的視圖轉(zhuǎn)換模塊。

(3) 修正BEV特征的BEV編碼器。

(4) 預(yù)測(cè)每個(gè)體素分割標(biāo)簽的占用預(yù)測(cè)頭。

(5) 集成歷史信息以提高性能的時(shí)間融合模塊(可選)。

5573f3ce-b420-11ee-8b88-92fbcf53809c.png

圖 3框架圖

實(shí)驗(yàn)表明我們方法在同比條件下都取得了最優(yōu)的性能以及訓(xùn)練及部署資源消耗。

5588290c-b420-11ee-8b88-92fbcf53809c.png

表 1Occ3D-nuSences驗(yàn)證集上的性能

5597283a-b420-11ee-8b88-92fbcf53809c.png

表 2訓(xùn)練及部署消耗說(shuō)明

下圖對(duì)模型預(yù)測(cè)進(jìn)行可視化。由于用于訓(xùn)練的數(shù)據(jù)的柵格細(xì)粒度是40cmx40cmx40cm,因此對(duì)細(xì)節(jié)的構(gòu)建較為粗糙。但即便如此,可以看到我們的方法可以有效預(yù)測(cè)橫跨馬路懸空的紅綠燈,這證明FlashOcc有效的構(gòu)建了高度信息,此外懸空樹木的輪廓預(yù)測(cè)也證明了這一點(diǎn);而圖中表示行人的占據(jù)柵格,在胸口前柵格占據(jù)表示手持手機(jī)、腿后柵格占據(jù)表示后拉行李箱,證明我們方法對(duì)細(xì)節(jié)外形捕捉能力;交通錐的準(zhǔn)確預(yù)測(cè)證明了小目標(biāo)捕獲能力。

55a6bcd2-b420-11ee-8b88-92fbcf53809c.png

圖 4 可視化。受訓(xùn)練數(shù)據(jù)約束,預(yù)測(cè)范圍為前后左右40m,上下-1m到5.4m,柵格粒度0.4m。

總結(jié)與展望

FlashOcc初步探索了性能無(wú)損端上部署友好輕量級(jí)占用預(yù)測(cè)方法,為占據(jù)任務(wù)實(shí)車落地提供技術(shù)原型支撐,精度、效率和內(nèi)存消耗均超越當(dāng)前SOTA。未來(lái)進(jìn)一步探索高效的端上可部署的端到端自動(dòng)駕駛方案將是我們重要的研究方向。







審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • FlaSh
    +關(guān)注

    關(guān)注

    10

    文章

    1610

    瀏覽量

    147606
  • 特斯拉
    +關(guān)注

    關(guān)注

    66

    文章

    6265

    瀏覽量

    126373
  • 自動(dòng)駕駛芯片
    +關(guān)注

    關(guān)注

    3

    文章

    47

    瀏覽量

    5069

原文標(biāo)題:后摩前沿 | 輕量級(jí)占用網(wǎng)絡(luò)FlashOcc:主打?qū)崟r(shí)性,高精度高效內(nèi)存

文章出處:【微信號(hào):后摩智能,微信公眾號(hào):后摩智能】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    音頻信號(hào)采集為什么要用專用的CODEC來(lái)實(shí)現(xiàn),普通高精度高采樣率ADC可以嗎?

    1、音頻信號(hào)采集為什么要用專用的CODEC來(lái)實(shí)現(xiàn),普通高精度高采樣率ADC可以嗎? 2、音頻信號(hào)為什么要過(guò)采樣。只是為了提高采樣精度嗎?如果只是為了提高采樣精度,為什么不用高精度的A
    發(fā)表于 10-21 07:56

    VS高精度電壓傳感器

    ? ? ? ? VS系列電壓傳感器是一種量程覆蓋35kV及以下的直流、交流、周期脈沖以及各種不規(guī)則波形的電壓傳感器,精度高達(dá)0.05%FS、帶寬高達(dá)100kHz,可滿足寬頻帶、高精度電壓測(cè)試需求
    的頭像 發(fā)表于 09-19 15:55 ?212次閱讀
    VS<b class='flag-5'>高精度</b>電壓傳感器

    TMAG5123平面高精度高壓霍爾效應(yīng)開關(guān)數(shù)據(jù)表

    電子發(fā)燒友網(wǎng)站提供《TMAG5123平面高精度高壓霍爾效應(yīng)開關(guān)數(shù)據(jù)表.pdf》資料免費(fèi)下載
    發(fā)表于 08-12 10:47 ?0次下載
    TMAG5123平面<b class='flag-5'>高精度高</b>壓霍爾效應(yīng)開關(guān)數(shù)據(jù)表

    TMAG5123-Q1 汽車類平面高精度高壓霍爾效應(yīng)開關(guān)數(shù)據(jù)表

    電子發(fā)燒友網(wǎng)站提供《TMAG5123-Q1 汽車類平面高精度高壓霍爾效應(yīng)開關(guān)數(shù)據(jù)表.pdf》資料免費(fèi)下載
    發(fā)表于 08-12 09:56 ?0次下載
    TMAG5123-Q1 汽車類平面<b class='flag-5'>高精度高</b>壓霍爾效應(yīng)開關(guān)數(shù)據(jù)表

    國(guó)產(chǎn)芯上運(yùn)行TinyMaxi輕量級(jí)的神經(jīng)網(wǎng)絡(luò)推理庫(kù)-米爾基于芯馳D9國(guó)產(chǎn)商顯板

    本篇測(cè)評(píng)由優(yōu)秀測(cè)評(píng)者“短笛君”提供。本文將介紹基于米爾電子MYD-YD9360商顯板(米爾基于芯馳D9360國(guó)產(chǎn)開發(fā)板)的TinyMaxi輕量級(jí)的神經(jīng)網(wǎng)絡(luò)推理庫(kù)方案測(cè)試。 算力測(cè)試TinyMaix
    發(fā)表于 08-09 18:26

    實(shí)時(shí)Linux:解鎖高效能和可靠的關(guān)鍵

    實(shí)時(shí)Linux結(jié)合容器技術(shù),提供了高度靈活和可擴(kuò)展的解決方案,特別適合于需要快速響應(yīng)和高可靠的應(yīng)用場(chǎng)景。實(shí)時(shí)Linux能夠保證關(guān)鍵任務(wù)及時(shí)執(zhí)行,而容器技術(shù)則為應(yīng)用提供了輕量級(jí)、隔離的
    的頭像 發(fā)表于 08-08 11:21 ?201次閱讀
    <b class='flag-5'>實(shí)時(shí)</b>Linux:解鎖<b class='flag-5'>高效</b>能和可靠<b class='flag-5'>性</b>的關(guān)鍵

    國(guó)產(chǎn)芯上運(yùn)行TinyMaxi輕量級(jí)的神經(jīng)網(wǎng)絡(luò)推理庫(kù)-米爾基于芯馳D9國(guó)產(chǎn)商顯板

    D9360國(guó)產(chǎn)開發(fā)板)的TinyMaxi輕量級(jí)的神經(jīng)網(wǎng)絡(luò)推理庫(kù)方案測(cè)試。 算力測(cè)試 TinyMaix 是面向單片機(jī)的超輕量級(jí)的神經(jīng)網(wǎng)絡(luò)推理庫(kù),即 TinyML 推理庫(kù),可以讓你在任意
    發(fā)表于 08-07 18:06

    國(guó)產(chǎn)芯上運(yùn)行TinyMaxi輕量級(jí)的神經(jīng)網(wǎng)絡(luò)推理庫(kù)-米爾基于芯馳D9國(guó)產(chǎn)商顯板

    本篇測(cè)評(píng)由與非網(wǎng)的優(yōu)秀測(cè)評(píng)者“短笛君”提供。本文將介紹基于米爾電子MYD-YD9360商顯板(米爾基于芯馳D9360國(guó)產(chǎn)開發(fā)板)的TinyMaxi輕量級(jí)的神經(jīng)網(wǎng)絡(luò)推理庫(kù)方案測(cè)試。算力測(cè)試
    的頭像 發(fā)表于 07-05 08:02 ?1781次閱讀
    國(guó)產(chǎn)芯上運(yùn)行TinyMaxi<b class='flag-5'>輕量級(jí)</b>的神經(jīng)<b class='flag-5'>網(wǎng)絡(luò)</b>推理庫(kù)-米爾基于芯馳D9國(guó)產(chǎn)商顯板

    OPA627-DIE高精度高速DIFET運(yùn)算放大器數(shù)據(jù)表

    電子發(fā)燒友網(wǎng)站提供《OPA627-DIE高精度高速DIFET運(yùn)算放大器數(shù)據(jù)表.pdf》資料免費(fèi)下載
    發(fā)表于 06-12 11:11 ?2次下載
    OPA627-DIE<b class='flag-5'>高精度高</b>速DIFET運(yùn)算放大器數(shù)據(jù)表

    芯片行業(yè)對(duì)高精度高低溫試驗(yàn)箱的需求日益凸顯

    芯片行業(yè)對(duì)高精度高低溫試驗(yàn)箱的需求日益凸顯
    的頭像 發(fā)表于 05-13 21:16 ?540次閱讀
    芯片行業(yè)對(duì)<b class='flag-5'>高精度高</b>低溫試驗(yàn)箱的需求日益凸顯

    未來(lái)輕量級(jí)深度學(xué)習(xí)技術(shù)探索

    除了輕量級(jí)架構(gòu)設(shè)計(jì)外,作者提到了可以應(yīng)用于壓縮給定架構(gòu)的各種高效算法。例如,量化方法 旨在減少數(shù)據(jù)所需的存儲(chǔ)空間,通常是通過(guò)用8位或16位數(shù)字代替32位浮點(diǎn)數(shù),甚至使用二進(jìn)制值表示數(shù)據(jù)。
    發(fā)表于 04-23 15:54 ?346次閱讀
    未來(lái)<b class='flag-5'>輕量級(jí)</b>深度學(xué)習(xí)技術(shù)探索

    百度智能云推出全新輕量級(jí)大模型

    在近日舉辦的百度智能云千帆產(chǎn)品發(fā)布會(huì)上,三款全新的輕量級(jí)大模型——ERNIE Speed、ERNIE Lite以及ERNIE Tiny,引起了業(yè)界的廣泛關(guān)注。相較于傳統(tǒng)的千億級(jí)別參數(shù)大模型,這些輕量級(jí)大模型在參數(shù)量上有了顯著減少,為客戶提供了更加靈活和經(jīng)濟(jì)
    的頭像 發(fā)表于 03-22 10:28 ?574次閱讀

    輕量級(jí)數(shù)據(jù)庫(kù)有哪些類型

    輕量級(jí)數(shù)據(jù)庫(kù)是指具有小巧、靈活、高效的特點(diǎn),適用于小規(guī)模項(xiàng)目和嵌入式設(shè)備的數(shù)據(jù)庫(kù)管理系統(tǒng)。下面是對(duì)輕量級(jí)數(shù)據(jù)庫(kù)類型的詳細(xì)介紹,包括關(guān)系型數(shù)據(jù)庫(kù)、非關(guān)系型數(shù)據(jù)庫(kù)、面向?qū)ο髷?shù)據(jù)庫(kù)等等。 關(guān)系型數(shù)據(jù)庫(kù)
    的頭像 發(fā)表于 12-20 11:29 ?1119次閱讀

    Linux輕量級(jí)工具集合Busybox的特點(diǎn)和使用

    Busybox是一個(gè)開源的、輕量級(jí)的軟件工具集合,旨在提供一個(gè)精簡(jiǎn)的Unix工具集,適用于嵌入式系統(tǒng)和資源受限的環(huán)境。它將許多常用的Unix工具(如ls、cp、cat、mv、grep、find、telnet等)合并為一個(gè)可執(zhí)行文件,從而減少了系統(tǒng)的存儲(chǔ)空間和資源占用
    的頭像 發(fā)表于 11-10 09:50 ?1308次閱讀

    i.MX RT1170:VGLite移植RT-Thread Nano過(guò)程講解(上)

    RT-Thread 是國(guó)人自主研發(fā)的開源實(shí)時(shí)操作系統(tǒng)(RTOS),RT-Thread Nano 是極簡(jiǎn)版的硬實(shí)時(shí)內(nèi)核,內(nèi)存占用小,移植簡(jiǎn)單。VGLite 是 NXP 提供的
    的頭像 發(fā)表于 11-09 11:20 ?2363次閱讀
    i.MX RT1170:VGLite移植RT-Thread Nano過(guò)程講解(上)