0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

隨時(shí)隨地,追蹤每個(gè)像素,連遮擋都不怕的「追蹤一切」視頻算法來了

智能感知與物聯(lián)網(wǎng)技術(shù)研究所 ? 來源:未知 ? 2023-06-11 21:40 ? 次閱讀

Tracking Everything Everywhere All at Once.

前段時(shí)間,Meta 發(fā)布「分割一切(SAM)」AI 模型,可以為任何圖像或視頻中的任何物體生成 mask,讓計(jì)算機(jī)視覺(CV)領(lǐng)域研究者驚呼:「CV 不存在了」。之后,CV 領(lǐng)域掀起了一陣「二創(chuàng)」狂潮,一些工作陸續(xù)在分割的基礎(chǔ)上結(jié)合目標(biāo)檢測(cè)、圖像生成等功能,但大部分研究是基于靜態(tài)圖像的。

現(xiàn)在,一項(xiàng)稱為「追蹤一切」的新研究為動(dòng)態(tài)視頻中的運(yùn)動(dòng)估計(jì)提出了新方法,能夠準(zhǔn)確、完整地追蹤物體的運(yùn)動(dòng)軌跡。

該研究由來自康奈爾大學(xué)、谷歌研究院和 UC 伯克利的研究者共同完成。他們聯(lián)合提出了一種完整且全局一致的運(yùn)動(dòng)表征 OmniMotion,并提出一種新的測(cè)試時(shí)(test-time)優(yōu)化方法,對(duì)視頻中每個(gè)像素進(jìn)行準(zhǔn)確、完整的運(yùn)動(dòng)估計(jì)。

04c39d40-085d-11ee-962d-dac502259ad0.png

  • 論文地址:https://arxiv.org/abs/2306.05422

  • 項(xiàng)目主頁:https://omnimotion.github.io/

有網(wǎng)友在推特上轉(zhuǎn)發(fā)了這項(xiàng)研究,僅一天時(shí)間就收獲了 3500 + 的點(diǎn)贊量,研究內(nèi)容大受好評(píng)。

從該研究發(fā)布的 demo 看,運(yùn)動(dòng)追蹤的效果非常好,例如追蹤跳躍袋鼠的運(yùn)動(dòng)軌跡:

蕩秋千的運(yùn)動(dòng)曲線:

還能交互式查看運(yùn)動(dòng)追蹤情況:

即使物體被遮擋也能追蹤運(yùn)動(dòng)軌跡,如狗在跑動(dòng)的過程中被樹遮擋:

在計(jì)算機(jī)視覺領(lǐng)域,常用的運(yùn)動(dòng)估計(jì)方法有兩種:稀疏特征追蹤和密集光流。但這兩種方法各有缺點(diǎn),稀疏特征追蹤不能建模所有像素的運(yùn)動(dòng);密集光流無法長時(shí)間捕獲運(yùn)動(dòng)軌跡。

該研究提出的 OmniMotion 使用 quasi-3D 規(guī)范體積來表征視頻,并通過局部空間和規(guī)范空間之間的雙射(bijection)對(duì)每個(gè)像素進(jìn)行追蹤。這種表征能夠保證全局一致性,即使在物體被遮擋的情況下也能進(jìn)行運(yùn)動(dòng)追蹤,并對(duì)相機(jī)和物體運(yùn)動(dòng)的任何組合進(jìn)行建模。該研究通過實(shí)驗(yàn)表明所提方法大大優(yōu)于現(xiàn)有 SOTA 方法。

方法概述

該研究將幀的集合與成對(duì)的噪聲運(yùn)動(dòng)估計(jì)(例如光流場(chǎng))作為輸入,以形成整個(gè)視頻的完整、全局一致的運(yùn)動(dòng)表征。然后,該研究添加了一個(gè)優(yōu)化過程,使其可以用任何幀中的任何像素查詢表征,以在整個(gè)視頻中產(chǎn)生平滑、準(zhǔn)確的運(yùn)動(dòng)軌跡。值得注意的是,該方法可以識(shí)別畫面中的點(diǎn)何時(shí)被遮擋,甚至可以穿過遮擋追蹤點(diǎn)。

OmniMotion 表征

傳統(tǒng)的運(yùn)動(dòng)估計(jì)方法(例如成對(duì)光流),當(dāng)物體被遮擋時(shí)會(huì)失去對(duì)物體的追蹤。為了在遮擋的情況下也能提供準(zhǔn)確、一致的運(yùn)動(dòng)軌跡,該研究提出全局運(yùn)動(dòng)表征 OmniMotion。

該研究試圖在沒有顯式動(dòng)態(tài) 3D 重建的情況下準(zhǔn)確追蹤真實(shí)世界的運(yùn)動(dòng)。OmniMotion 表征將視頻中的場(chǎng)景表示為規(guī)范的 3D 體積,通過局部規(guī)范雙射(local-canonical bijection)映射成每個(gè)幀中的局部體積。局部規(guī)范雙射被參數(shù)化為神經(jīng)網(wǎng)絡(luò),并在不分離兩者的情況下捕獲相機(jī)和場(chǎng)景運(yùn)動(dòng)?;诖朔N方法,視頻可以被視為來自固定靜態(tài)相機(jī)局部體積的渲染結(jié)果。

wKgaomTYgtOAbH4KAAXBMZBqqCE495.png

由于 OmniMotion 沒有明確區(qū)分相機(jī)和場(chǎng)景運(yùn)動(dòng),所以形成的表征不是物理上準(zhǔn)確的 3D 場(chǎng)景重建。因此,該研究稱其為 quasi-3D 表征。

OmniMotion 保留了投影到每個(gè)像素的所有場(chǎng)景點(diǎn)的信息,以及它們的相對(duì)深度順序,這讓畫面中的點(diǎn)即使暫時(shí)被遮擋,也能對(duì)其進(jìn)行追蹤。

實(shí)驗(yàn)及結(jié)果

定量比較

研究者將提出的方法與 TAP-Vid 基準(zhǔn)進(jìn)行比較,結(jié)果如表 1 所示??梢钥闯?,在不同的數(shù)據(jù)集上,他們的方法始終能實(shí)現(xiàn)最佳的位置準(zhǔn)確性、遮擋準(zhǔn)確性和時(shí)序一致性。他們的方法可以很好地處理來自 RAFT 和 TAP-Net 的不同的成對(duì)對(duì)應(yīng)輸入,并且在這兩種基準(zhǔn)方法上提供了一致的改進(jìn)。

0d73db26-085d-11ee-962d-dac502259ad0.png

定性比較

如圖 3 所示,研究者對(duì)他們的方法和基線方法進(jìn)行了定性比較。新方法在(長時(shí)間)遮擋事件中顯示出了出色的識(shí)別和追蹤的能力,同時(shí)在遮擋期間為點(diǎn)提供合理的位置,并處理很大的攝像機(jī)運(yùn)動(dòng)視差。

wKgZomTYgxOAVFZRAAepLTl23yo522.png

消融實(shí)驗(yàn)與分析

研究者利用消融實(shí)驗(yàn)來驗(yàn)證他們?cè)O(shè)計(jì)決策的有效性,結(jié)果如表 2 所示。

0e4b0f56-085d-11ee-962d-dac502259ad0.png

在圖 4 中,他們展示了由他們的模型生成的偽深度圖,以展示學(xué)習(xí)到的深度排序。

wKgaomTYgy6APHeiAAcuO0q5oxM428.png

需要注意的是,這些圖并不對(duì)應(yīng)于物理深度,然而,它們展示了僅使用光度和光流信號(hào)時(shí),新方法能夠有效地確定不同表面之間的相對(duì)順序,這對(duì)于在遮擋中進(jìn)行追蹤至關(guān)重要。更多的消融實(shí)驗(yàn)和分析結(jié)果可以在補(bǔ)充材料中找到。


原文標(biāo)題:隨時(shí)隨地,追蹤每個(gè)像素,連遮擋都不怕的「追蹤一切」視頻算法來了

文章出處:【微信公眾號(hào):智能感知與物聯(lián)網(wǎng)技術(shù)研究所】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴

原文標(biāo)題:隨時(shí)隨地,追蹤每個(gè)像素,連遮擋都不怕的「追蹤一切」視頻算法來了

文章出處:【微信號(hào):tyutcsplab,微信公眾號(hào):智能感知與物聯(lián)網(wǎng)技術(shù)研究所】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    園區(qū)封閉化管理之人員和車輛定位及軌跡追蹤

    如今園區(qū)封閉化管理的需求越來越普遍,特別是化工類的園區(qū),為了實(shí)現(xiàn)對(duì)園區(qū)內(nèi)人員和車輛的準(zhǔn)確高效管控,人車定位及軌跡追蹤技術(shù)應(yīng)運(yùn)而生。本文將介紹這技術(shù)在園區(qū)封閉化管理中的重要作用。 、 什么是人車
    的頭像 發(fā)表于 10-11 11:20 ?152次閱讀
    園區(qū)封閉化管理之人員和車輛定位及軌跡<b class='flag-5'>追蹤</b>

    無線定位器追蹤器跟手機(jī)怎么連接

    無線定位器追蹤器與手機(jī)的連接方法主要取決于追蹤器的類型和功能。以下是些常見的連接方式: 、藍(lán)牙連接 確保兼容性 :首先,確保你的定位器追蹤
    的頭像 發(fā)表于 09-29 10:01 ?480次閱讀

    如何遠(yuǎn)離網(wǎng)絡(luò)追蹤

    分享如何避免被網(wǎng)絡(luò)追蹤。 ? 常見的網(wǎng)絡(luò)追蹤方式 1.IP 地址追蹤每個(gè)設(shè)備在網(wǎng)絡(luò)上都會(huì)匹配唯 IP 地址,通過該?IP 地址可以確定設(shè)
    的頭像 發(fā)表于 09-03 16:57 ?238次閱讀
    如何遠(yuǎn)離網(wǎng)絡(luò)<b class='flag-5'>追蹤</b>

    迅為RK3588開發(fā)板RKNPU2項(xiàng)目實(shí)戰(zhàn)2SORT目標(biāo)追蹤

    1.介紹和視頻演示 2.在模擬器實(shí)現(xiàn)圖片的目標(biāo)追蹤 3.板推理和嵌入式部署 4.視頻目標(biāo)追蹤的實(shí)現(xiàn)(python) 5.C++實(shí)現(xiàn)目標(biāo)
    發(fā)表于 07-10 11:08

    英倫科技裸眼3D平板電腦——便攜尺寸,隨時(shí)隨地的私人影院

    隨著科技的快速發(fā)展,我們的娛樂和生活方式正在經(jīng)歷前所未有的變革。如今,英倫科技以其顛覆性的裸眼3D平板電腦再次突破想象的邊界,為用戶帶來場(chǎng)無與倫比的視覺盛宴。這款產(chǎn)品不僅讓你擺脫了沉重的VR設(shè)備和專用眼鏡,更以其10.1寸的便攜尺寸,讓精彩世界隨時(shí)隨地隨心展開。
    的頭像 發(fā)表于 06-13 10:35 ?238次閱讀
    英倫科技裸眼3D平板電腦——便攜尺寸,<b class='flag-5'>隨時(shí)隨地</b>的私人影院

    如何利用NVIDIA中的單視角3D追蹤功能減輕視覺感知中的遮擋現(xiàn)象?

    說到智能視頻分析(IVA)應(yīng)用(如交通監(jiān)控、倉庫安全和零售消費(fèi)者分析)的感知,最大的挑戰(zhàn)之就是遮擋。
    的頭像 發(fā)表于 05-17 10:36 ?323次閱讀
    如何利用NVIDIA中的單視角3D<b class='flag-5'>追蹤</b>功能減輕視覺感知中的<b class='flag-5'>遮擋</b>現(xiàn)象?

    卡爾曼濾波是什么 卡爾曼濾波與目標(biāo)追蹤技術(shù)分析

    卡爾曼濾波以及其擴(kuò)展算法能夠應(yīng)用于目標(biāo)狀態(tài)估計(jì),如果這個(gè)目標(biāo)是行人,那么就是行人狀態(tài)估計(jì)(或者說行人追蹤),如果這個(gè)目標(biāo)是自身,那么就是車輛自身的追蹤(結(jié)合些地圖的先驗(yàn),GPS等數(shù)據(jù)
    的頭像 發(fā)表于 04-29 09:46 ?737次閱讀
    卡爾曼濾波是什么 卡爾曼濾波與目標(biāo)<b class='flag-5'>追蹤</b>技術(shù)分析

    4G路由器:讓你隨時(shí)隨地暢享網(wǎng)絡(luò)便利

    當(dāng)今時(shí)代無論是瀏覽新聞、查閱資料,還是在線購物、遠(yuǎn)程辦公,甚至是視頻會(huì)議和在線教育,網(wǎng)絡(luò)都發(fā)揮著無可替代的作用。然而,傳統(tǒng)的有線路由器由于其固定的位置和連接方式,往往限制了我們的網(wǎng)絡(luò)使用范圍。為了解決這問題,4G路由器應(yīng)運(yùn)而生,它憑借其便攜性和移動(dòng)性,讓我們
    的頭像 發(fā)表于 04-09 15:05 ?403次閱讀

    追蹤跳線都用哪些場(chǎng)景

    鷹眼追蹤跳線是種用于機(jī)房管理的工具,可以查詢銅纜和光纜(包括超五類、六類、超六類屏蔽/非屏蔽,單模/多模光纖等)。其應(yīng)用場(chǎng)景包括但不限于: 機(jī)房管理:機(jī)房是網(wǎng)絡(luò)設(shè)備的核心區(qū)域,鷹眼追蹤跳線可用
    的頭像 發(fā)表于 03-21 10:03 ?328次閱讀

    追蹤跳線是電子光纖配線架上專用的嗎?

    是的,追蹤跳線通常是在電子光纖配線架(Electronics Fiber Distribution Frame,EFDF)上使用的專用跳線。EFDF是個(gè)中心化的電子光纖交叉配線架,通常
    的頭像 發(fā)表于 03-16 14:51 ?351次閱讀

    隨時(shí)隨地辦公無憂!訊飛星火AI商務(wù)鍵盤長續(xù)航

    作為名經(jīng)常出差的商務(wù)人士,我深知辦公效率的重要性。以前,我總是為繁瑣的辦公操作而煩惱,但是現(xiàn)在,有了科大訊飛AI智能鍵盤D1,辦公效率大大提高,讓我隨時(shí)隨地辦公無憂! 外觀小巧輕便,很方便
    的頭像 發(fā)表于 01-05 15:49 ?641次閱讀
    <b class='flag-5'>隨時(shí)隨地</b>辦公無憂!訊飛星火AI商務(wù)鍵盤長續(xù)航

    追蹤器arduino原理

    追蹤器 (LDR) 是種基于光敏電阻的光測(cè)量器件,常用于測(cè)量光強(qiáng)度和控制感應(yīng)器。在 Arduino 上使用 LDR,可以實(shí)現(xiàn)對(duì)光線進(jìn)行檢測(cè)、測(cè)量和控制的功能。本文將詳細(xì)介紹 LDR
    的頭像 發(fā)表于 12-08 10:22 ?1235次閱讀

    低功耗藍(lán)牙模塊在運(yùn)動(dòng)健身追蹤中的革新應(yīng)用

    隨著健康和健身意識(shí)的不斷提升,人們對(duì)運(yùn)動(dòng)追蹤技術(shù)的需求日益增加。低功耗藍(lán)牙模塊的引入為運(yùn)動(dòng)健身追蹤領(lǐng)域帶來了新的可能性。本文將探討低功耗藍(lán)牙模塊在運(yùn)動(dòng)健身追蹤中的創(chuàng)新應(yīng)用,重點(diǎn)關(guān)注其在
    的頭像 發(fā)表于 11-29 14:50 ?382次閱讀

    基于RFID、GPS、GPRS的物流追蹤系統(tǒng)的研制

    電子發(fā)燒友網(wǎng)站提供《基于RFID、GPS、GPRS的物流追蹤系統(tǒng)的研制.pdf》資料免費(fèi)下載
    發(fā)表于 11-07 10:59 ?0次下載
    基于RFID、GPS、GPRS的物流<b class='flag-5'>追蹤</b>系統(tǒng)的研制

    基于CmBacktrace庫,如何快速追蹤和定位產(chǎn)生HardFault的原因

    基于CmBacktrace庫,如何快速追蹤和定位產(chǎn)生HardFault的原因
    的頭像 發(fā)表于 10-27 09:51 ?2641次閱讀
    基于CmBacktrace庫,如何快速<b class='flag-5'>追蹤</b>和定位產(chǎn)生HardFault的原因