0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Facebook讓機器人學(xué)會了自主繞道走路

Hf1h_BigDataDig ? 來源:fqj ? 2019-06-06 14:21 ? 次閱讀

人類每天都在進行不同層次的規(guī)劃活動,比如說每天早上起床以后,你習(xí)慣性走到廚房喝一杯咖啡:你會先走下走廊,左轉(zhuǎn)進入過道,然后進入右邊的房間。

對于這些習(xí)慣成自然的流程,你無需思考,不會刻意去想你要使用哪一個肢體動作。但對于機器人而言,這并非易事。

Facebook剛剛發(fā)布了主導(dǎo)研究的新系統(tǒng),讓機器人也可以通過觀看視頻,拆解動作,并學(xué)習(xí)如何組合這些動作形成自己的規(guī)劃。

層級抽象結(jié)構(gòu)(hierarchal abstractions)

已經(jīng)有越來越多的研究表明,層級抽象結(jié)構(gòu)(即視覺運動子程序)可以提高強化學(xué)習(xí)中的采樣效率,這是一種利用獎勵驅(qū)動智能體達到目標的AI訓(xùn)練技術(shù)。

在過去,這些層次結(jié)構(gòu)必須通過端到端的訓(xùn)練來手動編碼或獲取,而這需要大量的時間、注意力和長久的耐心。

Facebook這次的新研究提出,刻意讓機器人通過觀看視頻學(xué)習(xí)導(dǎo)航,描述一個通過用逆向機器學(xué)習(xí)模型攝取視頻偽標簽(在本文中,偽標簽指智能體想象的行為),從而學(xué)習(xí)層次結(jié)構(gòu)的系統(tǒng)。

論文作者分別來自Facebook AI研究室,加州大學(xué)伯克利分校和伊利諾伊大學(xué)厄巴納—香檳分校。

這讓人想起去年Facebook開源的一組模型——Talk the Walk。它只需要360°的全景圖像、自然語言以及一張有當?shù)氐貥耍ū热玢y行和餐館)的地圖就可以通過問路,實現(xiàn)在整個紐約市的街道導(dǎo)航。

具體實現(xiàn)方式

機器人通過觀看這些視頻,研究這些簡單的視覺運動子程序是如何組合以達到高級的抽象層次,這些視覺運動子程序能夠解決一些已知問題,即經(jīng)典的規(guī)劃中的高計算成本和強化學(xué)習(xí)中的樣本復(fù)雜性的問題。

研究者提出的系統(tǒng)分為兩個階段,在第一階段,研究人員通過運行在隨機探索數(shù)據(jù)上自我監(jiān)督的智能體模型生成偽標簽。模型從分布在四個環(huán)境中的1500個不同位置學(xué)習(xí),在不同的位置隨機執(zhí)行30個不同步驟的動作,從而產(chǎn)生45,000個交互樣本。

在系統(tǒng)的第二階段,大約217,000個偽標記視頻被剪輯成220萬個單獨的小視頻,再將其輸入預(yù)測參考視頻中相應(yīng)動作的模型,同時再通過一個單獨的網(wǎng)絡(luò)檢查參考視頻中的動作序列,并編碼其行為作為向量。另一個模型通過推斷第一幀的軌跡的編碼,來預(yù)測哪一個子程序可以調(diào)用給已有的視頻幀。

交互樣本從1000萬減少到4.5萬

在一個部署在辦公環(huán)境的真實世界中的機器人實驗中,研究人員表明,相比單純交互的方法,至少應(yīng)用在之前從未見過的環(huán)境上,通過觀看視頻來學(xué)習(xí)技能(這里指采用最高效的方式前往目標位置)的方式能達到更好的效果。

最令人印象深刻的是,訓(xùn)練有素的模型學(xué)會了自主地前進導(dǎo)航并避開障礙物,比通過單純交互方式要快4倍,這使得機器人能夠做到完全自主地長距離行進。

“特別引人注目的是,這些模型從總計45,000次的環(huán)境交互中學(xué)習(xí),”研究人員寫道,“從第一視角的視頻中成功學(xué)習(xí),使得智能體能夠執(zhí)行連貫的軌跡,即使它只執(zhí)行過隨機動作。此外,它優(yōu)于最先進的技能學(xué)習(xí)技術(shù),該技術(shù)需要更大量的訓(xùn)練樣本,大致1000萬個?!?/p>

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 機器人
    +關(guān)注

    關(guān)注

    210

    文章

    28007

    瀏覽量

    205577
  • Facebook
    +關(guān)注

    關(guān)注

    3

    文章

    1429

    瀏覽量

    54586

原文標題:Facebook讓機器人“觀看”上萬次視頻后,TA學(xué)會了自主繞道走路

文章出處:【微信號:BigDataDigest,微信公眾號:大數(shù)據(jù)文摘】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    機器人的三大矩陣是什么及關(guān)系式

    機器人學(xué)中,三大矩陣主要指的是與機器人位移、速度和力相關(guān)的矩陣,它們分別揭示了機器人在不同空間(如關(guān)節(jié)空間和作業(yè)空間)之間的映射關(guān)系。這三大矩陣及其關(guān)系式可以概括如下: 1. T矩陣(變換矩陣
    的頭像 發(fā)表于 09-04 09:37 ?394次閱讀

    “卷不動了”?OTA來救場!智能機器人“永葆青春”的秘訣

    的掃地機器人突然學(xué)會了拖地,是不是很酷?OTA就是這種“逆天改命”成為可能的魔法! 1、智能機器人的發(fā)展趨勢與OTA機遇 智能機器人3.0
    的頭像 發(fā)表于 08-06 16:01 ?294次閱讀
    “卷不動了”?OTA來救場!智能<b class='flag-5'>機器人</b>“永葆青春”的秘訣

    ROS機器人開發(fā)更便捷,基于RK3568J+Debian系統(tǒng)發(fā)布!

    本帖最后由 Tronlong創(chuàng)龍科技 于 2024-7-19 17:18 編輯 ROS系統(tǒng)是什么 ROS(Robot Operating System)是一個適用于機器人的開源的元操作系統(tǒng)。它
    發(fā)表于 07-09 11:38

    NVIDIA Isaac 機器人平臺利用最新的生成式 AI 和先進的仿真技術(shù),加速 AI 機器人技術(shù)的發(fā)展

    觀眾展示了用于人形機器人學(xué)習(xí)的通用基礎(chǔ)模型 Project GR00T(代表通用機器人 00 技術(shù))。Project GR00T 利用 NVIDIA Isaac 機器人平臺的各種工具來創(chuàng)建用于人形
    的頭像 發(fā)表于 06-04 18:00 ?7580次閱讀
    NVIDIA Isaac <b class='flag-5'>機器人</b>平臺利用最新的生成式 AI 和先進的仿真技術(shù),加速 AI <b class='flag-5'>機器人</b>技術(shù)的發(fā)展

    奧比中光攜手新加坡LionsBot,智能清潔機器人落地超過30個國家

    近年來,隨著AI 3D視覺技術(shù)飛速發(fā)展,各類創(chuàng)新型自主移動機器人不斷涌現(xiàn)。行業(yè)領(lǐng)先的機器人視覺與AI視覺科技公司奧比中光與新加坡自主清潔機器人
    的頭像 發(fā)表于 04-16 09:32 ?507次閱讀

    NVIDIA Isaac機器人平臺升級,加速AI機器人技術(shù)革新

    NVIDIA Isaac機器人平臺近期實現(xiàn)重大升級,通過引入最新的生成式AI技術(shù)和先進的仿真技術(shù),顯著加速了AI機器人技術(shù)的發(fā)展步伐。該平臺正不斷擴展其基礎(chǔ)模型、機器人學(xué)習(xí)框架、AI工作流編排以及
    的頭像 發(fā)表于 03-27 10:36 ?567次閱讀

    機器人學(xué)習(xí)中主流智能抓取方案

    RGB顏色空間由紅綠藍三種基本色組成,疊加成任意色彩,同樣地,任意一種顏色也可以拆解為三種基本色的組合,機器人通過顏色坐標值來理解“顏色”。
    發(fā)表于 03-13 10:07 ?262次閱讀
    <b class='flag-5'>機器人學(xué)</b>習(xí)中主流智能抓取方案

    自主移動機器人(AMR)功能和特點

    復(fù)合機器人是一種集成了移動機器人、協(xié)作機器人機器視覺等多項功能的新型機器人。它的開發(fā)目的是為了解決工廠物流中最后一米的問題,提供智能搬運解
    的頭像 發(fā)表于 02-28 15:05 ?1839次閱讀
    <b class='flag-5'>自主</b>移動<b class='flag-5'>機器人</b>(AMR)功能和特點

    5個問題,洞悉自主移動機器人未來發(fā)展方向

    隨著科技的日新月異,人類與機器人的互動將愈發(fā)頻繁。從早晨在本地咖啡店里,協(xié)作機器人(cobot)為顧客精心沖泡咖啡,到在倉庫中,自主移動機器人(AMR)自由穿梭各處揀選包裹。協(xié)作
    的頭像 發(fā)表于 01-09 08:30 ?618次閱讀
    5個問題,洞悉<b class='flag-5'>自主</b>移動<b class='flag-5'>機器人</b>未來發(fā)展方向

    倍加福傳感器AGV/AMR機器人工作更自主

    技術(shù),AGV/AMR機器人工作更自主。通過對倍加福產(chǎn)品及解決方案的展示,充分呈現(xiàn)了倍加福如何以前沿創(chuàng)新的傳感器科技,為AGV/AMR 應(yīng)用提供更完善的一站式解決方案,為物流行業(yè)智能化注入了新的活力。
    的頭像 發(fā)表于 12-22 13:50 ?789次閱讀

    工業(yè)機器人產(chǎn)業(yè)發(fā)展及應(yīng)用現(xiàn)狀

    機器人(Robot)是一種能夠半自主或全自主工作的智能機器機器人能夠通過編程和自動控制來執(zhí)行諸如作業(yè)或移動等任務(wù)。根據(jù)制造目的的不同,
    發(fā)表于 12-21 16:07 ?1234次閱讀
    工業(yè)<b class='flag-5'>機器人</b>產(chǎn)業(yè)發(fā)展及應(yīng)用現(xiàn)狀

    ROS機器人開發(fā)更便捷,基于RK3568J+Debian系統(tǒng)發(fā)布!

    ROS系統(tǒng)是什么 ROS(Robot Operating System)是一個適用于機器人的開源的元操作系統(tǒng)。它提供了操作系統(tǒng)應(yīng)有的服務(wù),包括硬件抽象,底層設(shè)備控制,常用函數(shù)的實現(xiàn),進程間消息傳遞
    發(fā)表于 11-30 16:01

    機器人中都有哪些坐標系

    坐標系是我們非常熟悉的一個概念,也是機器人學(xué)中的重要基礎(chǔ),在一個完整的機器人系統(tǒng)中,會存在很多坐標系,這些坐標系之間的位置關(guān)系該如何管理? ROS給我們提供了一個坐標系的管理神器——TF。 機器人
    的頭像 發(fā)表于 11-22 17:20 ?1341次閱讀
    <b class='flag-5'>機器人</b>中都有哪些坐標系

    目前幾種主流的機器人智能抓取系統(tǒng)方案

    機器人學(xué)習(xí)中的經(jīng)典問題之一便是分揀:在一堆無序擺放的物品堆中,取出目標物品。
    的頭像 發(fā)表于 11-14 14:20 ?1501次閱讀
    目前幾種主流的<b class='flag-5'>機器人</b>智能抓取系統(tǒng)方案

    基于ZigBee的井下救災(zāi)機器人自主通信研究

    電子發(fā)燒友網(wǎng)站提供《基于ZigBee的井下救災(zāi)機器人自主通信研究.pdf》資料免費下載
    發(fā)表于 10-31 10:55 ?0次下載
    基于ZigBee的井下救災(zāi)<b class='flag-5'>機器人</b><b class='flag-5'>自主</b>通信研究