借助機器人的本體感覺對足式運動進行研究已有數(shù)十年。在以往的研究手段中,研究人員往往采用基于模型的方法開發(fā)神經(jīng)網(wǎng)絡(luò)控制器。但是,這類方法無法在那些現(xiàn)實世界里沒有見過的環(huán)境中得到應(yīng)用。
近年來,為了獲得更好的泛化性和魯棒性,研究者們開始采用無模型強化學(xué)習(xí),在模擬中訓(xùn)練控制器,然后將學(xué)習(xí)到的策略直接轉(zhuǎn)移到真實的機器人上。
那么,如何在無需遙控器操控的條件下,讓四足機器人實現(xiàn)在復(fù)雜地形上自由流暢地行走呢?
近期,來自美國加州大學(xué)圣地亞哥分校和麻省理工學(xué)院的研究團隊,開發(fā)了一個可以提高機器人 3D 感知能力的模型,能夠支配四足機器人在各種困難地形場景下完成自動化行走,比如爬樓梯、踩石頭、在樹林中走路等。
如視頻所示,該四足機器人的額頭上裝有前置的深度攝像頭,該攝像頭向下傾斜的角度,可以幫助該機器人前面的兩足,根據(jù)所看到的前方場景和腳下地形做出正確的行動決策。但其后面的兩足必須先記住前面看過的內(nèi)容,才能確保在經(jīng)過時踩在正確的位置上。
所以,這中間存在一個重要的問題,即需要一個短期的 3D 環(huán)境記憶體,能夠使得機器人的四足都對三維環(huán)境有良好的感知和模擬。
為此,該團隊構(gòu)建了一種神經(jīng)體積記憶(Neural Volumetric Memory,NVM)架構(gòu),可以先借助自監(jiān)督方法對視頻幀中的三維特征進行學(xué)習(xí),再用幾何變換把這些三維特征投影到同一個空間下面,最后通過模型將所有的特征信息融合在一起,讓機器人對它所處的 3D 環(huán)境建立起短期記憶。
其中,需要說明的是,將上述帶有特征的全部視覺信息綜合在一起,可以幫助四足機器人記住其看到的內(nèi)容,以及足部之前做過的動作,并利用這些記憶指導(dǎo)它下一步行動。這也表明,NVM 能為機器人執(zhí)行決策提供可靠的 3D 結(jié)構(gòu)信息,并為足式機器人利用視覺進行觀察開辟新的可能性。
2023 年 3 月,相關(guān)論文以《用于視覺運動控制的神經(jīng)體積記憶》(Neural Volumetric Memory for Visual Locomotion Control)為題發(fā)表在CVPR上,并被選為Highlight論文[1]。
圖丨相關(guān)論文(來源:arXiv)
據(jù)介紹,該研究始于 2022 年 1 月。在當時的條件下,該團隊先在模擬器環(huán)境下進行訓(xùn)練,再轉(zhuǎn)至機器人上進行部署和測試。NVM 模塊可以令四足機器人在模擬環(huán)境和真實世界中穿越復(fù)雜地形,并獲得更好的模擬-真實泛化結(jié)果。
但是,由于模擬器和機器人在物理和視覺方面都存在一些差距,因此需要克服許多有難度的工程問題。此外,從模擬器中制定任務(wù),以及做強化學(xué)習(xí)訓(xùn)練所需的代碼,也需要該團隊自行開發(fā)。
圖丨實際部署(來源:arXiv)
據(jù)了解,這項成果建立在該團隊之前的一項研究上,此前,該團隊使用強化學(xué)習(xí)和基于 Transformer 的模型,將本體感受和視覺信息相結(jié)合,使得四足機器人能夠避開障礙物,在不平整的地面上行走和奔跑 [2]。
“我們目前這項研究是在不同幀上抽取三維特征,把它們放到同一個三維空間下進行合并,而之前的那項研究僅僅將不同幀直接合并起來,當做一個視頻放入卷積神經(jīng)網(wǎng)絡(luò)中,沒有做太多三維理解。”談及本項成果取得的進展,王小龍表示,“并且,之前機器人能完成的任務(wù)比較簡單,不能實現(xiàn)爬樓梯或踩木樁這種比較困難的任務(wù)。”
不過,該團隊也表示,他們目前開發(fā)的模型還存在一些局限性。首先,不能引導(dǎo)四足機器人到達指定的目的地;其次,完成部署后,機器人只能簡單地走一條直線,如果看到障礙物,會通過另一條直線避開;此外,機器人還不能精確控制其去向。
從應(yīng)用層面上看,相較于安裝輪子才能走路的機器人,四足機器人的通用性更強。比如,其可以用于應(yīng)急救援領(lǐng)域,執(zhí)行受困人員搜救、廢墟清理等任務(wù);用于下水管道探測等。
后續(xù),該團隊不僅計劃開發(fā)更多用于規(guī)劃機器人的技術(shù),還打算在四足機器人上增加機械臂,來執(zhí)行抓取、開門等任務(wù);同時,他們也想讓機器人實現(xiàn)更多創(chuàng)意性的技能,諸如跳躍、踢球等。
-
機器人
+關(guān)注
關(guān)注
210文章
27990瀏覽量
205547 -
模型
+關(guān)注
關(guān)注
1文章
3059瀏覽量
48575 -
3D感知
+關(guān)注
關(guān)注
0文章
19瀏覽量
3713
原文標題:科學(xué)家開發(fā)可提高3D感知能力的模型,實現(xiàn)四足機器人自由行走
文章出處:【微信號:tjrobot,微信公眾號:天津機器人】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論