0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

人形機器人技術(shù)的發(fā)展與現(xiàn)狀

jh18616091022 ? 來源:AIOT大數(shù)據(jù) ? 2023-08-16 09:48 ? 次閱讀

技術(shù)革新+巨頭入局+政策激勵,多維度催化人形機器人落地

技術(shù)進步+巨頭入局+政策激勵加速 2023 年人形機器人產(chǎn)業(yè)發(fā)展。2023 年 ChatGPT 等大 語言模型超預期發(fā)展,增強人形機器人交互能力,拓寬其應(yīng)用領(lǐng)域;硬件方面,特斯拉科技公司紛紛入局,有望加快產(chǎn)業(yè)鏈技術(shù)進步。我們認為人形雙足機器人為通用機器人的 最優(yōu)解,因為人類社會的種種事物都按照人類的生理結(jié)構(gòu)進行設(shè)計,貼近人類形態(tài)的雙足 機器人更能適應(yīng)種類多樣的任務(wù),達到通用的目的,隱形成本較小。隨著科技龍頭入局、 ChatGPT 等 AI 技術(shù)加速、相關(guān)政策密集落地,作為“具身智能”理想載體的人形機器人 在多種因素的推動下有望快速發(fā)展。

大模型幫助機器人思考學習,推動具身智能發(fā)展。英偉達創(chuàng)始人兼 CEO 黃仁勛在 ITF World 2023 半導體大會上表示,AI 下一個浪潮將是“具身智能”,即能夠理解、推理物理 世界并與物理世界互動的智能系統(tǒng)。微軟、Google、英偉達等大廠均積極開展具身智能相 關(guān)研究。微軟基于 ChatGPT 的強大自然語言理解和推理能力生成控制機器人的相關(guān)代碼; 英偉達 VIMA 基于 T5 模型,將文本和多模態(tài)輸入交錯融合,結(jié)合歷史信息預測機器人的 下一步行動動作;英偉達 OPTIMUS 使用任務(wù)運動規(guī)劃器來自動生成足夠的機器人軌跡數(shù) 據(jù),然后訓練 Transformer 視覺-運動策略,進而預測機器人動作;谷歌 RT-2 則通過 VLM 與機器人數(shù)據(jù)的結(jié)合,賦予機器人語義理解和基本推理能力。大模型不斷進步提升人形機 器人交互能力,推動具身智能發(fā)展。

特斯拉機器人快速迭代,24 年有望在工廠投入使用。2021 年特斯拉在 AI Day 上首次提 出其人形機器人 Optimus 的渲染圖;2022 年 AI Day 上,特斯拉推出原型機,在沒有外接 線纜的情況下實現(xiàn)了緩慢行走與揮手;2023 年 5 月股東大會上,特斯拉人形機器人已經(jīng) 可以實現(xiàn)流暢的行走與抓取物品,靈活度較原型機大大提高。2023 年 7 月 20 日,馬斯克 表示,目前特斯拉人形機器人擎天柱的制造數(shù)量為 10 臺左右,將會在 2023 年 11 月左右 對特斯拉自己設(shè)計的執(zhí)行器進行行走等測試,明年人形機器人有望率先在內(nèi)部工廠投入使 用。在應(yīng)用場景方面,除了工廠以外,公司還考慮將人形機器人與 Neuralink 結(jié)合,為殘 障人士提供義肢應(yīng)用場景有望不斷拓展。

多方玩家布局人形機器人,百舸爭流加快硬件變革。除特斯拉外,國內(nèi)外多家公司積極研 發(fā)人形機器人并取得快速進步。2019 年波士頓動力機器人 Atlas 掌握“體操”技巧,能夠 連續(xù)的跳躍、翻滾;2022 年 8 月,小米發(fā)布人形機器人“Cyberone”;2023 年 4 月 1X technologies 機器人 EVE 應(yīng)用于美國和歐洲部分地區(qū)的商業(yè)場景;優(yōu)必選、傅利葉所生產(chǎn) 機器人都具備行走,與人協(xié)同完成動作等功能;三星宣布將于 2023 年 10 月闡述其 “Semicon 人形機器人”計劃。各高校實驗室也在積極嘗試各種技術(shù)路徑研發(fā)人形機器人, 清華大學交叉信息研究院陳建宇團隊機器人“小星”采用準直驅(qū)力控方案,可完成多種動 作。多方玩家并驅(qū)爭先,有望加速人形機器人硬件升級。

政策密集出臺,加速人形機器人產(chǎn)業(yè)化進程。2023 年 6 月 28 日,北京印發(fā)《北京市機器 人產(chǎn)業(yè)創(chuàng)新發(fā)展行動方案(2023-2025 年)》,強調(diào)要對標國際領(lǐng)先人形機器人產(chǎn)品,支持 企業(yè)和高校院所開展人形機器人研發(fā)和工程化,目標在 2025 年前實現(xiàn)百臺(套)級人形 機器人原型機的生產(chǎn),并在 3-4 個典型場景中開展示范性應(yīng)用。十四五以來,中央和地方 陸續(xù)推出支持人形機器人產(chǎn)業(yè)發(fā)展的政策,如《“十四五”機器人產(chǎn)業(yè)發(fā)展規(guī)劃》、《“機器 人”應(yīng)用行動實施方案》、《山東省制造業(yè)創(chuàng)新能力提升三年行動計劃(2023-2025 年)》、 《深圳市加快推動人工智能高質(zhì)量發(fā)展高水平應(yīng)用行動方案(2023-2024 年)》等。多地 利好政策有望推動人形機器人加快工程化和產(chǎn)業(yè)化。

決策層:大模型賦予機器人“大腦”,具身智能迎來曙光

大模型使機器人理解自然語言,增強泛化能力

大模型為機器人裝上“大腦”,提升其理解能力與泛化能力。谷歌 DeepMind 于 2023 年 7 月 28 日推出全球首個控制機器人的視覺-語言-動作(VLA)模型 RT-2;斯坦福大學李飛飛教 授研究團隊于 2023 年 7 月 12 日推出 VoxPoser,通過大語言模型加視覺語言模型指導機 器人行動。搭載此類模型的機器人可以像 ChatGPT 一樣被操縱,可理解自然語言指令并 且無需預定義的運動原語或額外的數(shù)據(jù)和訓練,具身智能迎來曙光(具身智能指具有身體 并支持物理交互的智能體,可借助智能算法實現(xiàn)理解推理并與物理世界互動)。大模型的 發(fā)展使機器人更容易理解人類指令并執(zhí)行動作以完成更好的交互,人形機器人產(chǎn)業(yè)化進度 有望加快。

RT-2/VoxPoser 實現(xiàn)自然語言編程,機器人“善解人意”。RT-2/VoxPoser 的一大突破是 使機器人可以理解自然語言指令,無需復雜的編程語言便可完成人機交互。RT-2 模型建 立在視覺-語言模型(VLM)的基礎(chǔ)上,賦予機器人語義理解和基本推理能力,使其可以聽 懂并自主推理出已滅絕動物(恐龍)和哪種飲料最適合疲憊的人(能量飲料);李飛飛團隊 VoxPoser 模型只需接收到“打開上面的抽屜,小心花瓶!”類似的指令即可執(zhí)行任務(wù);在 前華為天才少年彭志輝創(chuàng)業(yè)公司智元機器人所發(fā)布的視頻中,機器人也可根據(jù)簡單的文字 或語音指令對桌面上不同顏色的方塊進行選取、調(diào)位和疊放等操作。

無需訓練即可完成復雜指令且產(chǎn)生涌現(xiàn)能力,未知場景下 RT-2 模型泛化能力翻倍。新模 型的另一大突破是無需預定義的運動原語或額外的數(shù)據(jù)和訓練,模型泛化能力增強,加速 機器人通用化。過去算法下實現(xiàn)機器人扔垃圾的動作需訓練機器人區(qū)分、撿起、扔掉垃圾 各個步驟,而 RT-2 可以將網(wǎng)絡(luò)相關(guān)知識傳給機器人,使其無需明確的訓練即可學會扔垃 圾。面對之前從未見過的任務(wù)情形,RT-2 成功率達到 62%,泛化性能較 RT-1 提高一倍。 而 VoxPoser 用大模型指導機器人如何與環(huán)境進行交互,達到在無需額外數(shù)據(jù)和訓練的情 況下完成各種任務(wù),并且涌現(xiàn)出了 4 種行為能力,可以自主分步完成任務(wù),掌握評估方法, 根據(jù)最新要求做出判斷進而調(diào)整輸出動作。

RT-2 泛化能力還體現(xiàn)在其思維鏈(CoT)助其進行多階段語義推理,完成更復雜任務(wù)。 DeepMind 研究團隊展示了將思維鏈推理納入 RT-2 中使其能夠進行多階段語義推理,他們 用少量的“增強”數(shù)據(jù)微調(diào)一個 RT-2-PaLM-E 變種,增強數(shù)據(jù)中加入了“Plan”步驟, 使得 VLM 首先用自然語言描述機器人將要采取的動作的目的,然后再給出預測的機器人 動作標記。例如:“指示:我餓了。計劃:選擇 rxbar 巧克力。行動:1 128 124 136 121 158 111 255?!蓖ㄟ^實驗結(jié)果可以觀察到,具有思維鏈推理的 RT-2 能夠回答更復雜的命 令。

決策結(jié)果到運動控制映射方式改變,機器人實現(xiàn)“手腦協(xié)調(diào)”

此前大模型產(chǎn)出的策略需要借助低級別策略或 API 才能完成對機器人的運動控制。視覺語 言模型生成的結(jié)果到機器人動作的映射方式,主要取決于該預測結(jié)果的層級。之前模型中 預測結(jié)果處于高級別設(shè)計層級:以 Google PaLM-E 和微軟 ChatGPT for Robotics 為例, PaLM-E 實現(xiàn)了對具身任務(wù)的決策方案預測,但不涉及機器人動作的實際控制,需要依賴 低級別的現(xiàn)成策略或規(guī)劃器來將決策方案“翻譯”為機器人動作。微軟默認提供控制機器 人的低層級 API,ChatGPT 輸出是更高層級的代碼,需調(diào)用到機器人低層級的庫或 API, 從而實現(xiàn)對機器人動作的映射和控制。RT-2 和 VoxPoser 預測結(jié)果已經(jīng)到了低級別動作層 級,不需要再經(jīng)過復雜的翻譯即可將高層級設(shè)計映射到低層級動作。

RT-2 輸出字符串可直接對應(yīng)到機器人的坐標、旋轉(zhuǎn)角等信息。RT-2 動作控制采用的方法 是將機器人動作表示為另一種語言,即文本 token,并與 Web 規(guī)模的視覺-語言數(shù)據(jù)集一 起訓練。代表機器人動作的文本字符串可以是機器人動作 token 編號的序列,例如「1 128 91 241 5 101 127 217」,該字符串以一個標志開始,該標志指示機器人是繼續(xù)還是終止當 前情節(jié),然后機器人根據(jù)指示改變末端執(zhí)行器的位置和旋轉(zhuǎn)以及機器人抓手等命令。由于 動作被表示為文本字符串,因此機器人執(zhí)行動作命令就像執(zhí)行字符串命令一樣簡單。這種 表示方式允許谷歌對現(xiàn)有的視覺-語言模型進行微調(diào),并將其轉(zhuǎn)換為視覺-語言-動作模型。

Voxposer 規(guī)劃結(jié)果直接為機器人運行軌跡。Voxposer 的動作控制實現(xiàn)過程是首先給定環(huán) 境信息(用相機采集 RGB-D 圖像)和自然語言指令,之后 LLM(大語言模型)根據(jù)這些 內(nèi)容編寫代碼,所生成代碼與 VLM(視覺語言模型)進行交互,指導系統(tǒng)生成相應(yīng)的操作 指示地圖(3D Value Map),之后動作規(guī)劃器將生成的 3D 地圖作為目標函數(shù),直接合成 最終操作軌跡。在用 LLM 和 VLM 將語言指令映射為 3D 地圖的過程中,系統(tǒng)利用“感興 趣的實體(entity of interest)”來引導機器人進行操作,也就是通過 3D Value Map 中標記 的值來反應(yīng)哪個物體是對它具有“吸引力”的,哪些物體是具有“排斥性”,比如在打開 抽屜的例子中,抽屜就是“吸引”的,花瓶是“排斥”的。

感知層:聚焦力傳感器應(yīng)用,機器人知“輕重”懂交互

人形機器人需借助多種傳感器識別自身運動狀態(tài)和環(huán)境狀況,收集多模態(tài)數(shù)據(jù)以供交互。 具身智能重點在于具有身體體驗的能力,與環(huán)境交互獲得視、聽、觸覺等多模態(tài)數(shù)據(jù)再做 出反應(yīng),需要模型與傳感器等硬件相互配合。李飛飛教授團隊在介紹 Voxposer 的論文中 提到,具身智能依賴于外部感知模塊,在需要整體視覺推理或理解細粒度物體幾何形狀的 任務(wù)中具有局限性,需要更高級的視覺傳感器或其他傳感方式。因此人形機器人產(chǎn)業(yè)化不 僅需要大模型完成決策,還需要傳感器等硬件不斷升級進行配合,提供多模態(tài)數(shù)據(jù)。

六維力/關(guān)節(jié)扭矩傳感器為力控核心,使人形機器人知“輕重”

力傳感發(fā)展仍處初期,六維力傳感器和關(guān)節(jié)扭矩傳感器是核心。在機器人多種感知中,力 覺感知及對應(yīng)的力傳感器發(fā)展較慢,但其在人形機器人的運動控制中起重要作用,可以增 強機器人本體感知及獲取環(huán)境物理信息的能力。力傳感器是人形機器人感測力和力矩信息 的主流選擇,可協(xié)助機器人完成精細和智能的操作任務(wù)。人形機器人力感知主要包括兩種 模式,一種使用末端的六維力傳感器,一種使用關(guān)節(jié)扭矩傳感器。人形機器人旋轉(zhuǎn)、線性 執(zhí)行結(jié)構(gòu)類似于人類關(guān)節(jié),對于力的感知相對簡單,可采用關(guān)節(jié)扭矩傳感器;而對于人形 機器人末端執(zhí)行器(如腕部、踝部)在執(zhí)行操作的過程中,力的方向和作用點都在三維空 間內(nèi)隨機變化,測量需要精確處理,六維力傳感器更符合需求。

六維力傳感器精度高、獲取力信息最全面。六維力傳感器是一類可以同時檢測 X、Y、Z 三軸方向的力和繞三個坐標軸方向的力矩的傳感器,目前已應(yīng)用于協(xié)作機器人和康復醫(yī)療 機器人中,可以增強機器人與人協(xié)同的安全性。六維力傳感器測量維度最高,可以提供最 全面的力覺信息,其具有高精度、高靈敏度、快速響應(yīng)、高耐用性和可靠性的特點,可以 輕松檢測到微小的力的變化,實時記錄和傳輸數(shù)據(jù),滿足各種應(yīng)用的需求。相較于三維力 傳感器,六維力傳感器適用于力的作用點離傳感器標定參考點距離較遠,且隨機變化,測 量精度要求較高的情況。同時機器人可以利用獲得的力矩信息推算受力部件的姿態(tài),監(jiān)測 力矩是否在安全范圍內(nèi),有效避免傳感器的過載損壞。

六維力傳感器主要用于人形機器人腕部及踝部。六維力傳感器可裝載于機器人的腕部、踝 部等核心關(guān)節(jié)處,讓機器人知“輕重”、懂交互,真正實現(xiàn)類人的運動能力。雙足機器人 由于有腳掌的存在,其在落足時會產(chǎn)生力矩,測量該力矩的大小和方向是運動控制中的重 要一環(huán)。六維力傳感器可搭載于雙足機器人腳踝處,測量各方向的力和力矩,并由控制器 通過分析傳感器輸出的各維度數(shù)據(jù),得出落腳時的受力狀態(tài),從而對機器人姿態(tài)進行調(diào)整。 六維力傳感器還適用于人形機器人手腕關(guān)節(jié)處,機械手在執(zhí)行抓取或裝配工作時,會受到 各方向的力,有六維力傳感器作為感知元件,機器人才能精準執(zhí)行這些工作,甚至做到 “穿針引線”。

關(guān)節(jié)扭矩傳感器增強機器人本體感知。關(guān)節(jié)扭矩傳感器將扭轉(zhuǎn)力矩引起的物理變化轉(zhuǎn)換成 精確的電信號,從而形成對機器人單關(guān)節(jié)力矩的測量和記錄。機器人本體感知依賴關(guān)節(jié)扭 矩傳感器感測各個關(guān)節(jié)扭力,獲得各個部位受力情況,提供機器人整體的姿態(tài)及位置信息。 關(guān)節(jié)扭矩傳感器可以實時反饋高質(zhì)量扭矩信號,迅速識別接觸并立即降低力和速度,因為 該傳感器距離電機較近,避免了機器人機械本體動態(tài)特性的干擾,帶寬更高,動態(tài)響應(yīng)更 快。關(guān)節(jié)扭矩傳感器本質(zhì)測量一維力,但要抵抗五維力的干擾,抗干擾能力要求高。

高價值高壁壘,六維力傳感器面臨動靜態(tài)特性及解耦問題

進口六維力傳感器價格昂貴,國內(nèi)外產(chǎn)品在多方面仍存在差距。2022 年,在接受高工機 器人采訪時,坤維科技創(chuàng)始人熊琳表示:“一臺高性能的進口力傳感器的價格頂?shù)蒙蠂鴥?nèi) 一臺協(xié)作機器人的價格,導致國內(nèi)機器人行業(yè)用不起,加之標校能力和生產(chǎn)方式等多方面 的約束,國內(nèi)多數(shù)六維力傳感器廠商無法滿足產(chǎn)能需求,阻礙了第三代工業(yè)機器人的發(fā) 展?!备咝阅芰S傳感器價格從幾千到上萬不等,價值量較高。國內(nèi)參與者主要是鑫精誠、 宇立儀器(安川電機、KUKA、ABB 的力傳感器合作商)、坤維科技(供貨給節(jié)卡、遨博、 睿爾曼、大族等國內(nèi)協(xié)作機器人廠商),但國產(chǎn)六維力傳感器與外資主流傳感器在靈敏度、 串擾、抗過載能力及維間耦合誤差等方面仍存在差距。

應(yīng)變片式為當前六維力傳感器主流,硅應(yīng)變傳感器在穩(wěn)定性、信噪比、剛度方面表現(xiàn)較好。 根據(jù) GGII,六維力傳感器根據(jù)傳感元件的不同主要分為三種基本類型:應(yīng)變片式、光學式 以及壓電/電容式。應(yīng)變片式可分為金屬電阻應(yīng)變片和硅應(yīng)變片,當基體受力發(fā)生應(yīng)力變化 時,應(yīng)變片也一起產(chǎn)生變形,使應(yīng)變片的阻值發(fā)生變化。壓電/電容式中,電容是通過極距 的變化導致電壓變化,壓電則是通過形變改變電荷。光學式則通常使用光柵或其他光纖技 術(shù)檢測光功率并將其轉(zhuǎn)換為電能。目前市場應(yīng)用的大部分是基于應(yīng)變片式的測量,其具有 靈敏度高、測量范圍大、可靠性高、技術(shù)成熟等優(yōu)點。其中硅應(yīng)變傳感器在穩(wěn)定性、信噪 比、剛度方面有比較優(yōu)勢。

應(yīng)變片式傳感器的彈性體結(jié)構(gòu)是關(guān)鍵,一體化和 Stewart 并聯(lián)為主流。應(yīng)變片式六維力傳 感器的彈性體結(jié)構(gòu)設(shè)計是核心問題,傳感器的結(jié)構(gòu)受到其應(yīng)用場合的限制,而力敏感元件 的形式和布置直接影響傳感器的靈敏度、剛度、動態(tài)性能、維間耦合等,很大程度上決定 傳感器性能的優(yōu)劣。六維力傳感器的典型結(jié)構(gòu)設(shè)計主要是一體化結(jié)構(gòu)(豎梁、橫梁)和 Stewart 并聯(lián)結(jié)構(gòu)。以 Waston 腕力傳感器為典型代表的豎梁結(jié)構(gòu)橫向效應(yīng)好、結(jié)構(gòu)簡單、 承載能力強,但豎向效應(yīng)差、維間干擾大、靈敏度較低;十字橫梁結(jié)構(gòu)靈敏度高、易加工, 易于標定,但存在維間耦合和徑向效應(yīng);Stewart 平臺中彈性體采用復合式結(jié)構(gòu),該類傳 感器具有結(jié)構(gòu)緊湊、承載能力強、誤差不累積等優(yōu)點。

六維力傳感器選型難度大,技術(shù)難點集中于保持優(yōu)良的靜態(tài)性能、動態(tài)性能和低維間耦合。 六維力傳感器選型難點在于應(yīng)用多樣性、復雜性。由于傳感器量程和精度成反比關(guān)系,選 擇合適量程的傳感器才能使精度達到最大;同時在復雜應(yīng)用場景下,傳感器本體是否能適 應(yīng)應(yīng)用場景也需要考慮;此外還要綜合考慮精密機構(gòu)當中的傳感器如何安裝在狹小空間內(nèi), 如何與機構(gòu)融為一體等問題。六維力傳感器選型四個核心步驟為確定量程需求——確定使 用環(huán)境——確定機械出線需求——確定通訊方式。六維力矩傳感器技術(shù)難點集中于需兼顧 優(yōu)良的靜態(tài)性能、動態(tài)性能和低維間耦合。未來六維力矩傳感器需要六維聯(lián)合加載標定設(shè) 備等先進儀器、動態(tài)特性優(yōu)化和矢量運算中的解耦算法解決技術(shù)難點。

難點一:六維力傳感器非線性特性顯著,需要更為復雜的六維聯(lián)合加載標定。標定是指通 過加載理論值的載荷并同時記錄傳感器輸出的對應(yīng)原始信號的方式,獲得六維力傳感器內(nèi) 部算法的各個參數(shù),建立傳感器原始信號和受力之間的映射關(guān)系。標定解耦是六維力傳感 器提高精度的主要方法,因此標定工作在傳感器的研發(fā)過程中扮演著重要角色。現(xiàn)有標定 裝置存在較多局限性,如加載載荷有限、無法進行復合加載、無法加載所有維度正負方向、 維間耦合較大等。這些局限性因素限制了六維力傳感器標定的有效性,影響其最終使用精 度,只有采用六維力聯(lián)合加載標定,才能使傳感器的準度更好、串擾更低。

難點二:實際應(yīng)用條件復雜,動態(tài)性能優(yōu)化算法仍需提升。六維力傳感器使機器人實現(xiàn)柔 順化、智能化控制,因此在動載荷下性能指標要求更高。在實際的力/力矩測量過程中,被 測信號大多是動態(tài)信號,如機器人打磨拋光時的接觸力、物體高速運動過程中的稱重和炮 彈發(fā)射過程時的后座力等,這些信號屬于快速時變信號,動態(tài)性能較差的傳感器跟蹤測量 這些信號難度較大。且當前動態(tài)性能的分析方法很難獲得完全意義的沖擊信號和階躍信號, 造成感應(yīng)系統(tǒng)的精度下降。當前業(yè)界主要使用優(yōu)化自身結(jié)構(gòu)、形狀等方法提高動態(tài)性能, 國內(nèi)外學者還嘗試利用動態(tài)補償濾波器、遺傳算法、神經(jīng)網(wǎng)絡(luò)算法等智能算法來提高傳感 器的動態(tài)性能。

難點三:維間耦合問題無法徹底避免,解耦算法紛繁復雜。理想的六維力傳感器,每一方 向輸出通道的電壓值僅取決于該方向作用力/力矩的大小,與其余五個方向作用力/力矩大 小無關(guān)。但是由于傳感器的結(jié)構(gòu)設(shè)計、機械加工的精度、貼片技術(shù)、應(yīng)變片橫向效應(yīng)與檢 測方式等方面的原因,幾乎每一維作用到傳感器上的力/力矩分量都會對傳感器的各路輸出 信號產(chǎn)生影響,造成維間耦合問題。因此需要解耦算法來對六維力傳感器的輸出進行解耦, 消除維間干擾,提高傳感器的測量精度。但當前對于多維力傳感器的解耦問題并沒有統(tǒng)一 的處理方法,需根據(jù)實際情況及傳感器結(jié)構(gòu)進行選擇和優(yōu)化。

六維力傳感器+本體感知帶來機器人手部物品姿態(tài)估計新解法

位姿估計是機器人領(lǐng)域重要問題,特殊環(huán)境下視覺反饋算法估計物品姿態(tài)可靠性較差。早 期位姿估計算法包括模板匹配和特征點檢測,前者預構(gòu)建目標位姿模板庫,檢索得到最相 似模板圖像對應(yīng)位姿;后者提取目標二維圖像特征,構(gòu)建關(guān)鍵點匹配后使用 N 點透視法解 算。這兩種方法依賴物體表面顏色紋理,受環(huán)境因素影響大。之后三維相機在機器人視覺 領(lǐng)域得到應(yīng)用,引入場景三維幾何信息提高目標位姿估計精度,但其需要人工設(shè)計圖像特 征提取方式,泛化性能差。近期 PoseCNN 構(gòu)建卷積神經(jīng)網(wǎng)絡(luò)自動提取圖像特征,采用端 到端的方式回歸物體三維位姿,但總體來看基于視覺系統(tǒng)的位姿估計算法應(yīng)用場景受到較 大限制,在視覺被阻礙的環(huán)境中(狹窄空間進行精細裝配或操作)估計結(jié)果可靠性較差。

六維力傳感器搭配本體感知提供機器人手部物品姿態(tài)估計新解法。2023 年 7 月,RSS 會 議上刊登了機器人感知手部物品姿態(tài)解決方案的論文,密歇根大學機器人系的 Andrea Sipos 和 Nima Fazeli 利用機器人本體感知(自身關(guān)節(jié)處扭矩傳感器的感知反饋)以及手 腕上六維力傳感器的觸覺反饋,并使用接觸粒子濾波器算法,定位接觸位置并估計物體姿 態(tài),簡稱 SCOPE,該方法可精確的完成接觸位置的確定和物體姿態(tài)的估計,有望推動人 形機器人的位姿估計能力。

SCOPE 可精準確定接觸位置,快速迭代估計物體姿態(tài)。SCOPE 方法是在接收到六維力 傳感器和關(guān)節(jié)扭矩傳感器的信號數(shù)據(jù)后,使用接觸粒子濾波器處理,完成物體姿態(tài)識別。 上述論文中的實驗選用來源于德國宇航局的 Franka Emika Panda 機器人,其是一款高性 能七軸協(xié)作機器人,每個關(guān)節(jié)都配有扭矩傳感器,力控性能在同類型機器人里面處于領(lǐng)先 地位,手腕的六維力傳感器則是美國企業(yè) ATI 生產(chǎn)。在估計過程中雖然初始分布有較大的 誤差和高方差,但 SCOPE 可以在短短幾次迭代中以低方差估計物體姿態(tài)。并且實驗發(fā)現(xiàn), 即使對于較小的,非凸形狀的工具,SCOPE 方法依然可以給出較為精確的姿態(tài)估計結(jié)果。

使用接觸粒子濾波器算法進行采樣定位,提供準確力信息?,F(xiàn)有的物體姿態(tài)估計信號處理 算法可以分為三大類:幾何匹配、概率方法和機器學習方法。目前主流方法是使用概率方 法(粒子過濾器、SLAM 和蒙特卡洛方法等)來估計物體的姿勢,其中粒子濾波器所需計 算量小,且在非線性情況下表現(xiàn)較好,常被用于定位、跟蹤物體等問題。Sipos 和 Fazeli 使用了兩個互補的接觸粒子濾波器(Contact Particle Filter):一個用于估計接觸位置,另 一個用于估計物體姿態(tài),都是在接收到關(guān)節(jié)處扭矩傳感器和手腕處六維力傳感器的信號后 進行概率分布的計算更新,幫助去除來自環(huán)境的噪聲和不確定性,得到更準確和可靠的接 觸力信息。

MultiSCOPE 實現(xiàn)多個接觸跨物體姿態(tài)估計,助力機器人使用人類工具。Sipos 和 Fazeli 進一步于 2023 年 6 月提出 MultiSCOPE,該方法使用本體感知和手腕處六維力傳感同時 估計兩個物體在未知配置情況下被兩個協(xié)同手臂抓取的姿態(tài)。該方法由單個物體的感知擴 展到多接觸的交互,實現(xiàn)了跨動作的物體姿態(tài)估計。在該實驗中機器人手持扳手可以擰動 一個螺釘,即機器人既可以感受到直接接觸的扳手形態(tài),又可以通過扳手和另一只手臂上 的力傳感器感受到螺釘?shù)臓顟B(tài)變化,估計兩個抓取物體的姿態(tài),從而完成多任務(wù)。該實驗 的成功使機器人具備多物體的感知能力,有助于機器人操作人類工具完成多項任務(wù),提高 人形機器人多場景下的通用性。

六維力傳感器+本體感知技術(shù)使姿態(tài)估計向多模態(tài)+高效連續(xù)性發(fā)展?;诹S力傳感器和 本體感知的物體姿態(tài)估計技術(shù)為機器人感知并抓取物體提供了新解法。該方法可與其他方 法完成多模態(tài)互補,在無遮擋場景中,視覺感知方法可以與 SCOPE 共同使用以提高性能: 比如機器人可以使用視覺反饋來初始化作用域和初步識別,提高感知效率。SCOPE 技術(shù) 未來的發(fā)展方向也會集中于減少收斂到準確的物體姿態(tài)估計所需的動作數(shù)量和連續(xù)的下一 步動作選擇算法,以提高機器人抓取物體的連續(xù)性和高效性。SCOPE 與六維力傳感器的 結(jié)合有望加快人形機器人實際應(yīng)用。

執(zhí)行層:剛性驅(qū)動器方案成熟,準直驅(qū)方案滲透率有望提高

特斯拉采用成熟的剛性驅(qū)動器方案,未來準直驅(qū)方案滲透率有望提高。機器人關(guān)節(jié)驅(qū)動器 按動力來源可以分為液壓、氣動、電驅(qū)等。液壓雖然功率高,但可靠性和精度低,噪音大, 成本高;氣動柔順性好,安全性高,但精度差,時滯高。電驅(qū)因其精度、安靜、高效方面 的優(yōu)勢逐漸成為主流,其經(jīng)過 30 多年的發(fā)展,經(jīng)歷了從剛性驅(qū)動器、彈性驅(qū)動器到準直 驅(qū)驅(qū)動器的過程。特斯拉采用的是最早推出,也是相對成熟的剛性驅(qū)動器方案。如果電機 和減速器性能沒有大幅提升的情況下,在雙足機器人領(lǐng)域剛性驅(qū)動器將會逐步被取代。近 幾年新興的準直驅(qū)驅(qū)動器技術(shù)發(fā)展迅速,未來有望替代傳統(tǒng)的剛性驅(qū)動器。

剛性驅(qū)動器技術(shù)相對成熟,整體設(shè)計較難創(chuàng)新。1983 年,早稻田大學研究出剛性驅(qū)動器 (TSA),自此 TSA 在雙足仿人機器人上廣泛應(yīng)用。結(jié)構(gòu)上,TSA 是常規(guī)無刷電機驅(qū)動高 傳動比減速器,有些在電機端增加剎車,在減速器和輸出端增加高剛性力矩傳感器。力矩 測量上,TSA 是基于電流或應(yīng)變片式力矩傳感器。控制上,TSA 控制簡單,精度高。功率 和效率方面,TSA 無功率可調(diào),效率較低,安全性較差。TSA 整體設(shè)計方面已經(jīng)較難有創(chuàng) 新,在合適工作區(qū)間內(nèi)的最大輸出功率密度只能到 200-300W/kg,遠沒有達到動物肌肉的 500W/kg,同時也解決不了機器人受外部沖擊時零部件強度問題,目前的研究集中在優(yōu)化 設(shè)計上。

彈性驅(qū)動器技術(shù)路線多樣,多數(shù)結(jié)構(gòu)和控制復雜。動物利用剛?cè)岵募∪夤趋老到y(tǒng)在運 動過程中儲存和釋放能量,調(diào)節(jié)能量在時間和功率密度上的不匹配,提高關(guān)節(jié)爆發(fā)力,同 時能夠?qū)崿F(xiàn)落地緩沖。1995 年,MIT 推出彈性驅(qū)動器來模擬肌肉系統(tǒng)功能,使關(guān)節(jié)表現(xiàn)出 柔順、安全和高能量效率特性,目前已演化出 SEA、PEA、CEA 和 MEA 多種結(jié)構(gòu)。彈性 驅(qū)動器多在剛性執(zhí)行器的基礎(chǔ)上串聯(lián)或并聯(lián)彈性體。力矩測量上與剛性傳感器較為類似。 控制上,多數(shù)彈性驅(qū)動器方案結(jié)構(gòu)與控制復雜,精度一般。綜合來看,由于彈性體引入, 系統(tǒng)為欠驅(qū)動,給控制帶來了難度,尤其在機器人腿部使用,機器人整機的運動控制比較 難實現(xiàn)。

準直驅(qū)驅(qū)動器是新興技術(shù),編碼器和電機功率密度為其主攻方向。受限于工藝和技術(shù),電 機直驅(qū)的扭矩密度不能滿足機器人應(yīng)用的需求,因此,2016 年 Wensing 等推出準直驅(qū)驅(qū) 動器(PA),采用電機加低傳動比減速器(如行星減速器)的方案,實現(xiàn)高帶寬力控和良 好的抗沖擊能力。2023 年 UCLA 也采用了類似的方案設(shè)計了不同于特斯拉的新型人形機 器人結(jié)構(gòu)。結(jié)構(gòu)上,PA 主要由高扭矩密度電機、低傳動比減速器、編碼器和控制板等組 成。力矩測量上,PA 應(yīng)用電流環(huán)檢測??刂坪托噬希琍A 精度高,效率高。安全性上, PA 由于具有反驅(qū)特性,安全性好。PA 未來主攻方向是編碼器技術(shù)的創(chuàng)新和電機功率密度 的提高。

剛性驅(qū)動器 VS 準直驅(qū)驅(qū)動器,成熟系統(tǒng) VS 高效新解法。結(jié)構(gòu)布局方面,剛性驅(qū)動器是 常規(guī)無刷電機驅(qū)動高傳動比減速器,直接帶動輸出端,有些設(shè)計在電機端增加剎車,在減 速器和輸出端增加高剛性力傳感器,準直驅(qū)驅(qū)動器是高扭矩密度電機驅(qū)動低傳動比減速器, 輸出端具有小慣量特性;力矩測量方面,剛性驅(qū)動器是基于電流或應(yīng)變片式力矩傳感器, 準直驅(qū)驅(qū)動器是應(yīng)用電流環(huán)檢測;控制方面,剛性驅(qū)動器控制相對簡單,精度高,準直驅(qū) 驅(qū)動器控制簡單,精度相比剛性驅(qū)動器來說較低;能量特性方面,剛性驅(qū)動器的效率較低, 而準直驅(qū)的效率較高。安全性方面,剛性驅(qū)動器的安全性比較差,準直驅(qū)驅(qū)動器由于具有 反驅(qū)特性,安全性好。

責任編輯:彭菁

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 執(zhí)行器
    +關(guān)注

    關(guān)注

    5

    文章

    375

    瀏覽量

    19284
  • 智能系統(tǒng)
    +關(guān)注

    關(guān)注

    2

    文章

    376

    瀏覽量

    72376
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1197

    瀏覽量

    24592
  • 人形機器人
    +關(guān)注

    關(guān)注

    2

    文章

    392

    瀏覽量

    16402
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    2212

    瀏覽量

    2233

原文標題:人形機器人政策利好

文章出處:【微信號:AIOT大數(shù)據(jù),微信公眾號:AIOT大數(shù)據(jù)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    醫(yī)療機器人發(fā)展現(xiàn)狀與趨勢

    醫(yī)療機器人作為醫(yī)療領(lǐng)域與現(xiàn)代機器人科技的融合體,正逐步引領(lǐng)醫(yī)療服務(wù)向更高效、更精準的方向發(fā)展。以下是對醫(yī)療機器人發(fā)展現(xiàn)狀與趨勢的詳細分析:
    的頭像 發(fā)表于 10-21 15:24 ?252次閱讀

    人形機器人場景應(yīng)用聯(lián)盟正式成立

    日前,在“2024首屆人形機器人場景應(yīng)用峰會”上,人形機器人場景應(yīng)用聯(lián)盟正式宣告成立。
    的頭像 發(fā)表于 08-19 11:17 ?522次閱讀

    NVIDIA 加速人形機器人發(fā)展

    —SIGGRAPH— 當?shù)貢r間 2024 年 7 月 29 日— 為加速全球人形機器人發(fā)展,NVIDIA 于今日宣布,為全球領(lǐng)先的機器人制造商、AI 模型開發(fā)者和軟件制造商提供一套
    發(fā)表于 07-30 09:15 ?685次閱讀
    NVIDIA 加速<b class='flag-5'>人形</b><b class='flag-5'>機器人</b><b class='flag-5'>發(fā)展</b>

    未來之聲 | 人形機器人說話篇:無聲!

    隨著一個個有關(guān)人形機器人的“核彈式”新聞的出現(xiàn),機器人技術(shù)肉眼可見地快速發(fā)展。或許,與人們預想的“像
    的頭像 發(fā)表于 04-13 08:00 ?171次閱讀
    未來之聲 | <b class='flag-5'>人形</b><b class='flag-5'>機器人</b>說話篇:無聲!

    為何要做人形機器人?

    人形機器人在各個發(fā)展時期,都致力于在“仿特征”上有一些突破。盡管有的人形機器人穿上衣服可以達到
    發(fā)表于 04-09 10:54 ?433次閱讀

    華為云在人形機器人領(lǐng)域展開合作

    華為云與人形機器人領(lǐng)域的創(chuàng)新企業(yè)樂聚機器人近日達成合作,共同致力于探索“華為盤古大模型+夸父人形機器人”的全新應(yīng)用場景。這是華為云首次與
    的頭像 發(fā)表于 03-25 10:49 ?521次閱讀

    人形機器人成為車圈“新寵”?

    現(xiàn)在的人形機器人不僅形態(tài)更接近人類,而且具備更多的智慧。隨著大型AI模型的不斷推進,人工智能正在加速人形通用機器人的量產(chǎn)和落地。
    發(fā)表于 02-22 09:22 ?352次閱讀
    <b class='flag-5'>人形</b><b class='flag-5'>機器人</b>成為車圈“新寵”?

    國產(chǎn)人形機器人產(chǎn)業(yè)發(fā)展現(xiàn)狀

    具備初級感知功能的智能化起步階段(2001-2015年),進入二十一世紀,隨著感知系統(tǒng)及交互系統(tǒng)等技術(shù)進步,人形機器人在該階段可實現(xiàn)與外界環(huán)境有限的互動,并且運動自由度提升,能實現(xiàn)行走以外的其他簡單行動操作,例如本田由 P系列所
    的頭像 發(fā)表于 01-12 16:52 ?1695次閱讀
    國產(chǎn)<b class='flag-5'>人形</b><b class='flag-5'>機器人</b>產(chǎn)業(yè)<b class='flag-5'>發(fā)展現(xiàn)狀</b>

    人形機器人的三大關(guān)鍵技術(shù)及挑戰(zhàn)

    人形機器人是指外形和人類相似的機器人。它們可以通過模仿人類的外貌、動作和表情來與人類進行交互和溝通。
    發(fā)表于 01-05 10:53 ?2113次閱讀

    人形機器人產(chǎn)業(yè)發(fā)展機遇與挑戰(zhàn)并存

    隨著人工智能時代的到來,“人形機器人+”正被視為未來數(shù)字化、智能化背景下,人工智能應(yīng)用的終極賽道。首先來關(guān)注“人形機器人產(chǎn)業(yè)”。
    發(fā)表于 12-25 10:45 ?288次閱讀

    高動態(tài)人形機器人“夸父”通過OpenHarmony 3.2 Release版本兼容性測評

    深圳開鴻數(shù)字產(chǎn)業(yè)發(fā)展有限公司(以下簡稱”深開鴻“)OpenHarmony生態(tài)建設(shè)能力和在新興行業(yè)領(lǐng)域的技術(shù)創(chuàng)新實力,也標志著OpenHarmony在新興行業(yè)領(lǐng)域又向前邁進了一步。 夸父人形
    發(fā)表于 12-20 09:31

    中國人形機器人產(chǎn)業(yè)拆解分析

    人形機器人全球?qū)@暾堉饕?jīng)歷了四個發(fā)展階段,其中,21世紀是人形機器人高集成和高動態(tài)的發(fā)展階段
    發(fā)表于 12-12 09:47 ?273次閱讀

    工業(yè)機器人發(fā)展現(xiàn)狀和趨勢

    工業(yè)機器人發(fā)展現(xiàn)狀和趨勢。 一、工業(yè)機器人發(fā)展現(xiàn)狀 1.1 工業(yè)機器人的概念及歷史 工業(yè)機器人
    的頭像 發(fā)表于 12-07 17:27 ?5441次閱讀

    劍指人形機器人賽道,泰科機器人推出重磅關(guān)節(jié)模組

    泰科機器人幾年前就研判人形機器人賽道將會成為熱點,決定研發(fā)人形機器人適用的關(guān)節(jié)模組,經(jīng)過艱苦的技術(shù)
    的頭像 發(fā)表于 11-22 11:12 ?643次閱讀
    劍指<b class='flag-5'>人形</b><b class='flag-5'>機器人</b>賽道,泰科<b class='flag-5'>機器人</b>推出重磅關(guān)節(jié)模組

    人形機器人發(fā)展及其趨勢

    人形機器人集成人工智能、高端制造、新材料等先進技術(shù),有望成為繼計算機、智能手機、新能源汽車后的顛覆性產(chǎn)品,發(fā)展潛力大、應(yīng)用前景廣,是未來產(chǎn)業(yè)的新賽道。
    發(fā)表于 11-21 12:25 ?916次閱讀
    <b class='flag-5'>人形</b><b class='flag-5'>機器人</b>的<b class='flag-5'>發(fā)展</b>及其趨勢