動(dòng)物們?cè)谔镆吧像Y騁、在樹上靈巧地攀爬、在跌倒之前迅速站穩(wěn)腳跟。
和我們的靈長(zhǎng)類表親一樣,人類也可以運(yùn)用拇指和精細(xì)的運(yùn)動(dòng)技能來完成一些任務(wù),比如毫不費(fèi)力地剝開柑橘皮,或者在黑暗的走廊里尋找正確的鑰匙。
雖然行走和抓取對(duì)許多生物來說是小菜一碟,但機(jī)器人在步態(tài)移動(dòng)和靈巧性方面一直不盡人意。
如今,Hwangbo等人在Science Robotics雜志上撰文,報(bào)告證明了這樣了一件有趣的事:某種機(jī)器人軟件設(shè)計(jì)方法需要數(shù)據(jù)驅(qū)動(dòng),而這種方法正好能夠克服機(jī)器人和人工智能研究領(lǐng)域中長(zhǎng)期存在的一個(gè)挑戰(zhàn),即模擬與現(xiàn)實(shí)之間的差距。
幾十年來,機(jī)器人專家在預(yù)測(cè)性數(shù)學(xué)模型(稱為經(jīng)典控制理論)基礎(chǔ)上建立軟件,以此來引導(dǎo)機(jī)器人肢體的行動(dòng)。然而,這種方法在引導(dǎo)機(jī)器人肢體完成行走、攀爬和抓取這些看似簡(jiǎn)單的問題上卻無效。
機(jī)器人通常在模擬中開始它的生命。當(dāng)它的引導(dǎo)軟件在虛擬世界中表現(xiàn)良好時(shí),該軟件就會(huì)被放置在機(jī)器人體內(nèi),然后隨機(jī)器人一起進(jìn)入現(xiàn)實(shí)世界。
在現(xiàn)實(shí)世界里,機(jī)器人難免會(huì)不斷地遇到難以預(yù)測(cè)的狀況,包括表面摩擦、結(jié)構(gòu)靈活性、振動(dòng)、傳感器延遲以及具有時(shí)差的執(zhí)行器,一般執(zhí)行器將能量轉(zhuǎn)化為運(yùn)動(dòng)指令。
不幸的是,這些狀況是不可能事先由數(shù)學(xué)運(yùn)算詳盡描述的。因此,即使是在模擬中表現(xiàn)出色的機(jī)器人,遇到一些看似微小的物理障礙后也會(huì)磕磕絆絆,甚至摔倒。
Hwangbo等人將經(jīng)典控制理論與機(jī)器學(xué)習(xí)技術(shù)相結(jié)合,研究出一種縮小類似差距的方法。
首先,該團(tuán)隊(duì)設(shè)計(jì)了一個(gè)中型四足機(jī)器人的傳統(tǒng)數(shù)學(xué)模型,名為ANYmal(如上圖)。
接下來,他們從引導(dǎo)機(jī)器人肢體運(yùn)動(dòng)的執(zhí)行器中收集數(shù)據(jù)。
然后,他們將收集的數(shù)據(jù)輸入被稱為神經(jīng)網(wǎng)絡(luò)的機(jī)器學(xué)習(xí)系統(tǒng)中,建立第二個(gè)模型,而這個(gè)模型可以自動(dòng)預(yù)測(cè)AMYmal機(jī)器人肢體的特殊運(yùn)動(dòng)。
最后,該團(tuán)隊(duì)將訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)插入第一個(gè)模型中,并在標(biāo)準(zhǔn)臺(tái)式計(jì)算機(jī)上運(yùn)行混合模型。
混合模擬器比基于分析模型的模擬器速度更快,精準(zhǔn)度更高。更重要的是,機(jī)器人的運(yùn)動(dòng)在混合模擬器中優(yōu)化之后,轉(zhuǎn)移進(jìn)機(jī)器人體內(nèi),并連入現(xiàn)實(shí)世界,這時(shí),機(jī)器人在現(xiàn)實(shí)世界的行動(dòng)就像在模擬器里一樣成功。
這個(gè)姍姍來遲的突破終結(jié)了看似不可逾越的模擬與現(xiàn)實(shí)鴻溝。
Hwangbo等人使用的方法還暗示了機(jī)器人領(lǐng)域的另一個(gè)重大轉(zhuǎn)變。
混合模型的出現(xiàn)是這一重大轉(zhuǎn)變的第一步。下一步將是徹底淘汰分析模型,取而代之的是機(jī)器學(xué)習(xí)模型,這種模型將由機(jī)器人在現(xiàn)實(shí)環(huán)境中所收集的數(shù)據(jù)進(jìn)行訓(xùn)練。
目前,這種稱為端到端培訓(xùn)的純數(shù)據(jù)方法發(fā)展勢(shì)頭迅猛。媒體已報(bào)道了一些創(chuàng)新的應(yīng)用,包括鉸接式機(jī)器人手臂、多指機(jī)械手、無人機(jī),甚至自動(dòng)駕駛汽車。
機(jī)器人專家仍在鉆研如何強(qiáng)化計(jì)算速度、豐富傳感器數(shù)據(jù)以及提高機(jī)器學(xué)習(xí)算法質(zhì)量。目前尚不清楚大學(xué)是否應(yīng)該停止教授經(jīng)典控制理論。
然而,筆者認(rèn)為這是一個(gè)不祥之兆:未來的機(jī)器人的行走不再依賴專家,相反,他們可以利用自己身體里的數(shù)據(jù)進(jìn)行學(xué)習(xí)。
當(dāng)然,不少挑戰(zhàn)仍然存在,其中最主要的是可擴(kuò)展性的挑戰(zhàn)。
到目前為止,端到端培訓(xùn)機(jī)制僅應(yīng)用于只有少量執(zhí)行器的物理機(jī)器人之上。執(zhí)行器越少,描述機(jī)器人運(yùn)動(dòng)所需的參數(shù)就越少,模型就越簡(jiǎn)單。實(shí)現(xiàn)可擴(kuò)展性的途徑可能包括使用更多層次和模塊化的機(jī)器學(xué)習(xí)架構(gòu)。
想要知道端到端控制是否可以擴(kuò)大到引導(dǎo)擁有數(shù)十個(gè)執(zhí)行器的復(fù)雜機(jī)器,包括人形機(jī)器人,以及諸如制造工廠或智能城市(使用數(shù)字技術(shù)改善市民生活的城市地區(qū))等大型系統(tǒng),還需要做進(jìn)一步研究。
另一個(gè)挑戰(zhàn)是低技術(shù)性,高個(gè)性化。
對(duì)一些研究人員來說,從使用相對(duì)簡(jiǎn)單的數(shù)學(xué)模型到應(yīng)用“潘多拉盒子”機(jī)器學(xué)習(xí)系統(tǒng)(其中的內(nèi)部工作原理未知)的轉(zhuǎn)變,標(biāo)志著洞察力悄然退場(chǎng),失控感油然而生。對(duì)我來說,看到機(jī)器人像孩子一樣學(xué)會(huì)自己走路讓我感到心滿意足。
Hwangbo等人提出的見解也可以從心靈之謎的角度來考慮。意識(shí)一直是人類本性中最古老的謎題之一。
人類對(duì)自我意識(shí)的定義十分模糊。然而,人們對(duì)機(jī)器人軟件的研究可以讓我們深入了解關(guān)于人類思維的古老問題。
我們可以推測(cè),自我意識(shí)以及由此延伸出來的意識(shí),其核心是我們抽象思考自己的能力的一種表現(xiàn),即自我模仿。一個(gè)人能看得越遠(yuǎn),他對(duì)未來展望的心理圖景就越詳細(xì),自我意識(shí)能力就越強(qiáng)。
現(xiàn)在,機(jī)器人能夠?qū)W習(xí)自我模擬。這一突破不僅實(shí)用,可以減輕一些工程的負(fù)擔(dān),而且,它標(biāo)志著機(jī)器人自主時(shí)代的開始。
-
機(jī)器人
+關(guān)注
關(guān)注
210文章
28003瀏覽量
205572 -
AI
+關(guān)注
關(guān)注
87文章
29401瀏覽量
267706
原文標(biāo)題:機(jī)器人開始自主學(xué)習(xí),是人類福祉,還是定時(shí)炸彈?
文章出處:【微信號(hào):worldofai,微信公眾號(hào):worldofai】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論