0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

人形機(jī)器人+大模型,為什么是投資人追逐的新風(fēng)口?

甲子光年 ? 來源:甲子光年 ? 2023-08-24 15:01 ? 次閱讀

通用機(jī)器人來了?

“一個(gè)上午,接待了40多個(gè)投資人來現(xiàn)場,都是來看人形機(jī)器人的?!币晃蛔芬拞T工說道。

有投資人指著正在表演咖啡拉花的機(jī)器人問:“這個(gè)動(dòng)作的難度在哪兒?”另一邊,一位自稱開煤礦的老板指的旁邊站立的另一臺(tái)人形機(jī)器人問:“多少錢,怎么訂?”

2023世界機(jī)器人上,以前只能在科幻電影中出現(xiàn)的人形機(jī)器人在現(xiàn)場表演起了各種技能。小米、追覓科技、優(yōu)必選、達(dá)闥科技、宇樹科技、大連蒂艾斯科技、星動(dòng)紀(jì)元、理工華匯等很多公司都把自己的人形機(jī)器人搬到了現(xiàn)場。

這是2023世界機(jī)器人大會(huì)上熱鬧的一角。今年的大會(huì),160家國內(nèi)外機(jī)器人企業(yè),600件機(jī)器人都在現(xiàn)場久違的大秀了一把肌肉。人形機(jī)器人搶走了大部分風(fēng)頭。全球知名的波士頓動(dòng)力創(chuàng)始人Marc Raibert、日本知名機(jī)器人學(xué)者石黑浩都來了。

人形機(jī)器人正在成為資本市場的新熱點(diǎn)。一級(jí)市場,百度、經(jīng)緯、高瓴、鼎暉、高榕、云啟、真格、梅花創(chuàng)投等都在一線積極調(diào)研,前半年聊大模型的風(fēng)投現(xiàn)在沒有人不關(guān)心通用機(jī)器人。

目前國內(nèi)外已經(jīng)有一些出手的案例:

美國人形機(jī)器人創(chuàng)業(yè)公司Figure兩個(gè)月就完成了兩輪融資:7月獲得了英特爾投資的900萬美元投資;今年5月,F(xiàn)igure完成了7000萬美元A輪融資,由Parkway Venture Capital領(lǐng)投。根據(jù)路透社報(bào)道,在5月融資時(shí),F(xiàn)igure估值已經(jīng)超過4億美元。

國內(nèi)市場,曾經(jīng)的華為天才少年稚暉君創(chuàng)立的智元機(jī)器人(Agibot)也正在受到一線基金的追捧,百度、經(jīng)緯、高瓴、鼎暉、高榕等均參與了投資。

近日,通用機(jī)器人公司月泉仿生也完成了一輪由北京北科中發(fā)展啟航創(chuàng)業(yè)投資基金的獨(dú)家投資。月泉仿生的核心業(yè)務(wù)是通用型仿生人形機(jī)器人及核心零部件的產(chǎn)業(yè)化。月泉仿生由吉林大學(xué)工程仿生教育部重點(diǎn)實(shí)驗(yàn)室任露泉院士團(tuán)隊(duì)創(chuàng)立。

二級(jí)市場,人形機(jī)器人概念股都炒了幾波。5月,馬斯克在2023年股東大會(huì)上關(guān)于人形機(jī)器人Optimus的一番話,直接拉漲了一波A股機(jī)器人概念——賽摩智能20CM漲停,豐立智能在六個(gè)交易日漲幅近160%,直接引發(fā)了深交所的關(guān)注,要求說明股價(jià)漲幅較大的原因及合理性。

為何人形機(jī)器人成為了香餑餑?投資人扎堆調(diào)研的背后,人形機(jī)器人面臨哪些機(jī)會(huì)和挑戰(zhàn)?

1.特斯拉、小米、追覓熱火朝天的人形機(jī)器人

特斯拉是這波人形機(jī)器人熱潮的直接推動(dòng)者。

在2023年股東大會(huì)上,馬斯克說,人形機(jī)器人Optimus對運(yùn)動(dòng)和力量的控制以及環(huán)境感知方面有顯著加強(qiáng),技術(shù)正在快速迭代。他預(yù)測,機(jī)器人的需求可能會(huì)達(dá)到100億,甚至更多。如果以人類和機(jī)器人的比例為2:1,那么對人形機(jī)器人的需求可能會(huì)遠(yuǎn)遠(yuǎn)超過汽車的需求。

馬斯克的相信和投入點(diǎn)燃了很多人對人形機(jī)器人賽道的信心。

特斯拉有可能會(huì)推動(dòng)整個(gè)產(chǎn)業(yè)鏈走向成熟。梅花創(chuàng)投創(chuàng)始合伙人吳世春告訴「甲子光年」:“在新能源汽車產(chǎn)業(yè)鏈領(lǐng)域,特斯拉帶動(dòng)智能汽車產(chǎn)業(yè)鏈整體向前發(fā)展,它在上海的工廠帶動(dòng)了整個(gè)中國智能產(chǎn)業(yè)鏈的逐步成熟。下一個(gè)可能是人形機(jī)器人。”

“這是好事,我們也在觀察這個(gè)行業(yè)里哪些地方有投資機(jī)會(huì),可能是整機(jī)、零部件或軟件。”吳世春說。

在特斯拉2022 AI Day活動(dòng)上,特斯拉人形機(jī)器人“Optimus”首次亮相,并在現(xiàn)場完成了自主行走、轉(zhuǎn)身、停止、揮手問候等動(dòng)作。雖然在本屆機(jī)器人大會(huì)中沒有看到“Optimus”的身影,但在今年的世界人工智能大會(huì)上,我們在上海見到了一款在櫥窗里的“Optimus”。

“Optimus”采用了與汽車一致的計(jì)算機(jī)視覺、處理視覺數(shù)據(jù)、做出行動(dòng)決策、支持通信交流的“大腦”,以及與特斯拉車輛相同的芯片,還搭載與特斯拉車輛同源的FSD電腦以及Autopilot相關(guān)神經(jīng)網(wǎng)絡(luò)技術(shù),預(yù)計(jì)最終售價(jià)不超2萬美元(約14.4萬元人民幣)。

明勢資本創(chuàng)始合伙人黃明明認(rèn)為,電動(dòng)汽車公司做人形機(jī)器人有先天優(yōu)勢。“兩年前馬斯克要做Tesla Bot的時(shí)候,很多人覺得他不務(wù)正業(yè)。但如果仔細(xì)分析特斯拉的技術(shù)棧會(huì)發(fā)現(xiàn),機(jī)器人是電動(dòng)汽車的自然延伸。車是第一代的四輪機(jī)器人,理想汽車今年年初確定的愿景不是成為全球最大的電動(dòng)車企業(yè),而是成為最優(yōu)秀的人工智能和機(jī)器人公司。”

他提到,認(rèn)知型機(jī)器人是下一個(gè)巨大突破。“可能是人形,也可能是四足?,F(xiàn)在我們在工廠、產(chǎn)線、物流已經(jīng)有各種各樣的機(jī)器人,但這些機(jī)器人的程序都是人類工程師寫好的,動(dòng)作是被我們固定好的。但是認(rèn)知型機(jī)器人和自動(dòng)駕駛一樣,有感知、分析判斷能力,有人機(jī)交互能力、對于3D世界的實(shí)時(shí)理解能力,以及精準(zhǔn)的操作能力?!?/p>

人形機(jī)器人的的任務(wù)泛化能力決定了它能走的多遠(yuǎn)。很多企業(yè)正在瞄準(zhǔn)這個(gè)方向發(fā)力。

智元機(jī)器人最近發(fā)布的具身智能機(jī)器人遠(yuǎn)征A1就是一款人形機(jī)器人,稚暉君稱:“智元機(jī)器人致力于將先進(jìn)的機(jī)器人和AI技術(shù)與人類生活以及生產(chǎn)制造緊密結(jié)合,未來讓機(jī)器人成為人類的得力助手。遠(yuǎn)征A1未來可以在各種復(fù)雜場景下自主完成移動(dòng)和操作任務(wù)。”

前述提到的創(chuàng)業(yè)公司月泉仿生的機(jī)器人已經(jīng)能夠做到和人手相似的靈巧性。公司自主研發(fā)的類人仿生智能靈巧手在外力干擾下可以通過主動(dòng)移動(dòng)、屈曲、翻轉(zhuǎn)等動(dòng)作調(diào)整,以保持手持物體不掉落?!俺嘶A(chǔ)的抓握、按壓等動(dòng)作外,還可以完成27種不同的手部復(fù)雜精細(xì)操作,比如使用筷子夾取細(xì)小物體、涂抹護(hù)膚品、攪拌咖啡、刷手機(jī)、解扣子等?!睋?jù)悉,月泉仿生智能靈巧手采用拉壓體驅(qū)動(dòng)技術(shù),擁有極高自由度。同時(shí)內(nèi)置了柔性傳感器,具有觸覺神經(jīng)反饋。

3d9a15ea-4246-11ee-a2ef-92fbcf53809c.gif

????

月泉仿生智能靈巧手,公司供圖

月泉仿生CTO趙迪告訴「甲子光年」,目前關(guān)節(jié)型的人形機(jī)器人普遍只能進(jìn)行抓取拿放,很難執(zhí)行解扣子這種更復(fù)雜的動(dòng)作。人形機(jī)器人要想真正服務(wù)人類,一個(gè)好用能干活的雙手是必需的,因此在底層原理方面創(chuàng)新突破并提出全新的構(gòu)型顯得尤為重要。

人形機(jī)器人運(yùn)動(dòng)方面,月泉仿生同樣圍繞著“仿生拉壓體機(jī)器人”這一自主創(chuàng)新理論展開研究。趙迪提到,“正常情況下,一個(gè)關(guān)節(jié)最高可有6個(gè)自由度,但關(guān)節(jié)驅(qū)動(dòng)機(jī)器人為了追求控制精度鎖死了自由度,實(shí)際最多只有1~3個(gè)自由度,由此造成功耗水平也很高,是人體運(yùn)動(dòng)功耗水平的幾十倍乃至上百倍。”

據(jù)他介紹,月泉的仿生拉壓體機(jī)器人能夠克服傳統(tǒng)關(guān)節(jié)驅(qū)動(dòng)機(jī)器人的缺點(diǎn),使機(jī)器人具備與人相似的運(yùn)動(dòng)特性,可以在具備較高運(yùn)動(dòng)自由度的情況下,能夠兼顧穩(wěn)定性,并且能實(shí)現(xiàn)關(guān)節(jié)剛度的快速自適應(yīng)調(diào)節(jié)同時(shí)能使機(jī)器人實(shí)現(xiàn)與環(huán)境的安全交互,運(yùn)動(dòng)能耗指標(biāo)僅為人體的一到兩倍。同時(shí),由于采用了新的驅(qū)動(dòng)方式,月泉仿生的產(chǎn)品不再需要使用復(fù)雜昂貴的減速器,降低了成本。據(jù)了解,公司也自研了微電機(jī)和仿生材料,以匹配拉壓體驅(qū)動(dòng)方式的性能需要。

在機(jī)器人大會(huì)現(xiàn)場,我們也看到非常多在展現(xiàn)各種技能的人形機(jī)器人。

追覓把今年3月新發(fā)布的人形機(jī)器人帶到了現(xiàn)場,這是一款身高 178cm,體重 56kg的機(jī)器人,全身共 44個(gè)自由度,其中單腿還有完整的6個(gè)自由度,可以完成單腿站立。此外,機(jī)器人身上還配備了深度相機(jī),可以完成室內(nèi)3維環(huán)境的建模,同時(shí)還集成了AI大語言模型,可以進(jìn)行實(shí)時(shí)溝通對話。

追覓科技人形機(jī)器人負(fù)責(zé)人喻超告訴「甲子光年」:“人形機(jī)器人自主實(shí)現(xiàn)咖啡‘拉花’的難點(diǎn)在于,它需要在開放空間里與人進(jìn)行交互,這意味著它所處的空間位置和運(yùn)動(dòng)軌跡會(huì)有許多不確定性,同時(shí)需要識(shí)別不同材質(zhì)及尺寸的工具。要解決這些問題,就要搭載更多的智能模型、傳感器,并在機(jī)械結(jié)構(gòu)設(shè)計(jì)上做創(chuàng)新調(diào)整?!?/p>

機(jī)器人公司宇樹科技不僅帶來了已經(jīng)在行業(yè)場景中落地的四足機(jī)器人,也帶來最新發(fā)布的人形機(jī)器人H1。

這是一款能跑的全尺寸通用人形機(jī)器人,擁有全球近似規(guī)格最高動(dòng)力性能,并配置有360°全景深度感知,行走速度大于1.5m/s,潛在運(yùn)動(dòng)能力大于5m/s,整機(jī)重量約在47kg左右。相關(guān)人員告訴「甲子光年」,H1會(huì)在下半年正式投入生產(chǎn),價(jià)格在幾十萬元人民幣以內(nèi)。

即使被人從側(cè)面,后面踹一腳,H1都可以像人一樣,稍微踉蹌之后還能找到新的平衡,不會(huì)摔倒。一位機(jī)器人工程師告訴「甲子光年」:“實(shí)現(xiàn)這種功能并不是一件容易的事,背后用哪個(gè)數(shù)學(xué)函數(shù)大家都知道,但是能把它真正落地到產(chǎn)品中很難?!?/p>

大家對小米的好奇更多集中在最新發(fā)布的四足機(jī)器人身上,去年發(fā)布的人形機(jī)器人“鐵大”反而少有人在關(guān)注。據(jù)「甲子光年」了解,去年小米發(fā)布的人形機(jī)器人“鐵大”由追覓制造,后者本身也是小米生態(tài)鏈中的一員,在高度馬達(dá)等多個(gè)軟硬件方面有一些經(jīng)驗(yàn)積累。

達(dá)闥把人形雙足機(jī)器人“七仙女”小紫帶到了現(xiàn)場,這款機(jī)器人身高165cm,體重65kg,全身采用了輕質(zhì)高強(qiáng)度的碳纖維復(fù)合材料,擁有60多個(gè)智能柔性關(guān)節(jié),由達(dá)闥全棧自研,搭載了海睿云端大腦操作系統(tǒng),集成了機(jī)器人多模態(tài)人工智能大模型RobotGPT。現(xiàn)場還有一個(gè)人形機(jī)器人穿著球衣在表演定點(diǎn)投籃。達(dá)闥創(chuàng)始人兼CEO黃曉慶稱,“七仙女”將在2024年正式發(fā)布,2025年規(guī)模量產(chǎn)。

來自浙江大學(xué)控制學(xué)院機(jī)器人團(tuán)隊(duì)的同學(xué)也帶著“悟空-4”人形機(jī)器人來到了會(huì)上。據(jù)了解,“悟空-4”可適應(yīng)室外路面、草叢、泥濘路面等多種地形,最快運(yùn)動(dòng)速度可以達(dá)到6公里/小時(shí),還能跳高0.5米,還可以可上下25度斜坡和10厘米臺(tái)階。在路面打滑和外部推力干擾等未知擾動(dòng)下,可快速恢復(fù)平衡并保持穩(wěn)定行走。

47b79f3e-4246-11ee-a2ef-92fbcf53809c.png

浙江大學(xué)供圖

“悟空-4”通過融合腿足運(yùn)動(dòng)技術(shù)與環(huán)境感知技術(shù),實(shí)現(xiàn)了機(jī)器人的三維環(huán)境地圖構(gòu)建和自主動(dòng)態(tài)導(dǎo)航。該項(xiàng)目導(dǎo)師是朱秋國和熊蓉,都是機(jī)器人領(lǐng)域的專家,長期從事腿足機(jī)器人、機(jī)器人智能感知控制、群體協(xié)作控制等研究,有深厚的理論與技術(shù)基礎(chǔ)。

清華大學(xué)交叉信息研究院和上海期智研究院所孵化的創(chuàng)業(yè)公司星動(dòng)紀(jì)元也帶著人形機(jī)器人產(chǎn)品來到了現(xiàn)場。

這次,星動(dòng)紀(jì)元的兩款產(chǎn)品小星和小星MAX都進(jìn)行了現(xiàn)場演示。小星在水泥地上、樹林里、草地里、石子路上都能快速行走,且有一定的穩(wěn)定性。

這兩款機(jī)器人產(chǎn)品背后,是公司自主研發(fā)的一系列軟硬件技術(shù):基于本體感知驅(qū)動(dòng)器的人形機(jī)器人本體;使用自研高扭矩密度模塊化關(guān)節(jié)以及一體化結(jié)構(gòu)設(shè)計(jì);以高強(qiáng)度合金、碳纖維和工程塑料等先進(jìn)材料,保留美觀外形,提高了結(jié)構(gòu)的強(qiáng)度和穩(wěn)定性;布局大語言模型,配以先進(jìn)的力控算法,具備高動(dòng)態(tài)性能的同時(shí)能更好地理解人類。

從投資人追捧、頭部科技公司入局,到創(chuàng)業(yè)公司和高校的創(chuàng)新研究,眼下,人形機(jī)器人正在多個(gè)方向齊頭并進(jìn),迎來新的發(fā)展階段。

2.給人形機(jī)器人裝上大腦

大模型是推動(dòng)人形機(jī)器人走向熱潮的另一重關(guān)鍵技術(shù)變量。

OpenAI靠一己之力讓人類邁進(jìn)了通用人工智能的大門前。大模型的觸角正在進(jìn)入各行各業(yè),與機(jī)器人結(jié)合之后,人類開啟了對通用機(jī)器人可能性的新想象:只能聊天對話太局限了,能不能通過指令,自己拆解任務(wù)并執(zhí)行到底?

云啟資本合伙人陳昱認(rèn)為,大模型本質(zhì)是軟件能力,在數(shù)字世界中,與現(xiàn)實(shí)世界連接最好的載體實(shí)際上是硬件載體。“目前,我們更看重如何將大模型與機(jī)器人硬件結(jié)合,實(shí)現(xiàn)通用機(jī)器人的形態(tài)。”在他看來,具身智能讓通用機(jī)器人已經(jīng)看到了一個(gè)可能的路徑,資本就是去給行業(yè)添一把柴火,經(jīng)過五年到十年的大規(guī)模的投入,讓它燒的更旺,最終實(shí)現(xiàn)通用機(jī)器人的商用化。

陳昱提到,目前機(jī)器人側(cè)研發(fā)關(guān)注的重點(diǎn)與以往不同:不再僅限于完成某一類特定工作,而是進(jìn)一步完成多類型任務(wù)。比如過去,配送機(jī)器人負(fù)責(zé)配送、建筑機(jī)器人智能刷墻。但在通用智能化的大背景下,未來將有可能實(shí)現(xiàn)機(jī)器人靈活用工,比如工廠環(huán)境中的機(jī)器人既能擰螺絲、又能噴漆、還能完成零件組裝。

目前,不管是“具身智能”還是“通用人工智能”都是市場對2023年的人形機(jī)器人的新期待——通用人工智能對物理世界的價(jià)值需要有具身的實(shí)體來承載,并和真實(shí)的物理世界進(jìn)行交互,才能更大范圍的影響人類。

線性資本投資總監(jiān)辛未認(rèn)為,大模型打開了通用機(jī)器人的可實(shí)現(xiàn)性。辛未提到,機(jī)器人的通用化,需要解決幾個(gè)技術(shù)的問題:上層需要對任務(wù)做理解、定義、規(guī)劃、拆分;中間需要能夠強(qiáng)泛化的執(zhí)行層來滿足不同場景的任務(wù)執(zhí)行;底層是相對成熟的機(jī)器人控制,再搭配上合適的硬件本體?!叭齻€(gè)層級(jí)中,在大模型出來之前,我們認(rèn)為頂層是最難實(shí)現(xiàn)的,而大模型的能力完全匹配了這一層的要求,使通用機(jī)器人具有變?yōu)楝F(xiàn)實(shí)的可能?!?/p>

很多創(chuàng)業(yè)公司看中的也是技術(shù)驅(qū)動(dòng)下,人形機(jī)器人的新能力可能會(huì)打開全新的需求,更靠近落地。

宇樹科技創(chuàng)始人王興興提到,在幾年前,市場不看好人形機(jī)器人最關(guān)鍵的原因是,人類的控制技術(shù)沒辦法駕馭人形機(jī)器人這么復(fù)雜的機(jī)器人形態(tài)。如今,在大模型的技術(shù)發(fā)展下,AI的發(fā)展已經(jīng)遠(yuǎn)超機(jī)器人需要的技術(shù)?!艾F(xiàn)在做人形機(jī)器人,借鑒現(xiàn)有的大模型技術(shù),做一個(gè)小模型甚至中等模型就能用了,這讓通用人形機(jī)器人技術(shù)層面邁過了一個(gè)鴻溝,未來幾年,只要突破工程方面的問題,就可以讓人形機(jī)器人可以發(fā)揮很大的生產(chǎn)價(jià)值,帶來顛覆性的落地應(yīng)用。”

正在研究雙足機(jī)器人的智能機(jī)器人公司逐際動(dòng)力創(chuàng)始人張巍認(rèn)為,人形機(jī)器人帶來的機(jī)器人通用機(jī)會(huì)在于,既可以解決目前專業(yè)機(jī)器無法處理的問題,同時(shí)需要具備至少2-3個(gè)不同工種工人的能力,比如既能搬箱子,還可以揀貨、進(jìn)行質(zhì)量檢測等,它需要是一個(gè)通用的物理運(yùn)動(dòng)平臺(tái)。

相比國內(nèi),國外的進(jìn)展更快一步,已經(jīng)把大模型的能力從語言穿透到執(zhí)行層。

今年7月,李飛飛團(tuán)隊(duì)在網(wǎng)上公開了一個(gè)新的具身智能研究項(xiàng)目:接入大模型的機(jī)器人可以根據(jù)人類發(fā)出的語言指令,自己進(jìn)行拉抽屜、擰瓶蓋、稱重蘋果等動(dòng)作。

7月28日,谷歌DeepMind最推出的機(jī)器人模型Robotics Transformer 2(RT-2)也是這一方向研究的延伸。RT-2是一個(gè)全新的視覺-語言-動(dòng)作(VLA)模型,可以從網(wǎng)絡(luò)和機(jī)器人數(shù)據(jù)中學(xué)習(xí),并將這些知識(shí)轉(zhuǎn)化為機(jī)器人控制的通用指令。RT-2表現(xiàn)出了更好的泛化能力——理解范圍超出它所接觸到的機(jī)器人數(shù)據(jù)的語義和視覺范疇,且能解釋新指令并通過執(zhí)行基本推理來響應(yīng)用戶命令。

Google DeepMind的論文中介紹了Robotics Transformer 2(RT-2),一個(gè)全新的視覺-語言-動(dòng)作(VLA)模型,它從網(wǎng)絡(luò)和機(jī)器人數(shù)據(jù)中學(xué)習(xí),并將這些知識(shí)轉(zhuǎn)化為機(jī)器人控制的通用指令,同時(shí)保留了web-scale能力。

這些研究都為人類邁向通用機(jī)器人奠定了關(guān)鍵一步。國內(nèi),來自清華的團(tuán)隊(duì)也一直進(jìn)行這一領(lǐng)域的研究。2000年圖靈獎(jiǎng)獲得者、中國科學(xué)院院士、清華大學(xué)交叉信息研究院院長姚期智在論壇分享中提到,這種融合了大模型能力的新一代具身智能體需要具備三個(gè)特征:

第一是身體,這部分需要有足夠的硬件,比如傳感器和執(zhí)行器;

第二是小腦,可以主導(dǎo)視覺、觸覺各種感知,來控制身體,完成復(fù)雜的任務(wù);

第三是大腦,主導(dǎo)上層的邏輯推理、決策、長時(shí)間的規(guī)劃,并以用自然語言和其他的智能體、環(huán)境交流。

如果具身智能為核心的通用機(jī)器人是未來方向,這個(gè)形態(tài)為什么一定是人形機(jī)器人?

誠然,通用機(jī)器人不一定等于人形機(jī)器人,但目前,很多機(jī)器人從業(yè)者都提到,人形機(jī)器人是公認(rèn)的最好的通用機(jī)器人形態(tài)。

姚期智在分享中提到,目前,最好的通用機(jī)器人形態(tài)就是人形機(jī)器人,一方面人形機(jī)器人更能適應(yīng)各種環(huán)境,另一方面,當(dāng)前人類社會(huì)環(huán)境中的種種設(shè)計(jì)都是為人類量身定做,比如樓梯結(jié)構(gòu)、門把手高度、杯子形狀等,都是為人類形象所定制。所以,如果要打造一個(gè)有泛應(yīng)用能力的通用機(jī)器人,人形是目前最好最適合的形態(tài)。

真格基金合伙人劉元告訴「甲子光年」,他認(rèn)為,人形機(jī)器人的產(chǎn)品定義和需求是有基礎(chǔ)的,它在某種程度上與人類數(shù)百年前對機(jī)器人的期待就有些相似??v觀歷史中各類技術(shù)的發(fā)展,很多新的產(chǎn)品都是對幾百年前人類科幻作品中對未來生活的需求和解決方案的一種遙遠(yuǎn)回響。“幾百年前,人類就想讓機(jī)器人幫做家務(wù)。之后就有了洗衣機(jī)、微波爐、掃地機(jī)器人。可以說,科幻完成了人類對于需求的一個(gè)產(chǎn)品定義?!?/p>

但他也提到,這個(gè)階段很多公司一擁而上做人形機(jī)器人也有很大的跟風(fēng)成分。

3.大模型解決不了的問題還有很多

理想豐滿的另一面是現(xiàn)實(shí)的骨感。對于正加速布局人形機(jī)器人賽道的科技公司而言,在把握當(dāng)前機(jī)會(huì)的同時(shí)還要考慮更多現(xiàn)實(shí)的技術(shù)難題和商業(yè)化挑戰(zhàn)。

技術(shù)層面,正如谷歌、李飛飛等團(tuán)隊(duì)正在研究的一樣,通用機(jī)器人領(lǐng)域也需要類似GPT-4這樣的大模型,能夠真正一步到位,把多模式能力融合在一起,真正統(tǒng)一具身智能的發(fā)展。

但這并非易事,明勢資本合伙人夏令告訴「甲子光年」,目前論文和一些demo展示的機(jī)器人與大語言模型結(jié)合偏重交互問題,但并不是解決交互問題后,人形機(jī)器人就變成了通用機(jī)器人。“因?yàn)榧词够谌藱C(jī)交互完成高層次任務(wù)分解和規(guī)劃,機(jī)器人仍需要控制和執(zhí)行,包括在復(fù)雜地形的通用移動(dòng)能力和高精度操作能力。這些能力對機(jī)器人來說仍有很大挑戰(zhàn)。”

夏令認(rèn)為,在控制執(zhí)行層面,大語言模型難以解決問題。“站在整個(gè)通用機(jī)器人的發(fā)展角度來看,大語言模型有貢獻(xiàn),但對底層控制和執(zhí)行的影響有限。目前學(xué)術(shù)界采用AI驅(qū)動(dòng)的方法,希望把強(qiáng)化學(xué)習(xí)的方式做底層的控制執(zhí)行,但這和大語言模型并沒有直接的關(guān)系。且強(qiáng)化學(xué)習(xí)的控制方法大部分還停留在學(xué)術(shù)研究階段?!?/p>

身在其中的企業(yè)也正在面對這些難題。宇樹科技創(chuàng)始人王興興提到,機(jī)器人領(lǐng)域會(huì)出現(xiàn)自身的大模型。在他看來,大模型與機(jī)器人的融合是一個(gè)難點(diǎn),一些通用大模型并的文字邏輯化和處理能力不錯(cuò),但由于不是給通用人形機(jī)器人專門使用,所以這些大模型對環(huán)境認(rèn)知和感知能力基本是零。而不同于大語言模型的數(shù)據(jù)集可以直接從互聯(lián)網(wǎng)端獲取,機(jī)器人的數(shù)據(jù)都是動(dòng)態(tài)的數(shù)據(jù)集,需要在仿真環(huán)境中,獲得動(dòng)態(tài)模擬數(shù)據(jù),也依賴于和物理環(huán)境的基礎(chǔ)和交互,這些都需要一定的時(shí)間。

對于未來的技術(shù)進(jìn)展,王興興相對比較樂觀,“目前英偉達(dá)已經(jīng)在推進(jìn)在仿真環(huán)境中的相關(guān)訓(xùn)練,從目前全球的熱度以及目前人工智能行業(yè)的進(jìn)展來看,不超過10年,會(huì)有顯著性進(jìn)步?!?/p>

也有人覺得不會(huì)很快。德國慕尼黑工業(yè)大學(xué)教授Alois C. Knoll提到,接下來,機(jī)器人領(lǐng)域也需要慢慢的像大語言模型一樣,一步步的集成仿真、建模、編程、人工智能等多項(xiàng)能力,走出自身的智能泛化能力?!叭诵螜C(jī)器人是目前見到的最難最復(fù)雜的機(jī)器之一,這個(gè)過程需要時(shí)間,可能會(huì)比AGI慢,可能不會(huì)快速地見到巨變。”

另一個(gè)關(guān)鍵的挑戰(zhàn)在于軟硬件能力的協(xié)同進(jìn)化上。

與很多人都在推崇大模型給人形機(jī)器人帶來顛覆性的機(jī)會(huì)不同,波士頓動(dòng)力創(chuàng)始人Marc Raibert在演講中提到,未來的機(jī)器人技術(shù)發(fā)展過程中,硬件工程和軟件同等重要。“有些人認(rèn)為軟件可以克服硬件上所有的問題和限制,我并不贊同這個(gè)觀點(diǎn)”。

在他看來,只有最好的硬件設(shè)計(jì)師和軟件性設(shè)計(jì)師傾力合作,才能夠設(shè)計(jì)出世界上最好的機(jī)器人。以波士頓動(dòng)力的人形機(jī)器人為例,在Atlas的硬件工程方面,公司做了大量工作——包括液壓系統(tǒng)、多個(gè)專門的閥門、專用電池、負(fù)載等各個(gè)方面,把機(jī)器人的重量從170公斤縮小到90公斤,這個(gè)過程中,他們沒有在機(jī)器人的功能上有任何妥協(xié),反而提高了機(jī)器人的運(yùn)動(dòng)范圍力量和速度。

這是目前最現(xiàn)實(shí)的難點(diǎn)。尤其對于創(chuàng)業(yè)公司而言,平衡技術(shù)實(shí)現(xiàn)、性能和成本是關(guān)鍵能力。

星動(dòng)紀(jì)元CEO陳建宇稱,目前星動(dòng)紀(jì)元希望機(jī)器人能同時(shí)兼顧力量、速度、精度以及成本,但確實(shí)難以做到?!耙簤杭夹g(shù)能讓機(jī)器人的速度和力量都很強(qiáng),但成本太貴;電驅(qū)動(dòng)技術(shù)取決于如果用高減速比的諧波技術(shù),但一旦精度比較高,承載也不錯(cuò),靈巧性又會(huì)降低;而靈巧度上去了,成本比較低,但卻要犧牲機(jī)器人的載荷和精度?,F(xiàn)在很難兼顧所有情況,只能針對不同的應(yīng)用場景,進(jìn)行各要素的平衡。”

此外,在安全性上,大語言模型胡說八道可能造成的影響不大,但一旦一臺(tái)搭載大模型的機(jī)器人進(jìn)入生活,就需要保證準(zhǔn)確度和安全性,這些都是技術(shù)需要改進(jìn)的方向。

這些問題都需要人形機(jī)器人公司需在場景中不斷試錯(cuò)才能找到解題思路。

線性資本投資總監(jiān)辛未告訴「甲子光年」:人形機(jī)器人目前可展示的 demo 都相對初級(jí),無論是移動(dòng)還是操作,在場景端真正用起來需要算法和硬件有強(qiáng)泛化性,這是其商業(yè)化的基礎(chǔ),目前人形還有科學(xué)側(cè)的問題沒有解決?!爱?dāng)然,我們既不能高估技術(shù)的短期效應(yīng),也不能忽視技術(shù)的長期進(jìn)步,通用機(jī)器人已經(jīng)變成大火的領(lǐng)域,無論是學(xué)術(shù)側(cè)還是工業(yè)側(cè),更多的力量和資源涌入,我相信能在一定程度落地的商業(yè)化產(chǎn)品不遠(yuǎn)了?!?/p>

明勢資本合伙人夏令認(rèn)為,對于今天想去做通用機(jī)器人的創(chuàng)業(yè)公司而言,類比自動(dòng)駕駛的發(fā)展,找到可商業(yè)化閉環(huán)和可數(shù)據(jù)閉環(huán)的L2尤其重要。因?yàn)樗哂姓鎸?shí)的商業(yè)化價(jià)值,同時(shí)底層技術(shù)能夠在商業(yè)化價(jià)值實(shí)現(xiàn)的基礎(chǔ)上,實(shí)現(xiàn)數(shù)據(jù)飛輪,支持繼續(xù)向L4的方向去發(fā)展?!叭绻阒挥蠰2,沒有去做L4的技術(shù)架構(gòu)、野心及能力也是不行的。所以就是要心懷著一個(gè)L4偉大的夢想,同時(shí)要腳踏實(shí)地找到一個(gè)可商業(yè)化的L2。”

技術(shù)、場景、成本、安全,機(jī)會(huì)和挑戰(zhàn)正在同時(shí)到來,人形機(jī)器人正邁出了通往未來的關(guān)鍵一步。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 機(jī)器人
    +關(guān)注

    關(guān)注

    210

    文章

    28007

    瀏覽量

    205579
  • 自動(dòng)駕駛
    +關(guān)注

    關(guān)注

    782

    文章

    13544

    瀏覽量

    165747
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    2221

    瀏覽量

    2247

原文標(biāo)題:人形機(jī)器人+大模型,為什么是投資人追逐的新風(fēng)口?|甲子光年

文章出處:【微信號(hào):jazzyear,微信公眾號(hào):甲子光年】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    人形機(jī)器人場景應(yīng)用聯(lián)盟正式成立

    日前,在“2024首屆人形機(jī)器人場景應(yīng)用峰會(huì)”上,人形機(jī)器人場景應(yīng)用聯(lián)盟正式宣告成立。
    的頭像 發(fā)表于 08-19 11:17 ?529次閱讀

    模型助陣,人形機(jī)器人打工潮來了?

    理論到實(shí)踐中,如何真正體現(xiàn)數(shù)字孿生的技術(shù)威力并獲得業(yè)務(wù)價(jià)值,其中的經(jīng)驗(yàn)或成為推進(jìn)其進(jìn)一步廣泛應(yīng)用的關(guān)鍵。人形機(jī)器人酷炫的外表讓對未來世界滿懷憧憬。今天,如果人形
    的頭像 發(fā)表于 08-13 09:35 ?764次閱讀
    大<b class='flag-5'>模型</b>助陣,<b class='flag-5'>人形</b><b class='flag-5'>機(jī)器人</b>打工潮來了?

    NVIDIA 加速人形機(jī)器人發(fā)展

    —SIGGRAPH— 當(dāng)?shù)貢r(shí)間 2024 年 7 月 29 日— 為加速全球人形機(jī)器人的發(fā)展,NVIDIA 于今日宣布,為全球領(lǐng)先的機(jī)器人制造商、AI 模型開發(fā)者和軟件制造商提供一套
    發(fā)表于 07-30 09:15 ?688次閱讀
    NVIDIA 加速<b class='flag-5'>人形</b><b class='flag-5'>機(jī)器人</b>發(fā)展

    Al大模型機(jī)器人

    金航標(biāo)kinghelm薩科微slkor總經(jīng)理宋仕強(qiáng)介紹說,薩科微Al大模型機(jī)器人有哪些的優(yōu)勢?薩科微AI大模型機(jī)器人由清華大學(xué)畢業(yè)的天才少年N博士和王博士團(tuán)隊(duì)開發(fā),與同行相比具有許多優(yōu)
    發(fā)表于 07-05 08:52

    為何要做人形機(jī)器人

    人形機(jī)器人在各個(gè)發(fā)展時(shí)期,都致力于在“仿特征”上有一些突破。盡管有的人形機(jī)器人穿上衣服可以達(dá)到“以假亂真”的程度,但仔細(xì)觀察就不難發(fā)現(xiàn),幾
    發(fā)表于 04-09 10:54 ?438次閱讀

    優(yōu)必選宣布人形機(jī)器人Walker S接入百度文心大模型

    優(yōu)必選宣布人形機(jī)器人Walker S接入百度文心大模型,共同探索中國AI大模型+人形機(jī)器人的應(yīng)用
    的頭像 發(fā)表于 04-07 10:17 ?813次閱讀

    華為云在人形機(jī)器人領(lǐng)域展開合作

    華為云與人形機(jī)器人領(lǐng)域的創(chuàng)新企業(yè)樂聚機(jī)器人近日達(dá)成合作,共同致力于探索“華為盤古大模型+夸父人形機(jī)器人
    的頭像 發(fā)表于 03-25 10:49 ?533次閱讀

    華為云攜手樂聚機(jī)器人,共探人形機(jī)器人智能新紀(jì)元

    近日,華為云計(jì)算技術(shù)有限公司與樂聚(深圳)機(jī)器人技術(shù)有限公司正式簽署戰(zhàn)略合作協(xié)議,標(biāo)志著雙方將共同開拓“華為盤古大模型+夸父人形機(jī)器人”的全新應(yīng)用場景。此舉不僅是華為云在
    的頭像 發(fā)表于 03-25 10:17 ?503次閱讀

    英偉達(dá)發(fā)布人形機(jī)器人基礎(chǔ)模型

    英偉達(dá)在一年一度的GTC開發(fā)者大會(huì)上,由創(chuàng)始黃仁勛親自揭曉了令人矚目的Project GR00T人形機(jī)器人項(xiàng)目,其中引人注目的是一款全新的人形機(jī)器
    的頭像 發(fā)表于 03-21 11:43 ?662次閱讀

    機(jī)器人掀起2024開年融資熱潮,聯(lián)想入場投資多家公司,人形機(jī)器人要“爆”

    電子發(fā)燒友網(wǎng)報(bào)道(文/劉靜)近日,英偉達(dá)在一年一度的GTC大會(huì)上重磅推出了人形機(jī)器人通用基礎(chǔ)模型Project GR00T。相當(dāng)看好具身智能、人形機(jī)
    的頭像 發(fā)表于 03-21 00:34 ?3587次閱讀
    <b class='flag-5'>機(jī)器人</b>掀起2024開年融資熱潮,聯(lián)想入場<b class='flag-5'>投資</b>多家公司,<b class='flag-5'>人形</b><b class='flag-5'>機(jī)器人</b>要“爆”

    人形機(jī)器人火熱 OpenAI入局人形機(jī)器人 英偉達(dá)等巨頭入局機(jī)器人行業(yè)

    科技巨頭關(guān)注。 據(jù)外媒報(bào)道英偉達(dá)、微軟、OpenAI、三星、亞馬遜等科技巨頭大手筆投資人形機(jī)器人初創(chuàng)公司FigureAI,F(xiàn)igure計(jì)劃在融資中籌集約6.75億美元,貝佐斯計(jì)劃投資1億美元。微軟將
    的頭像 發(fā)表于 02-26 17:21 ?708次閱讀

    曝貝佐斯和英偉達(dá)投資Figure人形機(jī)器人 超大手筆投資

    ,但是巨頭的大手筆入局或?qū)⑾破?b class='flag-5'>人形機(jī)器人的革命。 Figure吸引了超級(jí)豪華的投資人,比如OpenAI和微軟;還有英特爾、亞馬遜、三星等。 Figure計(jì)劃在融資中籌集約6.75億美元,貝佐斯計(jì)劃
    的頭像 發(fā)表于 02-25 14:37 ?815次閱讀

    人形機(jī)器人成為車圈“新寵”?

    現(xiàn)在的人形機(jī)器人不僅形態(tài)更接近人類,而且具備更多的智慧。隨著大型AI模型的不斷推進(jìn),人工智能正在加速人形通用機(jī)器人的量產(chǎn)和落地。
    發(fā)表于 02-22 09:22 ?352次閱讀
    <b class='flag-5'>人形</b><b class='flag-5'>機(jī)器人</b>成為車圈“新寵”?

    高動(dòng)態(tài)人形機(jī)器人“夸父”通過OpenHarmony 3.2 Release版本兼容性測評(píng)

    近日, 搭載KaihongOS的“夸父”人形機(jī)器人通過OpenAtom OpenHarmony(以下簡稱“OpenHarmony”)3.2 Release版本兼容性測評(píng)并獲頒兼容性證書 。這體現(xiàn)了
    發(fā)表于 12-20 09:31

    劍指人形機(jī)器人賽道,泰科機(jī)器人推出重磅關(guān)節(jié)模組

    泰科機(jī)器人幾年前就研判人形機(jī)器人賽道將會(huì)成為熱點(diǎn),決定研發(fā)人形機(jī)器人適用的關(guān)節(jié)模組,經(jīng)過艱苦的技術(shù)攻堅(jiān),泰科
    的頭像 發(fā)表于 11-22 11:12 ?645次閱讀
    劍指<b class='flag-5'>人形</b><b class='flag-5'>機(jī)器人</b>賽道,泰科<b class='flag-5'>機(jī)器人</b>推出重磅關(guān)節(jié)模組