0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

莫拉維克悖論與多模態(tài)AI:邁向機(jī)器人認(rèn)知的新時(shí)代

要長高 ? 2024-10-26 15:00 ? 次閱讀

莫拉維克悖論揭示了人工智能系統(tǒng)在處理高級推理與基本感知運(yùn)動技能上的巨大差異。對于AI而言,復(fù)雜的邏輯任務(wù)似乎比人類習(xí)以為常的感知運(yùn)動技能更容易實(shí)現(xiàn)。這一悖論凸顯了當(dāng)前AI與人類認(rèn)知能力之間的鴻溝。

然而,人類作為多模態(tài)生物,通過視覺、語言、聲音、觸覺、味覺和嗅覺等多種感官模式來了解世界,并進(jìn)行分析、推理和決策。這種多模態(tài)感知與認(rèn)知能力是人類智能的重要組成部分。

隨著傳感器技術(shù)和AI的演進(jìn),機(jī)器人也開始配備多模態(tài)傳感器。這些設(shè)備能夠感知周圍環(huán)境,理解自然語言,并通過數(shù)字傳感界面獲得觸覺等多種信息。隨著計(jì)算能力的不斷提升,機(jī)器人正變得越來越智能。

近年來,Transformer和大語言模型(LLM)的出現(xiàn)推動了多模態(tài)AI的快速發(fā)展。這些模型使得單個(gè)模型能夠同時(shí)處理和理解多種數(shù)據(jù)類型,從而提高了AI系統(tǒng)的綜合感知能力。例如,CLIP能夠理解與自然語言配對的圖像,DALL·E則能根據(jù)文本描述生成圖像。而GPT-4等模型則進(jìn)一步提高了人機(jī)交互的性能,能夠在音頻、視覺和文本之間實(shí)時(shí)推理。

2024年,多模態(tài)AI的演進(jìn)速度進(jìn)一步加快。OpenAI發(fā)布的Sora能夠根據(jù)文本描述生成逼真的視頻,為構(gòu)建通用世界模擬器提供了可能。而GPT-4o則顯著提高了人機(jī)交互的效率和效果,能夠綜合利用多種信息來做出更準(zhǔn)確的判斷和決策。

與此同時(shí),谷歌也發(fā)布了Gemini 1.5等模型,將上下文長度大幅擴(kuò)展,使得AI能夠一次性處理更多信息。谷歌還探討了Project Astra的未來愿景,旨在打造一款能夠處理多模態(tài)信息、理解上下文并在對話中自然交互的通用AI助手。

多模態(tài)AI的發(fā)展為機(jī)器人帶來了前所未有的變革。過去,機(jī)器人往往只能執(zhí)行單一任務(wù),缺乏學(xué)習(xí)和適應(yīng)能力。而現(xiàn)在,多模態(tài)LLM有望改變機(jī)器人的分析、推理和學(xué)習(xí)能力,使機(jī)器人從專用走向通用。這種通用化將推動機(jī)器人技術(shù)的規(guī)?;瘧?yīng)用,降低價(jià)格,并拓展到更多領(lǐng)域。

然而,要使機(jī)器人技術(shù)成為主流,還需要解決能效、安全性和功能安全等問題。Arm處理器作為未來機(jī)器人技術(shù)的基石,已廣泛應(yīng)用于機(jī)器人領(lǐng)域。Arm認(rèn)為,機(jī)器人腦應(yīng)包括“大腦”和“小腦”,采用異構(gòu)AI計(jì)算系統(tǒng)以提供出色的性能、實(shí)時(shí)響應(yīng)和高能效。此外,還需要操作系統(tǒng)、實(shí)時(shí)操作系統(tǒng)(RTOS)以及針對機(jī)器人定制的Linux發(fā)行版等軟件的支持。

綜上所述,莫拉維克悖論揭示了AI與人類認(rèn)知能力之間的差異,而多模態(tài)AI的發(fā)展則為機(jī)器人帶來了前所未有的變革。隨著技術(shù)的不斷進(jìn)步和生態(tài)系統(tǒng)的完善,我們有理由相信,未來機(jī)器人將成為我們生活中不可或缺的一部分,為人類社會帶來更多的便利和價(jià)值。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 機(jī)器人
    +關(guān)注

    關(guān)注

    210

    文章

    28012

    瀏覽量

    205606
  • 人工智能
    +關(guān)注

    關(guān)注

    1789

    文章

    46401

    瀏覽量

    236623
收藏 人收藏

    評論

    相關(guān)推薦

    下一代機(jī)器人和具身智能背后的新技術(shù)

    你聽過悖論 (Moravec's paradox) 嗎?它是指,對于人工智能 (AI
    的頭像 發(fā)表于 09-14 09:35 ?313次閱讀

    Al大模型機(jī)器人

    金航標(biāo)kinghelm薩科微slkor總經(jīng)理宋仕強(qiáng)介紹說,薩科微Al大模型機(jī)器人有哪些的優(yōu)勢?薩科微AI大模型機(jī)器人由清華大學(xué)畢業(yè)的天才少年N博士和王博士團(tuán)隊(duì)開發(fā),與同行相比具有許多優(yōu)勢:語言
    發(fā)表于 07-05 08:52

    NVIDIA三大平臺引領(lǐng)AI機(jī)器人新時(shí)代

    隨著科技的不斷進(jìn)步,AI機(jī)器人已成為制造業(yè)轉(zhuǎn)型升級的重要驅(qū)動力。NVIDIA憑借其Omniverse、Metropolis和Isaac三大平臺,正在與富士康、比亞迪電子、西門子、泰瑞達(dá)和Intrinsic等全球知名企業(yè)共同打造數(shù)字孿生,引領(lǐng)
    的頭像 發(fā)表于 06-04 14:57 ?707次閱讀

    英偉達(dá)CEO黃仁勛展望AI機(jī)器人新時(shí)代

    在COMPUTEX 2024大會上,英偉達(dá)CEO黃仁勛發(fā)表了激動人心的演講,他看好機(jī)器人即將跨入擁有更強(qiáng)感知能力和系統(tǒng)的全新時(shí)代。黃仁勛強(qiáng)調(diào)了自家人工智能(AI)Omniverse技術(shù)在這一領(lǐng)域的巨大潛力,該技術(shù)將助力
    的頭像 發(fā)表于 06-03 11:30 ?676次閱讀

    華為云陳海永:新通話開啟模態(tài)通信新時(shí)代

    5月25日,“第七屆數(shù)字中國建設(shè)峰會·2024中國移動AI+產(chǎn)品分論壇”在福州舉辦。在論壇上,華為云核心網(wǎng)產(chǎn)品線CS&IMS領(lǐng)域總裁陳海永做了《新通話開啟模態(tài)通信新時(shí)代》的主題演講。
    的頭像 發(fā)表于 05-27 10:18 ?456次閱讀

    李未可科技正式推出WAKE-AI模態(tài)AI大模型

    李未可科技模態(tài) AI 大模型正式發(fā)布,積極推進(jìn) AI 在終端的場景應(yīng)用 ? 4月18日,2024中國生成式AI大會上李未可科技正式發(fā)布為眼
    發(fā)表于 04-18 17:01 ?536次閱讀
    李未可科技正式推出WAKE-<b class='flag-5'>AI</b><b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b><b class='flag-5'>AI</b>大模型

    AI機(jī)器人迎來模態(tài)模型

    配備 GR00T 模型的機(jī)器人由于需要“吸收消化”外界的模態(tài)信息,還要快速完成理解、決策、行動等一系列動作,因此對于算力的需求是巨量的。
    發(fā)表于 04-12 10:39 ?237次閱讀

    英偉達(dá)引領(lǐng)AI新潮流,推出“Chat with RTX”聊天機(jī)器人

    隨著人工智能技術(shù)的突飛猛進(jìn),英偉達(dá)(NVIDIA)再次展現(xiàn)了其技術(shù)領(lǐng)導(dǎo)地位,為Windows PC用戶帶來了一款革命性的本地聊天機(jī)器人應(yīng)用程序——“Chat with RTX”。這一創(chuàng)新應(yīng)用的推出,不僅標(biāo)志著人工智能在日常生活中的進(jìn)一步滲透,也預(yù)示著聊天機(jī)器人
    的頭像 發(fā)表于 02-19 11:11 ?900次閱讀

    鰭源全球首創(chuàng)QY-MT智測系統(tǒng):引領(lǐng)水下機(jī)器人邁向AI無損測量新時(shí)代

    測量精度、測量方式、實(shí)時(shí)數(shù)據(jù)可視化的無損智能水下測量新方式,引領(lǐng)水下機(jī)器人測量邁向AI無損智測新時(shí)代! 水下測量作為重要的作業(yè)環(huán)節(jié),常用于
    的頭像 發(fā)表于 02-02 09:12 ?330次閱讀

    機(jī)器人基于開源的模態(tài)語言視覺大模型

    ByteDance Research 基于開源的模態(tài)語言視覺大模型 OpenFlamingo 開發(fā)了開源、易用的 RoboFlamingo 機(jī)器人操作模型,只用單機(jī)就可以訓(xùn)練。
    發(fā)表于 01-19 11:43 ?330次閱讀
    <b class='flag-5'>機(jī)器人</b>基于開源的<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b>語言視覺大模型

    廣和通AI解決方案“智”賦室外機(jī)器人邁向新天地!

    大模型趨勢下,行業(yè)機(jī)器人將具備更完善的交互與自主能力,逐步邁向AI 2.0時(shí)代,成為人工智能技術(shù)全面爆發(fā)的重要基礎(chǔ)。隨著行業(yè)智能化,更多機(jī)器人
    的頭像 發(fā)表于 01-18 11:52 ?280次閱讀

    廣和通AI解決方案“智”賦室外機(jī)器人邁向新天地!

    大模型趨勢下,行業(yè)機(jī)器人將具備更完善的交互與自主能力,逐步邁向AI2.0時(shí)代,成為人工智能技術(shù)全面爆發(fā)的重要基礎(chǔ)。隨著行業(yè)智能化,更多機(jī)器人
    的頭像 發(fā)表于 01-18 11:51 ?470次閱讀
    廣和通<b class='flag-5'>AI</b>解決方案“智”賦室外<b class='flag-5'>機(jī)器人</b><b class='flag-5'>邁向</b>新天地!

    工位機(jī)器人的激光焊接機(jī)優(yōu)勢及工作原理

    編輯:鐳拓激光三工位機(jī)器人的激光焊接機(jī)是一種先進(jìn)的焊接設(shè)備,它結(jié)合了機(jī)器人技術(shù)、激光技術(shù)和工位加工技術(shù),科普一下優(yōu)勢和工作原理高效率和
    的頭像 發(fā)表于 01-10 11:06 ?398次閱讀
    三<b class='flag-5'>維</b><b class='flag-5'>多</b>工位<b class='flag-5'>機(jī)器人</b>的激光焊接機(jī)優(yōu)勢及工作原理

    機(jī)器人擁抱AI大模型已成共識!

    目前普遍的共識是,機(jī)器人擁抱AI大模型的過程就是具身智能機(jī)器人的實(shí)現(xiàn)過程,融合AI大模型的具身智能機(jī)器人將是未來
    發(fā)表于 12-22 17:08 ?349次閱讀

    穩(wěn)石機(jī)器人第五代模態(tài)柔性AMR、無人叉車震撼登場 全球首發(fā)

    10月31日,以“算法探見未來,創(chuàng)新引領(lǐng)模態(tài)時(shí)代”為主題的2023穩(wěn)石機(jī)器人第五代模態(tài)新品發(fā)
    的頭像 發(fā)表于 11-01 19:18 ?683次閱讀
    穩(wěn)石<b class='flag-5'>機(jī)器人</b>第五代<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b>柔性AMR、無人叉車震撼登場 全球首發(fā)