0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

GLaDOS交互機(jī)器人入選Hackster.io挑戰(zhàn)賽9個(gè)優(yōu)勝作品之一

NVIDIA英偉達(dá)企業(yè)解決方案 ? 來源:NVIDIA英偉達(dá)企業(yè)解決方案 ? 2024-05-10 11:33 ? 次閱讀

其他優(yōu)勝作品包括 AI 驅(qū)動(dòng)的虛擬試衣應(yīng)用和一款能夠?qū)ふ疫z失物品的機(jī)器人等。

YouTube 機(jī)器人技術(shù)主播 Dave Niewinski 開發(fā)的機(jī)器人五花八門,從可駕駛的“La-Z-Boy”椅子到由 AI 引導(dǎo)的扔沙包機(jī)器人、馬車比賽機(jī)器人等。

他最近的交互式電子動(dòng)畫 GLaDOS 項(xiàng)目成為了 Hackster AI 創(chuàng)新挑戰(zhàn)賽的九個(gè)優(yōu)勝作品之一。約 100 名參賽者通過創(chuàng)建開源項(xiàng)目、推動(dòng) AI 在邊緣計(jì)算、機(jī)器人和物聯(lián)網(wǎng)領(lǐng)域的應(yīng)用,來角逐由 NVIDIA 與 Sparkfun 提供的獎(jiǎng)品。

Niewinski 根據(jù)視頻游戲開發(fā)商 Valve 的第一人稱解謎系列游戲《傳送門》(Portal)中的 GLaDOS 向?qū)?,設(shè)計(jì)出了一個(gè)創(chuàng)新機(jī)器人,該機(jī)器人贏得了生成式 AI 應(yīng)用組第一名。

另兩位優(yōu)勝者 Andrei Ciobanu 和 Allen Tao 分別獲得了邊緣生成式 AI 模型和邊緣 AI 應(yīng)用組的一等獎(jiǎng)。Ciobanu 利用生成式 AI 幫助實(shí)現(xiàn)虛擬試衣,而 Tao 所開發(fā)的基于 ROS 的機(jī)器人可通過繪制家庭內(nèi)部地圖來幫助尋找物品。

將 LLM 應(yīng)用于機(jī)器人

Niewinski 在其位于加拿大安大略省滑鐵盧的 Armoury Labs 開發(fā)定制化的機(jī)器人應(yīng)用。他使用 NVIDIA Jetson 平臺(tái)開發(fā)邊緣 AI 和機(jī)器人技術(shù),并根據(jù)自己的經(jīng)驗(yàn)創(chuàng)建開源教程和 YouTube 視頻。

為了給自己配備一名實(shí)驗(yàn)室私人助理,他制作了一個(gè)自己的 GLaDOS 交互機(jī)器人。該機(jī)器人使用基于 Transformer 的語音識(shí)別、文本轉(zhuǎn)語音和大語言模型(LLM)處理查詢,這些功能與模型均在 NVIDIA Jetson AGX Orin 上運(yùn)行,可與機(jī)械臂和攝像頭進(jìn)行交互。

GLaDOS 可以追蹤 Niewinski 在實(shí)驗(yàn)室中的行蹤,能夠朝不同的方向移動(dòng)來面對(duì)他,并對(duì)詢問作出快速反應(yīng)。

Niewinski 表示:“我喜歡用機(jī)器人做一些出乎人們意料的事情?!?/p>

他希望這個(gè)助手的聲音能像《傳送門》中的原版 GLaDOS 一樣,并且能夠迅速作出反應(yīng)。幸運(yùn)的是,游戲公司 Valve 把《傳送門》和《傳送門 2》中的所有語音臺(tái)詞都放在了自己的網(wǎng)站上,Niewinski 可以下載音頻來訓(xùn)練模型。

他提到:“使用 Jetson 的話,一般的問答語音都能快速運(yùn)行?!?/p>

Niewinski 利用 NVIDIA 的開源 NeMo 套件對(duì) GLaDOS 的語音進(jìn)行了微調(diào),訓(xùn)練出一個(gè)名為 FastPitch 的頻譜生成器網(wǎng)絡(luò)和一個(gè)名為 HiFiGAN 的聲碼器網(wǎng)絡(luò)來提高音頻質(zhì)量。

這兩個(gè)網(wǎng)絡(luò)都被部署到搭載 NVIDIA Riva 的 Orin 上,將語音識(shí)別與合成功能的運(yùn)行速度優(yōu)化到數(shù)倍于語音的實(shí)時(shí)速度,使其能夠與 LLM 同步運(yùn)行并保持流暢的交互傳輸。

為了讓 GLaDOS 生成符合現(xiàn)實(shí)的回答,Niewinski 使用了一個(gè)名為 OpenChat 的本地托管 LLM,該模型在 Docker 中運(yùn)行,來自 jetson-containers。所有這些 AI 都在 Jetson 模塊上運(yùn)行,使用的是由 CUDA 和 JetPack 構(gòu)建的最新開源 ML 軟件堆棧。

為了讓 GLaDOS 能夠移動(dòng),Niewinski 專門為宇樹科技 Z1 機(jī)械臂開發(fā)了交互功能。GLaDOS 可以通過一個(gè)立體攝像頭和多個(gè)模型來觀察和追蹤人類語言,其機(jī)械臂周圍裝上了 3D 打印的 GLaDOS 頭部和身體外殼。

借助生成式 AI 試遍新款服裝

來自羅馬尼亞的 Winner Ciobanu 希望借助生成式 AI 提升虛擬試衣體驗(yàn),他的作品 EdgeStyle: Fashion Preview at the Edge 奪得了第一名。

他使用 YOLOv5、SAM、OpenPose 等 AI 模型,從圖像和視頻中提取并完善數(shù)據(jù),然后使用 Stable Diffusion 生成圖像,他表示Stable Diffusion是實(shí)現(xiàn)精準(zhǔn)虛擬試穿的關(guān)鍵所在。

Ciobanu 提到,這個(gè)系統(tǒng)教會(huì)了模型如何將衣服“穿”在不同姿勢(shì)的人身上,從而增強(qiáng)了試穿的真實(shí)感。

“這個(gè)系統(tǒng)非常方便,可以讓用戶不用真的去實(shí)際試穿,就能看到衣服穿在身上的效果?!?/p>

他表示,NVIDIA JetPack SDK 提供了在 Jetson Orin 上順利運(yùn)行 AI 模型所需的所有工具。

“AI 技術(shù)日新月異,擁有一套穩(wěn)定的工具非常有用。它確實(shí)為我們這些開發(fā)者節(jié)約了時(shí)間,減少了麻煩,讓我們能夠擺脫技術(shù)問題的困擾,把更多精力放在構(gòu)建很酷的東西上?!?/p>

讓機(jī)器人幫助尋找遺失物品

加拿大安大略省的獲獎(jiǎng)?wù)?Winner Tao 創(chuàng)造的機(jī)器人可以幫助人們?cè)诩抑袑ふ疫z失物品。他的 An Eye for an Item 項(xiàng)目贏得了 Hackster 挑戰(zhàn)賽的第一名。

Tao 提到:“尋找丟失的物品是一件苦差事,而近期零樣本物體檢測(cè)和 LLM 領(lǐng)域的最新進(jìn)展使計(jì)算機(jī)可以根據(jù)文字或圖片描述為我們檢測(cè)任意物體,這帶來了實(shí)現(xiàn)自動(dòng)化的可能性?!?/p>

Tao 表示自己需要機(jī)器人的計(jì)算能力來對(duì)任何非結(jié)構(gòu)化環(huán)境中的物體進(jìn)行分類,比如客廳、大型倉庫等。他還需要機(jī)器人執(zhí)行實(shí)時(shí)計(jì)算以進(jìn)行導(dǎo)航定位,并在更大規(guī)模的物體檢測(cè)模型上進(jìn)行推理。

他表示:“Jetson Orin 是一個(gè)絕佳的選擇,它支持從使用 NanoDB 查詢文本和圖像到實(shí)時(shí)里程反饋等一切功能,包括使用 Isaac ROS 硬件來加速 AprilTag 檢測(cè)進(jìn)行漂移校正。”



審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 機(jī)器人
    +關(guān)注

    關(guān)注

    210

    文章

    27994

    瀏覽量

    205553
  • 語音識(shí)別
    +關(guān)注

    關(guān)注

    38

    文章

    1703

    瀏覽量

    112422
  • ROS
    ROS
    +關(guān)注

    關(guān)注

    1

    文章

    276

    瀏覽量

    16919
  • 邊緣計(jì)算
    +關(guān)注

    關(guān)注

    22

    文章

    3009

    瀏覽量

    48286
  • ai技術(shù)
    +關(guān)注

    關(guān)注

    1

    文章

    1248

    瀏覽量

    24127

原文標(biāo)題:AI 大顯身手:GLaDOS 交互機(jī)器人入選 Hackster.io 挑戰(zhàn)賽 9 個(gè)優(yōu)勝作品之一

文章出處:【微信號(hào):NVIDIA-Enterprise,微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    NVIDIA為AI城市挑戰(zhàn)賽構(gòu)建合成數(shù)據(jù)集

    一年一度的 AI 城市挑戰(zhàn)賽中,來自世界各地的數(shù)百支參賽隊(duì)伍在 NVIDIA Omniverse 生成的基于物理學(xué)的數(shù)據(jù)集上測(cè)試了他們的 AI 模型。
    的頭像 發(fā)表于 09-09 10:04 ?381次閱讀

    開源項(xiàng)目!用ESP32做一個(gè)可愛的無用機(jī)器人

    巧妙設(shè)計(jì)的杠桿將開關(guān)推回“關(guān)”位置。這種玩具很常見,許多人已經(jīng)制作并上傳到Y(jié)ouTube上。 作者每年都會(huì)挑戰(zhàn)自己制作個(gè)技術(shù)產(chǎn)品,今年他決定制作這個(gè)復(fù)雜的項(xiàng)目——可愛無用機(jī)器人。這
    發(fā)表于 09-03 09:34

    開源項(xiàng)目!用ESP32做一個(gè)可愛的無用機(jī)器人

    巧妙設(shè)計(jì)的杠桿將開關(guān)推回“關(guān)”位置。這種玩具很常見,許多人已經(jīng)制作并上傳到Y(jié)ouTube上。 作者每年都會(huì)挑戰(zhàn)自己制作個(gè)技術(shù)產(chǎn)品,今年他決定制作這個(gè)復(fù)雜的項(xiàng)目——可愛無用機(jī)器人。這
    發(fā)表于 08-30 14:50

    AI4Science黑客松光子計(jì)算挑戰(zhàn)賽成功舉辦

    經(jīng)過數(shù)月角逐,第二屆AI4Science黑客松競(jìng)賽日前落下帷幕。在曦智科技主持的光子計(jì)算挑戰(zhàn)賽中,參賽選手何自強(qiáng)和來自東北大學(xué)的參賽隊(duì)伍The Power of Light獲得完優(yōu)勝獎(jiǎng)。
    的頭像 發(fā)表于 08-07 09:58 ?387次閱讀

    思爾芯題正式發(fā)布,邀你共戰(zhàn)EDA精英挑戰(zhàn)賽

    題發(fā)布COMPETITIONRELEASE2024中國(guó)研究生創(chuàng)芯大賽·EDA精英挑戰(zhàn)賽(原“集成電路EDA設(shè)計(jì)精英挑戰(zhàn)賽”)現(xiàn)已正式拉開帷幕。作為核心出題企業(yè)之一思爾芯(S2C),已
    的頭像 發(fā)表于 08-03 08:24 ?418次閱讀
    思爾芯<b class='flag-5'>賽</b>題正式發(fā)布,邀你共戰(zhàn)EDA精英<b class='flag-5'>挑戰(zhàn)賽</b>!

    Al大模型機(jī)器人

    和迭代來不斷改進(jìn)自身性能。它們可以從用戶交互中學(xué)習(xí)并根據(jù)反饋進(jìn)行調(diào)整,以提高對(duì)話質(zhì)量和準(zhǔn)確性??啥ㄖ菩耘c整合性: AI大模型機(jī)器人可以根據(jù)特定需求進(jìn)行定制和整合,以滿足不同場(chǎng)景和應(yīng)用的要求。它們可以與其
    發(fā)表于 07-05 08:52

    abb機(jī)器人io通信和信號(hào)設(shè)置過程

    引言 ABB機(jī)器人作為工業(yè)自動(dòng)化領(lǐng)域的重要設(shè)備,其IO通信和信號(hào)設(shè)置是實(shí)現(xiàn)機(jī)器人與外部設(shè)備進(jìn)行數(shù)據(jù)交換和控制的關(guān)鍵。本文將詳細(xì)介紹ABB機(jī)器人IO
    的頭像 發(fā)表于 06-17 09:22 ?2093次閱讀

    入圍全球機(jī)器人頂會(huì)ICRA 2024!毫末在RoboDrive2024挑戰(zhàn)賽嶄露頭角

    5月15日, 毫末智行出席全球機(jī)器人頂級(jí)會(huì)議 ICRA 2024,并在 RoboDrive2024 挑戰(zhàn)賽的第三賽道——Occ 語義占用預(yù)測(cè)任務(wù)取得第三名。 當(dāng)日,毫末與其他優(yōu)勝團(tuán)隊(duì)
    的頭像 發(fā)表于 05-17 10:32 ?378次閱讀
    入圍全球<b class='flag-5'>機(jī)器人</b>頂會(huì)ICRA 2024!毫末在RoboDrive2024<b class='flag-5'>挑戰(zhàn)賽</b>嶄露頭角

    人形機(jī)器人場(chǎng)景應(yīng)用全解析,2024睿抗 AI ROBOT創(chuàng)新挑戰(zhàn)賽火熱報(bào)名中!

    的互動(dòng)中,即發(fā)展具身智能。 ? ?為了推廣并深化具身智能的創(chuàng)新和應(yīng)用,“???b class='flag-5'>機(jī)器人開發(fā)者大賽——AI ROBOT創(chuàng)新挑戰(zhàn)賽”應(yīng)用而生,大賽旨在激發(fā)全國(guó)高校學(xué)生的研究熱情,探索AI與機(jī)器人技術(shù)的融合,展示尖端技術(shù)成果。 ? ?這
    的頭像 發(fā)表于 05-14 10:49 ?1274次閱讀
    人形<b class='flag-5'>機(jī)器人</b>場(chǎng)景應(yīng)用全解析,2024???AI ROBOT創(chuàng)新<b class='flag-5'>挑戰(zhàn)賽</b>火熱報(bào)名中!

    人形機(jī)器人的三大關(guān)鍵技術(shù)及挑戰(zhàn)

    人形機(jī)器人是指外形和人類相似的機(jī)器人。它們可以通過模仿人類的外貌、動(dòng)作和表情來與人類進(jìn)行交互和溝通。
    發(fā)表于 01-05 10:53 ?2116次閱讀

    OpenHarmony人形機(jī)器人創(chuàng)新挑戰(zhàn)賽來啦

    12月28日,第二十六屆中國(guó)機(jī)器人及人工智能大賽人形機(jī)器人創(chuàng)新挑戰(zhàn)賽在蘇州正式發(fā)布,首次結(jié)合
    的頭像 發(fā)表于 12-30 08:32 ?977次閱讀
    OpenHarmony人形<b class='flag-5'>機(jī)器人</b>創(chuàng)新<b class='flag-5'>挑戰(zhàn)賽</b>來啦

    做項(xiàng)目沒靈感?起來看看Build2gether包容性創(chuàng)新挑戰(zhàn)賽的創(chuàng)意吧!

    Build2gether包容性創(chuàng)新挑戰(zhàn)賽近日,由歐洲頂級(jí)大學(xué)ETHZurich主辦、全球知名硬件社區(qū)Hackster.io承辦的Build2gether包容性創(chuàng)新挑戰(zhàn)賽圓滿結(jié)束。本次
    的頭像 發(fā)表于 12-23 08:29 ?387次閱讀
    做項(xiàng)目沒靈感?<b class='flag-5'>一</b>起來看看Build2gether包容性創(chuàng)新<b class='flag-5'>挑戰(zhàn)賽</b>的創(chuàng)意吧!

    節(jié)卡機(jī)器人再度入選《上海智能機(jī)器人標(biāo)桿企業(yè)與應(yīng)用場(chǎng)景推薦目錄》

    。 今年年初,節(jié)卡機(jī)器人以3C電子行業(yè)精密涂膠、汽車行業(yè)銷軸加工、智慧餐飲行業(yè)輔助配餐三大應(yīng)用場(chǎng)景入選批《目錄》名單。連續(xù)兩次入選,展現(xiàn)了節(jié)卡機(jī)
    的頭像 發(fā)表于 12-21 15:13 ?458次閱讀

    AMD 宣布 Pervasive AI 開發(fā)者挑戰(zhàn)賽

    AI 開發(fā)者挑戰(zhàn)賽 。 利用 AMD 廣泛的 AI 就緒技術(shù),開發(fā)者將直面挑戰(zhàn),為數(shù)據(jù)中心、工作站、筆記本電腦、游戲、機(jī)器人以及其它更多領(lǐng)域的應(yīng)用實(shí)例創(chuàng)造創(chuàng)新的、令人激動(dòng)的 AI 應(yīng)用程序。 開發(fā)者有
    的頭像 發(fā)表于 12-05 09:05 ?411次閱讀

    泛林集團(tuán)以 FIRST Global機(jī)器人挑戰(zhàn)賽為舞臺(tái),培養(yǎng)未來的STEM人才

    來源:泛林集團(tuán) 來自近200個(gè)國(guó)家或地區(qū)的學(xué)生們參與最具跨國(guó)性質(zhì)的創(chuàng)新競(jìng)賽 2023年度 FIRST Global機(jī)器人挑戰(zhàn)賽于10月7-10日在新加坡舉辦。全球?qū)⒔?00個(gè)國(guó)家或地區(qū)
    發(fā)表于 10-26 17:49 ?250次閱讀
    泛林集團(tuán)以 FIRST Global<b class='flag-5'>機(jī)器人</b><b class='flag-5'>挑戰(zhàn)賽</b>為舞臺(tái),培養(yǎng)未來的STEM人才