0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AI環(huán)境探索模型升級 縮小搜索范圍效率更高

工程師鄧生 ? 來源:VentureBeat,arXiv ? 作者:VentureBeat,arXiv ? 2021-02-13 10:31 ? 次閱讀

近日,卡內(nèi)基·梅隆大學(xué)、臉書等機構(gòu)的研究人員提出了一個新的AI環(huán)境探索模型。這個新模型綜合了傳統(tǒng)環(huán)境探索模型和基于學(xué)習(xí)方法的環(huán)境探索模型的優(yōu)點,更簡單和不易出錯。

這項研究已經(jīng)發(fā)表在學(xué)術(shù)網(wǎng)站arXiv上,論文標題為《利用主動神經(jīng)SLAM學(xué)習(xí)探索環(huán)境(Learning To Explore Using Active Neural SLAM)》。

論文鏈接:https://arxiv.org/pdf/2004.05155.pdf

e99e0ec582ba4f7fa20273f9c12cfe50.png

一、ANS模型:真實模擬探索環(huán)境

導(dǎo)航能力是智能代理的核心能力之一。導(dǎo)航任務(wù)有許多形式,比如點目標任務(wù)指導(dǎo)航到特定的坐標,語義導(dǎo)航任務(wù)指導(dǎo)航到去特定場景或?qū)ο蟮穆窂健?/p>

不論哪一種任務(wù),在未知環(huán)境中導(dǎo)航的核心問題都是如何高效地探索盡可能多的環(huán)境。這樣才能擴大在未知環(huán)境中找到目標的機會,或者在有限的時間里有效地預(yù)映射環(huán)境。

傳統(tǒng)的探索模型原理是用傳感器觀察幾何體。之后有研究者提出了基于學(xué)習(xí)的導(dǎo)航模型,該模型依據(jù)RGB圖像直接推測出幾何體。

基于學(xué)習(xí)的導(dǎo)航策略通過端到端(end-to-end)訓(xùn)練神經(jīng)網(wǎng)絡(luò)實現(xiàn),可以處理原始的傳感器數(shù)據(jù),直接輸出代理該執(zhí)行的操作。這種策略有3個優(yōu)勢:

1、提高了輸入方式選擇的靈活性;

2、提高顯式狀態(tài)估計誤差的穩(wěn)健性;

3、通過學(xué)習(xí)掌握真實世界的結(jié)構(gòu)規(guī)律性,使代理更有目的性地行動

理論上端到端的學(xué)習(xí)策略有上述優(yōu)勢,但也有局限性。

首先,純粹從數(shù)據(jù)中學(xué)習(xí)映射、狀態(tài)評估、路徑規(guī)劃可能會非常昂貴。因此,以往的端到端學(xué)習(xí)依賴于模仿學(xué)習(xí)和以百萬計的經(jīng)驗框架。

其次,以往針對端到端學(xué)習(xí)策略的研究缺乏真實性。比如使用的是合成室內(nèi)環(huán)境數(shù)據(jù)庫SUNC、簡化了代理動作、運行環(huán)境去除了傳感器噪音等。

從表現(xiàn)來說,端到端的學(xué)習(xí)策略也往往比不需要任何學(xué)習(xí)的傳統(tǒng)方法差。

為了解決全面端到端學(xué)習(xí)的局限性,卡內(nèi)基·梅隆大學(xué)、臉書、伊利諾大學(xué)厄巴納-香檳分校的研究人員推出了“主動神經(jīng)即時定位與地圖構(gòu)建(ANS,Active Neural SLAM)模型”。

實驗設(shè)計上,研究人員盡量使模型訓(xùn)練環(huán)境更真實,用到了生境模擬器和兩個基于真實情景的數(shù)據(jù)庫(Gibson和Matterport),不限制代理的動作,還模擬了傳感器噪音。

二、縮小搜索范圍,兼顧搜索性能和效率

本項研究中,導(dǎo)航模型的任務(wù)是在固定時間內(nèi)覆蓋最大范圍。覆蓋范圍定義為地圖中已知被穿越的總面積。

ANS模型包括一個學(xué)習(xí)神經(jīng)即時定位與地圖構(gòu)建(SLAM,Simultaneous localization and mapping)模塊,一個全局策略(global policy)和一個局部策略(local policy)。它們通過地圖和一個分析路徑規(guī)劃器相連。

層次化和模塊化的設(shè)計和分析規(guī)劃的使用,大大減小了訓(xùn)練過程中的搜索范圍,同時提高了性能和樣本效率。

6892cb08fa96435096077975972be52b.png

▲模型示意圖

訓(xùn)練過程中,學(xué)習(xí)神經(jīng)SLAM模塊產(chǎn)生自由空間地圖,并依據(jù)輸入的RGB圖像和運動傳感器數(shù)據(jù)預(yù)測代理的姿勢。SLAM模塊的學(xué)習(xí)提升了輸入方式的靈活性。

全局策略利用代理的姿勢來占據(jù)自由空間地圖,并把學(xué)習(xí)現(xiàn)實世界環(huán)境布局的結(jié)構(gòu)性規(guī)則作為長期目標。全局策略可以探索真實世界環(huán)境的布局。

長期目標可以為局部策略生成短期目標。局部策略通過學(xué)習(xí),直接從RGB圖像中映射出代理應(yīng)該做出的動作,呈現(xiàn)可視化反饋。

b09b041196c7490e96e6507cc0027fcf.png

▲模型運行過程示意圖

三、ANS模型能探索更大范圍,比基線模型性能優(yōu)秀

利用Gibson訓(xùn)練集,研究人員完成了對ANS模型的訓(xùn)練,運行了1000萬幀探索任務(wù)的所有基線。結(jié)果如下表。

67dfc6baa75e4e77aef35bd9bbeed207.png

運行結(jié)果基于模型在14個未知場景中994次運行的結(jié)果進行平均。與最佳基線的24.863m^2/0.789相比,模型的覆蓋率為32.701m^2/0.948。這個數(shù)值說明,與基線相比,ANS模型在窮盡探索上更有效。

研究人員還對比了模型和基線在較大訓(xùn)練集、較小訓(xùn)練集、全部Gibson訓(xùn)練集中的運行效果。

6a0dd40111dc4fa5a43813b64198aa89.png

較小訓(xùn)練集中,ANS模型能在500步探索完未知環(huán)境,而基線運行1000步后仍只探索了位置環(huán)境的85~90%(上圖中)。

較大訓(xùn)練集中,隨著情節(jié)的發(fā)展,ANS模型與基線之間的差距會擴大(上圖左)。

基線模型中,代理經(jīng)常只探索局部區(qū)域,這說明它們無法記住長期視野的探索區(qū)域,不能進行長期規(guī)劃。相比之下,ANS采用全局策略,可以記憶探索過的區(qū)域,有效地規(guī)劃并實現(xiàn)長期目標。

受到結(jié)果鼓舞,研究人員用ANS模型部署了一個環(huán)境探索機器人。通過調(diào)整攝相機的高度和垂直視野,并匹配棲息地模擬器,機器人成功探索出一個公寓的生活區(qū)域。

a9f4b3437ebe4b7a982c82e203c4137b.gif

結(jié)語:ANS模型效率更高,未來或有更多應(yīng)用

ANS導(dǎo)航模型克服了之前的基于端對端學(xué)習(xí)策略的缺陷,基于更真實的數(shù)據(jù)庫進行訓(xùn)練,最終探索效率有所提升。

研究人員認為這個模型在未來或許會有更多應(yīng)用?!拔磥?,ANS模型可以擴展到復(fù)雜的語義任務(wù),比如語義目標導(dǎo)航和回答具體問題,這將創(chuàng)建出一個能捕獲對象語義屬性的地圖?!?/p>

另外,這個模型也可以與先前的本地化工作結(jié)合,在此前創(chuàng)建的地圖中重新定位,使之后的導(dǎo)航更高效。

責(zé)任編輯:PSY

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    29400

    瀏覽量

    267696
  • 搜索
    +關(guān)注

    關(guān)注

    0

    文章

    69

    瀏覽量

    16639
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3065

    瀏覽量

    48577
  • SLAM
    +關(guān)注

    關(guān)注

    23

    文章

    411

    瀏覽量

    31739
收藏 人收藏

    評論

    相關(guān)推薦

    英偉達發(fā)布AI模型 Llama-3.1-Nemotron-51B AI模型

    速度比原70B大模型提升2.2倍,具備更準確和更高效的運算效率;能夠大幅降低運行成本。 ? ? ? 通過NAS技術(shù)微調(diào);大幅降低了內(nèi)存消耗、計算復(fù)雜性;Llama-3.1-Nemotron-51B
    的頭像 發(fā)表于 09-26 17:30 ?507次閱讀

    月訪問量超2億,增速113%!360AI搜索成為全球增速最快的AI搜索引擎

    與傳統(tǒng)搜索引擎不同,作為AI原生搜索引擎的360AI搜索基于公開網(wǎng)絡(luò)、知識庫、大模型三大支柱。借
    的頭像 發(fā)表于 09-09 13:44 ?298次閱讀
    月訪問量超2億,增速113%!360<b class='flag-5'>AI</b><b class='flag-5'>搜索</b>成為全球增速最快的<b class='flag-5'>AI</b><b class='flag-5'>搜索</b>引擎

    電商搜索革命:大模型如何重塑購物體驗?

    自我介紹:京東零售搜推算法部算法工程師,專注于大模型技術(shù)以及在 AI 助手搜推等領(lǐng)域的應(yīng)用探索和實踐。在 AI 助手,NLP 和搜索領(lǐng)域有十
    的頭像 發(fā)表于 08-19 15:09 ?210次閱讀

    ai模型和傳統(tǒng)ai的區(qū)別在哪?

    的BERT模型使用了33億個參數(shù),而傳統(tǒng)AI模型通常只有幾千到幾百萬個參數(shù)。 模型復(fù)雜度 AI模型
    的頭像 發(fā)表于 07-16 10:06 ?981次閱讀

    AI搜索新貴彎道超車難

    ,尤其國內(nèi)市場,百度一家獨大的態(tài)勢已維持了近20年。不過,AI模型的到來,打破了這一僵局。2024上半年,AI搜索正成為新共識并迎來了一波熱潮,短時間內(nèi)涌現(xiàn)出了
    的頭像 發(fā)表于 07-09 08:05 ?231次閱讀
    <b class='flag-5'>AI</b><b class='flag-5'>搜索</b>新貴彎道超車難

    STM CUBE AI錯誤導(dǎo)入onnx模型報錯的原因?

    使用cube-AI分析模型時報錯,該模型是pytorch的cnn轉(zhuǎn)化成onnx ``` Neural Network Tools for STM32AI v1.7.0 (STM.
    發(fā)表于 05-27 07:15

    OpenAI的AI搜索也要來了,但我們需要這么多AI搜索

    OpenAI要做AI搜索挑戰(zhàn)谷歌這件事已經(jīng)傳了很久,傳說中的SearchGPT似乎真的要來了。據(jù)軟件開發(fā)者TiborBlaho爆料,OpenAI的AI搜索產(chǎn)品Sonic-SNC(Sea
    的頭像 發(fā)表于 05-10 08:05 ?348次閱讀
    OpenAI的<b class='flag-5'>AI</b><b class='flag-5'>搜索</b>也要來了,但我們需要這么多<b class='flag-5'>AI</b><b class='flag-5'>搜索</b>么

    【大語言模型:原理與工程實踐】探索《大語言模型原理與工程實踐》2.0

    《大語言模型“原理與工程實踐”》是關(guān)于大語言模型內(nèi)在機理和應(yīng)用實踐的一次深入探索。作者不僅深入討論了理論,還提供了豐富的實踐案例,幫助讀者理解如何將理論知識應(yīng)用于解決實際問題。書中的案例分析有助于
    發(fā)表于 05-07 10:30

    搭載星火認知大模型AI鼠標:一鍵呼出AI助手,辦公更高

    搭載星火認知大模型AI鼠標:一鍵呼出AI助手,辦公更高效 在這個AI時代,如果你想在激烈競爭的職場中不被淘汰,訊飛
    的頭像 發(fā)表于 03-25 11:52 ?420次閱讀
    搭載星火認知大<b class='flag-5'>模型</b>的<b class='flag-5'>AI</b>鼠標:一鍵呼出<b class='flag-5'>AI</b>助手,辦公<b class='flag-5'>更高</b>效

    AI模型將如何推動中國產(chǎn)業(yè)升級?華為盤古大模型深耕千行萬業(yè)

    AI模型將如何推動中國產(chǎn)業(yè)升級?日前,華為混合云副總裁胡玉海在做客央視網(wǎng)《中國神氣局》時,暢談AI模型發(fā)展趨勢以及如何助力產(chǎn)業(yè)創(chuàng)新。胡玉
    的頭像 發(fā)表于 03-22 10:40 ?520次閱讀

    使用cube-AI分析模型時報錯的原因有哪些?

    使用cube-AI分析模型時報錯,該模型是pytorch的cnn轉(zhuǎn)化成onnx ``` Neural Network Tools for STM32AI v1.7.0 (STM.
    發(fā)表于 03-14 07:09

    潞晨科技Colossal-AI + 浪潮信息AIStation,大模型開發(fā)效率提升10倍

    的潞晨科技Colossal-AI系統(tǒng),用戶可實現(xiàn)在本地算力平臺一鍵訓(xùn)練、微調(diào)、推理、部署大模型,將大模型開發(fā)效率提升10倍以上,并將算力效率
    的頭像 發(fā)表于 03-01 09:43 ?423次閱讀
    潞晨科技Colossal-<b class='flag-5'>AI</b> + 浪潮信息AIStation,大<b class='flag-5'>模型</b>開發(fā)<b class='flag-5'>效率</b>提升10倍

    沃爾瑪發(fā)布最新AI技術(shù)產(chǎn)品 已在CES展會上展示AI搜索技術(shù)

    建議。比如你搜索足球觀看派對得到的購物幫助,就可能會是關(guān)于薯條、雞翅、飲料和寬屏電視。 AI工具結(jié)合了微軟的人工智能模型和沃爾瑪?shù)馁徫镎邤?shù)據(jù)來提供更加個性化的服務(wù),提升用戶的購物體驗。 目前A
    的頭像 發(fā)表于 01-11 16:06 ?796次閱讀

    AI模型怎么解決芯片過剩?

    AI模型
    電子發(fā)燒友網(wǎng)官方
    發(fā)布于 :2024年01月02日 15:42:05

    AI模型可以設(shè)計電路嗎?

    AI模型
    電子發(fā)燒友網(wǎng)官方
    發(fā)布于 :2024年01月02日 15:09:29