首頁(yè): 電子電路圖,電子技術(shù)資料網(wǎng)站首頁(yè)

電子資料下載: 電子資料下載頻道 -- 為電子工程師提供激發(fā)創(chuàng)新靈感的新方案、新的參考設(shè)計(jì)、新的設(shè)計(jì)構(gòu)想等可下載的電子資料！

電子技術(shù)應(yīng)用: 電子技術(shù)應(yīng)用頻道 -- 為電子工程師提供電子產(chǎn)品設(shè)計(jì)所需的技術(shù)分析、設(shè)計(jì)技巧、設(shè)計(jì)工具、測(cè)試工具等技術(shù)文章！

電子元器件: 專(zhuān)業(yè)的電子元器件平臺(tái) -- 及時(shí)發(fā)布大量最新IC、分立器件、模組等電子元器件產(chǎn)品信息！

電子電路圖: 電路圖頻道 -- 提供電子電路圖,原理圖,汽車(chē)電路圖,手機(jī)電路圖,功放電路圖,電源電路圖等電路圖紙

電子技術(shù)論壇: 構(gòu)建電子工程師交流的平臺(tái) -- 在交流中進(jìn)一步學(xué)習(xí)設(shè)計(jì)技巧、規(guī)劃技術(shù)人生、提升自我價(jià)值！

源碼下載: 源碼下載頻道; uCOS編程 C/C++語(yǔ)言編程 Symbian編程 Linux/uClinux/Unix編程 Windows編程 matlab源程序 php源碼下載 asp.net源碼下載 java源碼下載匯編編程驅(qū)動(dòng)程序單片機(jī)編程數(shù)值算法/人工智能

您的位置：電子發(fā)燒友網(wǎng)>源碼下載>數(shù)值算法/人工智能>

基于分層強(qiáng)化學(xué)習(xí)的多Agent路徑規(guī)劃

大?。?/span>0.88 MB 人氣： 2017-12-27 需要積分：2

前往下載地址

分享到:

標(biāo)簽：分層(11576)Agent(26570)路徑規(guī)劃(15294)

　　針對(duì)路徑規(guī)劃算法收斂速度慢及效率低的問(wèn)題，提出了一種基于分層強(qiáng)化學(xué)習(xí)及人工勢(shì)場(chǎng)的多Agent路徑規(guī)劃算法。首先，將多Agent的運(yùn)行環(huán)境虛擬為一個(gè)人工勢(shì)能場(chǎng)，根據(jù)先驗(yàn)知識(shí)確定每點(diǎn)的勢(shì)能值，它代表最優(yōu)策略可獲得的最大回報(bào)；其次，利用分層強(qiáng)化學(xué)習(xí)方法的無(wú)環(huán)境模型學(xué)習(xí)以及局部更新能力將策略更新過(guò)程限制在規(guī)模較小的局部空間或維度較低的高層空間上，提高學(xué)習(xí)算法的性能；最后，針對(duì)出租車(chē)問(wèn)題在柵格環(huán)境中對(duì)所提算法進(jìn)行了仿真實(shí)驗(yàn)。為了使算法貼近真實(shí)環(huán)境，增加算法的可移植性，在三維仿真環(huán)境中對(duì)該算法進(jìn)行驗(yàn)證，實(shí)驗(yàn)結(jié)果表明該算法收斂速度快，收斂過(guò)程穩(wěn)定。

基于分層強(qiáng)化學(xué)習(xí)的多Agent路徑規(guī)劃

非常好我支持^.^

(0) 0%

不好我反對(duì)

(0) 0%

下載地址

不能下載？請(qǐng)通知我們

基于分層強(qiáng)化學(xué)習(xí)的多Agent路徑規(guī)劃下載

普通下載普通下載

用戶(hù)評(píng)論

發(fā)表評(píng)論即可獲得積分！ 詳見(jiàn)積分規(guī)則

發(fā)表評(píng)論

用戶(hù)評(píng)論

評(píng)價(jià):好評(píng)中評(píng)差評(píng)

發(fā)表評(píng)論，獲取積分！請(qǐng)遵守相關(guān)規(guī)定！

注冊(cè)會(huì)員

游客:

基于分層強(qiáng)化學(xué)習(xí)的多Agent路徑規(guī)劃

下載地址

基于分層強(qiáng)化學(xué)習(xí)的多Agent路徑規(guī)劃下載

相關(guān)電子資料下載

用戶(hù)評(píng)論

發(fā)表評(píng)論

分享你我的電子世界

實(shí)用電子設(shè)計(jì)資料下載

源碼下載排行

熱門(mén)詞