您好,歡迎來(lái)電子發(fā)燒友網(wǎng)! ,新用戶(hù)?[免費(fèi)注冊(cè)]

您的位置:電子發(fā)燒友網(wǎng)>源碼下載>數(shù)值算法/人工智能>

基于分層強(qiáng)化學(xué)習(xí)的多Agent路徑規(guī)劃

大?。?/span>0.88 MB 人氣: 2017-12-27 需要積分:2

  針對(duì)路徑規(guī)劃算法收斂速度慢及效率低的問(wèn)題,提出了一種基于分層強(qiáng)化學(xué)習(xí)及人工勢(shì)場(chǎng)的多Agent路徑規(guī)劃算法。首先,將多Agent的運(yùn)行環(huán)境虛擬為一個(gè)人工勢(shì)能場(chǎng),根據(jù)先驗(yàn)知識(shí)確定每點(diǎn)的勢(shì)能值,它代表最優(yōu)策略可獲得的最大回報(bào);其次,利用分層強(qiáng)化學(xué)習(xí)方法的無(wú)環(huán)境模型學(xué)習(xí)以及局部更新能力將策略更新過(guò)程限制在規(guī)模較小的局部空間或維度較低的高層空間上,提高學(xué)習(xí)算法的性能;最后,針對(duì)出租車(chē)問(wèn)題在柵格環(huán)境中對(duì)所提算法進(jìn)行了仿真實(shí)驗(yàn)。為了使算法貼近真實(shí)環(huán)境,增加算法的可移植性,在三維仿真環(huán)境中對(duì)該算法進(jìn)行驗(yàn)證,實(shí)驗(yàn)結(jié)果表明該算法收斂速度快,收斂過(guò)程穩(wěn)定。

基于分層強(qiáng)化學(xué)習(xí)的多Agent路徑規(guī)劃

非常好我支持^.^

(0) 0%

不好我反對(duì)

(0) 0%

      發(fā)表評(píng)論

      用戶(hù)評(píng)論
      評(píng)價(jià):好評(píng)中評(píng)差評(píng)

      發(fā)表評(píng)論,獲取積分! 請(qǐng)遵守相關(guān)規(guī)定!

      ?