電子發(fā)燒友App

硬聲App

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示
創(chuàng)作
電子發(fā)燒友網(wǎng)>電子資料下載>電子資料>基于雙估計(jì)器的Speedy Q-learning算法

基于雙估計(jì)器的Speedy Q-learning算法

2021-05-18 | pdf | 2.06 MB | 次下載 | 免費(fèi)

資料介紹

  Q-learning算法是一種經(jīng)典的強(qiáng)化學(xué)習(xí)算法,更新策略由于保守和過估計(jì)的原因,存在收斂速度慢的問題。 SpeedyQ-learning算法和 Double Q-learning算法是 Q-learning算法的兩個(gè)變種,分別用于解決 Q-learning算法收斂速度慢和過估計(jì)的問題。文中基于 Speedy Q-learning算法Q值的更新規(guī)則和蒙特卡洛強(qiáng)化學(xué)習(xí)的更新策略,通過理論分析及數(shù)學(xué)證明提岀了其等價(jià)形式,從該等價(jià)形式可以看到, Speedy Q-learning算法由于將當(dāng)前Q值的估計(jì)函數(shù)作為歷史Q值的估計(jì),雖然整體上提升了智能體的收斂速度,但是同樣存在過估計(jì)問題,使得算法在迭代初期的收斂速度較慢。針對(duì)該問題,文中基于 Double cearning算法中雙估計(jì)器可以改善智能體收斂速度的特性,提岀了一種改進(jìn)算法 Double speedy Q-learning。其通過雙估計(jì)器,分離最優(yōu)動(dòng)作和最大Q值的選擇,改善了 Speedy Q-learning算法在迭代初期的學(xué)習(xí)策略,提升了 Speedy Q-learning算法的整體收斂速度。在不同規(guī)模的格子世界中進(jìn)行實(shí)驗(yàn),分別采用線性學(xué)習(xí)率和多項(xiàng)式學(xué)習(xí)率,來(lái)對(duì)比 Q-learning算法及其改進(jìn)算法在迭代初期的收斂速度和整體收斂速度。實(shí)驗(yàn)結(jié)果表明,υσ uble speedy Q-learning算法在迭代初期的收斂速度快于 Speedy aearning算法,且其整體收斂速度明顯快于對(duì)比算法,其實(shí)際泙均獎(jiǎng)勵(lì)值和期望獎(jiǎng)勵(lì)值之間的差值最小。

下載該資料的人也在下載 下載該資料的人還在閱讀
更多 >

評(píng)論

查看更多

下載排行

本周

  1. 1山景DSP芯片AP8248A2數(shù)據(jù)手冊(cè)
  2. 1.06 MB  |  532次下載  |  免費(fèi)
  3. 2RK3399完整板原理圖(支持平板,盒子VR)
  4. 3.28 MB  |  339次下載  |  免費(fèi)
  5. 3TC358743XBG評(píng)估板參考手冊(cè)
  6. 1.36 MB  |  330次下載  |  免費(fèi)
  7. 4DFM軟件使用教程
  8. 0.84 MB  |  295次下載  |  免費(fèi)
  9. 5元宇宙深度解析—未來(lái)的未來(lái)-風(fēng)口還是泡沫
  10. 6.40 MB  |  227次下載  |  免費(fèi)
  11. 6迪文DGUS開發(fā)指南
  12. 31.67 MB  |  194次下載  |  免費(fèi)
  13. 7元宇宙底層硬件系列報(bào)告
  14. 13.42 MB  |  182次下載  |  免費(fèi)
  15. 8FP5207XR-G1中文應(yīng)用手冊(cè)
  16. 1.09 MB  |  178次下載  |  免費(fèi)

本月

  1. 1OrCAD10.5下載OrCAD10.5中文版軟件
  2. 0.00 MB  |  234315次下載  |  免費(fèi)
  3. 2555集成電路應(yīng)用800例(新編版)
  4. 0.00 MB  |  33566次下載  |  免費(fèi)
  5. 3接口電路圖大全
  6. 未知  |  30323次下載  |  免費(fèi)
  7. 4開關(guān)電源設(shè)計(jì)實(shí)例指南
  8. 未知  |  21549次下載  |  免費(fèi)
  9. 5電氣工程師手冊(cè)免費(fèi)下載(新編第二版pdf電子書)
  10. 0.00 MB  |  15349次下載  |  免費(fèi)
  11. 6數(shù)字電路基礎(chǔ)pdf(下載)
  12. 未知  |  13750次下載  |  免費(fèi)
  13. 7電子制作實(shí)例集錦 下載
  14. 未知  |  8113次下載  |  免費(fèi)
  15. 8《LED驅(qū)動(dòng)電路設(shè)計(jì)》 溫德爾著
  16. 0.00 MB  |  6656次下載  |  免費(fèi)

總榜

  1. 1matlab軟件下載入口
  2. 未知  |  935054次下載  |  免費(fèi)
  3. 2protel99se軟件下載(可英文版轉(zhuǎn)中文版)
  4. 78.1 MB  |  537798次下載  |  免費(fèi)
  5. 3MATLAB 7.1 下載 (含軟件介紹)
  6. 未知  |  420027次下載  |  免費(fèi)
  7. 4OrCAD10.5下載OrCAD10.5中文版軟件
  8. 0.00 MB  |  234315次下載  |  免費(fèi)
  9. 5Altium DXP2002下載入口
  10. 未知  |  233046次下載  |  免費(fèi)
  11. 6電路仿真軟件multisim 10.0免費(fèi)下載
  12. 340992  |  191187次下載  |  免費(fèi)
  13. 7十天學(xué)會(huì)AVR單片機(jī)與C語(yǔ)言視頻教程 下載
  14. 158M  |  183279次下載  |  免費(fèi)
  15. 8proe5.0野火版下載(中文版免費(fèi)下載)
  16. 未知  |  138040次下載  |  免費(fèi)