天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 自動(dòng)化論文 >

基于深度強(qiáng)化學(xué)習(xí)的路徑規(guī)劃算法研究

發(fā)布時(shí)間:2023-03-11 05:18
  針對(duì)現(xiàn)有的路徑規(guī)劃算法效率低的問題,根據(jù)獎(jiǎng)勵(lì)函數(shù)和多層感知機(jī)提出一種基于深度強(qiáng)化學(xué)習(xí)的路徑規(guī)劃算法?紤]到環(huán)境的復(fù)雜程度,為了降低過擬合的概率,因此神經(jīng)網(wǎng)絡(luò)選擇較優(yōu)的動(dòng)作,提出以多層感知機(jī)為基礎(chǔ)的深度Q網(wǎng)絡(luò)算法(Deep Q-learning Network, DQN)。為了得到動(dòng)態(tài)的獎(jiǎng)勵(lì)值,該算法根據(jù)目標(biāo)的相關(guān)信息改進(jìn)獎(jiǎng)勵(lì)函數(shù),根據(jù)動(dòng)態(tài)的獎(jiǎng)勵(lì)值來區(qū)別不同動(dòng)作的價(jià)值,從而提升神經(jīng)網(wǎng)絡(luò)動(dòng)作選擇的效率。實(shí)驗(yàn)結(jié)果表明,該算法能夠用更少的探索步數(shù)使獎(jiǎng)勵(lì)值趨向平穩(wěn),并且找到較優(yōu)路徑。

【文章頁數(shù)】:7 頁

【文章目錄】:
0 引 言
1 相關(guān)工作
2 相關(guān)知識(shí)
    2.1 Q學(xué)習(xí)算法
        2.1.1 Q值表更新
        2.1.2 獎(jiǎng)勵(lì)函數(shù)
    2.2 深度Q網(wǎng)絡(luò)
        2.2.1 神經(jīng)網(wǎng)絡(luò)
        2.2.2 記憶回放機(jī)制
3 改進(jìn)DQN的路徑規(guī)劃算法
    3.1 DQN算法設(shè)計(jì)
        3.1.1 多層感知機(jī)
        3.1.2 獎(jiǎng)勵(lì)函數(shù)
        3.1.3 動(dòng)作選擇機(jī)制
    3.2 模型訓(xùn)練
4 實(shí)驗(yàn)仿真與分析
    4.1 實(shí)驗(yàn)場景
    4.2 實(shí)驗(yàn)參數(shù)
    4.3 實(shí)驗(yàn)結(jié)果
5 結(jié) 語



本文編號(hào):3759272

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3759272.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶38882***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com
色婷婷激情五月天丁香| 老熟女露脸一二三四区| 国产一级性生活录像片| 都市激情小说在线一区二区三区| 青青草草免费在线视频| 色一欲一性一乱—区二区三区| 欧美亚洲国产日韩一区二区| 日本中文在线不卡视频| 免费性欧美重口味黄色| 高清亚洲精品中文字幕乱码| 日本欧美视频在线观看免费| 久久久精品日韩欧美丰满| 色涩一区二区三区四区| 国产亚洲欧美自拍中文自拍| 久久精品福利在线观看| 日韩一级欧美一级久久| 黑鬼糟蹋少妇资源在线观看| 欧美野外在线刺激在线观看| 正在播放玩弄漂亮少妇高潮| 免费福利午夜在线观看| 五月婷婷六月丁香狠狠| 日本丰满大奶熟女一区二区| 久久精品免费视看国产成人| 亚洲中文字幕综合网在线| 欧美一区二区三区十区| 中文字幕无线码一区欧美| 日韩日韩日韩日韩在线| 亚洲永久一区二区三区在线| 亚洲欧美一二区日韩高清在线| 亚洲成人久久精品国产| 欧美中文字幕一区在线| 亚洲精品小视频在线观看| 成年人黄片大全在线观看| 久久中文字幕中文字幕中文| 亚洲性生活一区二区三区| 两性色午夜天堂免费视频| 国产户外勾引精品露出一区| 果冻传媒精选麻豆白晶晶| 国产精品视频一区麻豆专区| 儿媳妇的诱惑中文字幕| 麻豆视传媒短视频在线看|