天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 搜索引擎論文 >

深度強(qiáng)化學(xué)習(xí)在室內(nèi)無(wú)人機(jī)目標(biāo)搜索中的應(yīng)用

發(fā)布時(shí)間:2023-04-18 20:47
  針對(duì)室內(nèi)無(wú)人機(jī)隨機(jī)目標(biāo)搜索效率不高、準(zhǔn)確率低等問(wèn)題,提出了一種基于空間位置標(biāo)注的好奇心驅(qū)動(dòng)的深度強(qiáng)化學(xué)習(xí)方法。用正六邊形對(duì)探索空間進(jìn)行區(qū)域劃分,并標(biāo)記無(wú)人機(jī)在各區(qū)域的訪問(wèn)次數(shù),將其作為好奇心,產(chǎn)生內(nèi)部獎(jiǎng)勵(lì),以鼓勵(lì)無(wú)人機(jī)不斷探索新領(lǐng)域,有效避免其陷入到局部區(qū)域;訓(xùn)練時(shí)采用近端策略優(yōu)化算法(PPO)優(yōu)化神經(jīng)網(wǎng)絡(luò)參數(shù),該算法能使無(wú)人機(jī)更快找到最優(yōu)搜索策略,較好躲避障礙物,有效縮短訓(xùn)練周期,提升搜索效率和準(zhǔn)確率。

【文章頁(yè)數(shù)】:5 頁(yè)

【文章目錄】:
1 引言
2 仿真環(huán)境和任務(wù)介紹
3 基于深度強(qiáng)化學(xué)習(xí)的室內(nèi)無(wú)人機(jī)目標(biāo)搜索
    3.1 PPO算法
    3.2 好奇心驅(qū)動(dòng)模型
    3.3 基于空間位置標(biāo)注的好奇心驅(qū)動(dòng)方法
4 仿真實(shí)例
    4.1 Agent狀態(tài)空間及獎(jiǎng)勵(lì)規(guī)則設(shè)置
    4.2 實(shí)驗(yàn)結(jié)果及分析
5 結(jié)束語(yǔ)



本文編號(hào):3793007

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/3793007.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶1d443***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com