基于深度強(qiáng)化學(xué)習(xí)的彈道導(dǎo)彈中段突防控制
發(fā)布時(shí)間:2021-06-13 16:22
提出了一種基于Markov決策過(guò)程的彈道導(dǎo)彈中段突防控制模型,并基于狀態(tài)-動(dòng)作對(duì)值函數(shù)建立了一種完全數(shù)據(jù)驅(qū)動(dòng)的控制模型。為了加快深度神經(jīng)網(wǎng)絡(luò)的收斂速度、增強(qiáng)訓(xùn)練過(guò)程中的穩(wěn)定性,引入了競(jìng)爭(zhēng)架構(gòu)和目標(biāo)網(wǎng)絡(luò)架構(gòu),設(shè)計(jì)了一種深度神經(jīng)網(wǎng)絡(luò)架構(gòu)競(jìng)爭(zhēng)雙深度Q網(wǎng)絡(luò)(D3Q)。對(duì)傳統(tǒng)深度Q網(wǎng)絡(luò)(DQN)的強(qiáng)化學(xué)習(xí)算法中的記憶池生成方法進(jìn)行了改進(jìn),提升了訓(xùn)練樣本質(zhì)量。訓(xùn)練及驗(yàn)證結(jié)果表明,該方法實(shí)現(xiàn)了D3Q網(wǎng)絡(luò)對(duì)彈道導(dǎo)彈中段突防最優(yōu)控制模型的逼近。
【文章來(lái)源】:指揮信息系統(tǒng)與技術(shù). 2020,11(04)
【文章頁(yè)數(shù)】:10 頁(yè)
【部分圖文】:
正則項(xiàng)隨訓(xùn)練步數(shù)變化
ECEF坐標(biāo)系中攻防雙方運(yùn)動(dòng)示意圖
結(jié)構(gòu)與損失函數(shù)計(jì)算流程
【參考文獻(xiàn)】:
期刊論文
[1]基于深度強(qiáng)化學(xué)習(xí)的有軌電車信號(hào)優(yōu)先控制[J]. 王云鵬,郭戈. 自動(dòng)化學(xué)報(bào). 2019(12)
[2]大氣層外多攔截器協(xié)同跟蹤與制導(dǎo)算法[J]. 張召,王恒,荊武興,高長(zhǎng)生. 宇航學(xué)報(bào). 2019(07)
[3]多約束多規(guī)避區(qū)全程彈道快速優(yōu)化方法[J]. 趙欣,秦偉偉,張顯煬,何兵,閆循良. 固體火箭技術(shù). 2019(02)
[4]基于“標(biāo)準(zhǔn)-3”動(dòng)能攔截彈的順軌攔截方法研究[J]. 黃梓宸,張雅聲,柴華,劉瑤. 計(jì)算機(jī)測(cè)量與控制. 2018(01)
[5]面向任務(wù)約束的航天器姿控系統(tǒng)在軌重構(gòu)算法[J]. 陳嘉文,程月華,姜斌,陸寧云,楊天社. 宇航學(xué)報(bào). 2017(09)
[6]基于自適應(yīng)動(dòng)態(tài)規(guī)劃的導(dǎo)彈制導(dǎo)律研究綜述[J]. 孫景亮,劉春生. 自動(dòng)化學(xué)報(bào). 2017(07)
[7]一種考慮禁飛圓約束的在線再入彈道規(guī)劃方法[J]. 王鵬,楊小龍,付維賢,李強(qiáng). 導(dǎo)彈與航天運(yùn)載技術(shù). 2016(02)
[8]基于微分對(duì)策的導(dǎo)彈智能機(jī)動(dòng)突防研究[J]. 鮮勇,田海鵬,王劍,史金倩. 飛行力學(xué). 2014(01)
[9]國(guó)外彈道導(dǎo)彈機(jī)動(dòng)突防策略淺析[J]. 方喜龍,劉新學(xué),張高瑜,王芳. 飛航導(dǎo)彈. 2011(12)
[10]基于微分對(duì)策的彈道導(dǎo)彈機(jī)動(dòng)突防研究[J]. 孫守明,湯國(guó)建,周伯昭. 彈箭與制導(dǎo)學(xué)報(bào). 2010(04)
本文編號(hào):3227881
【文章來(lái)源】:指揮信息系統(tǒng)與技術(shù). 2020,11(04)
【文章頁(yè)數(shù)】:10 頁(yè)
【部分圖文】:
正則項(xiàng)隨訓(xùn)練步數(shù)變化
ECEF坐標(biāo)系中攻防雙方運(yùn)動(dòng)示意圖
結(jié)構(gòu)與損失函數(shù)計(jì)算流程
【參考文獻(xiàn)】:
期刊論文
[1]基于深度強(qiáng)化學(xué)習(xí)的有軌電車信號(hào)優(yōu)先控制[J]. 王云鵬,郭戈. 自動(dòng)化學(xué)報(bào). 2019(12)
[2]大氣層外多攔截器協(xié)同跟蹤與制導(dǎo)算法[J]. 張召,王恒,荊武興,高長(zhǎng)生. 宇航學(xué)報(bào). 2019(07)
[3]多約束多規(guī)避區(qū)全程彈道快速優(yōu)化方法[J]. 趙欣,秦偉偉,張顯煬,何兵,閆循良. 固體火箭技術(shù). 2019(02)
[4]基于“標(biāo)準(zhǔn)-3”動(dòng)能攔截彈的順軌攔截方法研究[J]. 黃梓宸,張雅聲,柴華,劉瑤. 計(jì)算機(jī)測(cè)量與控制. 2018(01)
[5]面向任務(wù)約束的航天器姿控系統(tǒng)在軌重構(gòu)算法[J]. 陳嘉文,程月華,姜斌,陸寧云,楊天社. 宇航學(xué)報(bào). 2017(09)
[6]基于自適應(yīng)動(dòng)態(tài)規(guī)劃的導(dǎo)彈制導(dǎo)律研究綜述[J]. 孫景亮,劉春生. 自動(dòng)化學(xué)報(bào). 2017(07)
[7]一種考慮禁飛圓約束的在線再入彈道規(guī)劃方法[J]. 王鵬,楊小龍,付維賢,李強(qiáng). 導(dǎo)彈與航天運(yùn)載技術(shù). 2016(02)
[8]基于微分對(duì)策的導(dǎo)彈智能機(jī)動(dòng)突防研究[J]. 鮮勇,田海鵬,王劍,史金倩. 飛行力學(xué). 2014(01)
[9]國(guó)外彈道導(dǎo)彈機(jī)動(dòng)突防策略淺析[J]. 方喜龍,劉新學(xué),張高瑜,王芳. 飛航導(dǎo)彈. 2011(12)
[10]基于微分對(duì)策的彈道導(dǎo)彈機(jī)動(dòng)突防研究[J]. 孫守明,湯國(guó)建,周伯昭. 彈箭與制導(dǎo)學(xué)報(bào). 2010(04)
本文編號(hào):3227881
本文鏈接:http://sikaile.net/kejilunwen/jingguansheji/3227881.html
最近更新
教材專著