基于改進(jìn)DQN的復(fù)合模式在軌服務(wù)資源分配
發(fā)布時(shí)間:2021-12-23 23:20
針對(duì)開(kāi)展在軌服務(wù)前的資源分配非線(xiàn)性多目標(biāo)優(yōu)化問(wèn)題,構(gòu)建復(fù)合服務(wù)模式下的在軌資源分配模型,基于對(duì)DQN (Deep Q-Network)方法的收斂性和穩(wěn)定性改進(jìn),提出了一種在軌服務(wù)資源分配方法。該方法能夠應(yīng)對(duì)同時(shí)包含"一對(duì)多""多對(duì)一"的復(fù)合服務(wù)模式,并在滿(mǎn)足預(yù)期成功率的前提下優(yōu)先分配重要服務(wù)對(duì)象,兼顧資源分配綜合效益和總體能耗效率,達(dá)到了以期望成功率、較少資源投入盡快完成任務(wù)的綜合目標(biāo)。仿真實(shí)驗(yàn)表明,改進(jìn)DQN方法能夠在任務(wù)執(zhí)行前依據(jù)服務(wù)對(duì)象重要程度自主分配航天器資源,收斂速度快、訓(xùn)練誤差低,在分配效益和總體能耗的優(yōu)化方面具有明顯的比較優(yōu)勢(shì)。
【文章來(lái)源】:航空學(xué)報(bào). 2020,41(05)北大核心EICSCD
【文章頁(yè)數(shù)】:9 頁(yè)
【部分圖文】:
DQN收斂性和穩(wěn)定性改進(jìn)的網(wǎng)絡(luò)結(jié)構(gòu)TensorFlow表示
2種方法的獎(jiǎng)懲值對(duì)比
仿真運(yùn)算依托1.6 GHz、1.8 GHz雙核CPU、8GRAM計(jì)算硬件,運(yùn)用python語(yǔ)言PyCharm編譯環(huán)境進(jìn)行,各方法的耗時(shí)情況如圖2所示。其中,蟻群算法運(yùn)用全局搜索方式計(jì)算開(kāi)銷(xiāo)較大,不同的起始方向?qū)е逻\(yùn)算時(shí)間波動(dòng)大,平均耗時(shí)0.32s;遺傳算法沒(méi)能夠利用反饋信息訓(xùn)練時(shí)間相對(duì)較長(zhǎng),隨機(jī)交叉變異致使運(yùn)算時(shí)間波動(dòng)較大,平均耗時(shí)0.19s;改進(jìn)DQN方法運(yùn)用神經(jīng)網(wǎng)絡(luò)自主訓(xùn)練時(shí)間最短,探索與利用策略的使用致使運(yùn)算時(shí)間有小范圍波動(dòng),平均耗時(shí)0.06s。因此,本文所提方法充分發(fā)揮神經(jīng)網(wǎng)絡(luò)前向傳輸和反向訓(xùn)練的運(yùn)算優(yōu)勢(shì),利用強(qiáng)化學(xué)習(xí)試錯(cuò)獎(jiǎng)勵(lì)的決策機(jī)制,相比較運(yùn)算效率更高,也更適合本文所涉及的復(fù)合模式下的在軌資源分配問(wèn)題。3.3 求解分析
【參考文獻(xiàn)】:
期刊論文
[1]基于隨機(jī)森林強(qiáng)化學(xué)習(xí)的干擾智能決策方法研究[J]. 裴緒芳,陳學(xué)強(qiáng),呂麗剛,張雙義,劉松儀,汪西明. 通信技術(shù). 2019(09)
[2]基于深度強(qiáng)化學(xué)習(xí)的蜂窩網(wǎng)資源分配算法[J]. 廖曉閩,嚴(yán)少虎,石嘉,譚震宇,趙鐘靈,李贊. 通信學(xué)報(bào). 2019(02)
[3]一種以燃耗為優(yōu)化目標(biāo)的航天器在軌加注作業(yè)調(diào)度[J]. 譚迎龍,喬兵,朱嘯宇,靳永強(qiáng),張慶展. 載人航天. 2018(02)
[4]一種基于燃料站的可往返式在軌加注任務(wù)調(diào)度模型及優(yōu)化算法[J]. 朱嘯宇,喬兵,張慶展,靳永強(qiáng),譚迎龍. 工程科學(xué)與技術(shù). 2017(S2)
[5]Energy Efficiency Optimization for D2D Communications Based on SCA and GP Method[J]. Xiaozheng Gao,Hangcheng Han,Kai Yang,Jianping An. 中國(guó)通信. 2017(03)
[6]多在軌服務(wù)飛行器目標(biāo)分配問(wèn)題研究[J]. 肖海,劉新學(xué),舒健生,李亞雄. 計(jì)算機(jī)仿真. 2017(01)
[7]基于能量最優(yōu)的敏捷遙感衛(wèi)星在軌任務(wù)規(guī)劃[J]. 趙琳,王碩,郝勇,劉源. 航空學(xué)報(bào). 2017(06)
[8]航天器燃耗最優(yōu)軌道直接/間接混合法延拓求解[J]. 孟雅哲. 航空學(xué)報(bào). 2017(01)
[9]一種基于先期毀傷準(zhǔn)則的防空火力優(yōu)化分配[J]. 陳黎,王中許,武兆斌,汪渤. 航空學(xué)報(bào). 2014(09)
[10]實(shí)現(xiàn)無(wú)線(xiàn)傳輸能量效率最大化的功率控制新方法[J]. 趙慧,張學(xué),劉明,龔海剛,吳躍. 計(jì)算機(jī)應(yīng)用. 2013(02)
博士論文
[1]航天器在軌服務(wù)任務(wù)規(guī)劃技術(shù)研究[D]. 余婧.國(guó)防科學(xué)技術(shù)大學(xué) 2015
碩士論文
[1]航天器在軌服務(wù)作業(yè)模式及其調(diào)度算法研究[D]. 譚迎龍.南京航空航天大學(xué) 2018
[2]基于空間燃料站的圓軌道航天器在軌加注服務(wù)調(diào)度算法[D]. 朱嘯宇.南京航空航天大學(xué) 2017
本文編號(hào):3549378
【文章來(lái)源】:航空學(xué)報(bào). 2020,41(05)北大核心EICSCD
【文章頁(yè)數(shù)】:9 頁(yè)
【部分圖文】:
DQN收斂性和穩(wěn)定性改進(jìn)的網(wǎng)絡(luò)結(jié)構(gòu)TensorFlow表示
2種方法的獎(jiǎng)懲值對(duì)比
仿真運(yùn)算依托1.6 GHz、1.8 GHz雙核CPU、8GRAM計(jì)算硬件,運(yùn)用python語(yǔ)言PyCharm編譯環(huán)境進(jìn)行,各方法的耗時(shí)情況如圖2所示。其中,蟻群算法運(yùn)用全局搜索方式計(jì)算開(kāi)銷(xiāo)較大,不同的起始方向?qū)е逻\(yùn)算時(shí)間波動(dòng)大,平均耗時(shí)0.32s;遺傳算法沒(méi)能夠利用反饋信息訓(xùn)練時(shí)間相對(duì)較長(zhǎng),隨機(jī)交叉變異致使運(yùn)算時(shí)間波動(dòng)較大,平均耗時(shí)0.19s;改進(jìn)DQN方法運(yùn)用神經(jīng)網(wǎng)絡(luò)自主訓(xùn)練時(shí)間最短,探索與利用策略的使用致使運(yùn)算時(shí)間有小范圍波動(dòng),平均耗時(shí)0.06s。因此,本文所提方法充分發(fā)揮神經(jīng)網(wǎng)絡(luò)前向傳輸和反向訓(xùn)練的運(yùn)算優(yōu)勢(shì),利用強(qiáng)化學(xué)習(xí)試錯(cuò)獎(jiǎng)勵(lì)的決策機(jī)制,相比較運(yùn)算效率更高,也更適合本文所涉及的復(fù)合模式下的在軌資源分配問(wèn)題。3.3 求解分析
【參考文獻(xiàn)】:
期刊論文
[1]基于隨機(jī)森林強(qiáng)化學(xué)習(xí)的干擾智能決策方法研究[J]. 裴緒芳,陳學(xué)強(qiáng),呂麗剛,張雙義,劉松儀,汪西明. 通信技術(shù). 2019(09)
[2]基于深度強(qiáng)化學(xué)習(xí)的蜂窩網(wǎng)資源分配算法[J]. 廖曉閩,嚴(yán)少虎,石嘉,譚震宇,趙鐘靈,李贊. 通信學(xué)報(bào). 2019(02)
[3]一種以燃耗為優(yōu)化目標(biāo)的航天器在軌加注作業(yè)調(diào)度[J]. 譚迎龍,喬兵,朱嘯宇,靳永強(qiáng),張慶展. 載人航天. 2018(02)
[4]一種基于燃料站的可往返式在軌加注任務(wù)調(diào)度模型及優(yōu)化算法[J]. 朱嘯宇,喬兵,張慶展,靳永強(qiáng),譚迎龍. 工程科學(xué)與技術(shù). 2017(S2)
[5]Energy Efficiency Optimization for D2D Communications Based on SCA and GP Method[J]. Xiaozheng Gao,Hangcheng Han,Kai Yang,Jianping An. 中國(guó)通信. 2017(03)
[6]多在軌服務(wù)飛行器目標(biāo)分配問(wèn)題研究[J]. 肖海,劉新學(xué),舒健生,李亞雄. 計(jì)算機(jī)仿真. 2017(01)
[7]基于能量最優(yōu)的敏捷遙感衛(wèi)星在軌任務(wù)規(guī)劃[J]. 趙琳,王碩,郝勇,劉源. 航空學(xué)報(bào). 2017(06)
[8]航天器燃耗最優(yōu)軌道直接/間接混合法延拓求解[J]. 孟雅哲. 航空學(xué)報(bào). 2017(01)
[9]一種基于先期毀傷準(zhǔn)則的防空火力優(yōu)化分配[J]. 陳黎,王中許,武兆斌,汪渤. 航空學(xué)報(bào). 2014(09)
[10]實(shí)現(xiàn)無(wú)線(xiàn)傳輸能量效率最大化的功率控制新方法[J]. 趙慧,張學(xué),劉明,龔海剛,吳躍. 計(jì)算機(jī)應(yīng)用. 2013(02)
博士論文
[1]航天器在軌服務(wù)任務(wù)規(guī)劃技術(shù)研究[D]. 余婧.國(guó)防科學(xué)技術(shù)大學(xué) 2015
碩士論文
[1]航天器在軌服務(wù)作業(yè)模式及其調(diào)度算法研究[D]. 譚迎龍.南京航空航天大學(xué) 2018
[2]基于空間燃料站的圓軌道航天器在軌加注服務(wù)調(diào)度算法[D]. 朱嘯宇.南京航空航天大學(xué) 2017
本文編號(hào):3549378
本文鏈接:http://sikaile.net/kejilunwen/hangkongsky/3549378.html
最近更新
教材專(zhuān)著