強(qiáng)化學(xué)習(xí)方法在通信拒止戰(zhàn)場仿真環(huán)境中多無人機(jī)目標(biāo)搜尋問題上的適用性研究
發(fā)布時間:2022-02-14 03:35
目標(biāo)搜索問題是現(xiàn)實(shí)中一類常見的問題,如災(zāi)難現(xiàn)場搜救、戰(zhàn)場目標(biāo)偵察等.無人機(jī)由于其靈活性、低成本、可搭載各類傳感器并以集群形式開展協(xié)作等優(yōu)勢,是解決大范圍、高風(fēng)險區(qū)域目標(biāo)搜索問題的理想技術(shù)方案,當(dāng)前發(fā)展迅速.在戰(zhàn)場等復(fù)雜現(xiàn)實(shí)環(huán)境中,由于缺乏基礎(chǔ)通信設(shè)施及干擾的存在,無人機(jī)與地面指揮員、無人機(jī)之間難以快速、可靠通信,處于通信拒止?fàn)顟B(tài).因此,無人機(jī)難以獲得指揮員的實(shí)時控制信息,需要其具備自主、智能完成任務(wù)的能力并開展協(xié)同.隨著人工智能技術(shù)的快速發(fā)展,強(qiáng)化學(xué)習(xí)技術(shù)在解決連續(xù)決策問題上展現(xiàn)出了較強(qiáng)的潛力.無人機(jī)搜索問題作為一種典型的連續(xù)決策問題,屬于強(qiáng)化學(xué)習(xí)技術(shù)的適用范圍.但對于目前的強(qiáng)化學(xué)習(xí)及人工智能技術(shù)能否適用于無人機(jī)從而自主決策完成現(xiàn)實(shí)場景中的任務(wù)這一問題尚存爭議,仍有待進(jìn)一步探索.為此,本文以現(xiàn)實(shí)戰(zhàn)場環(huán)境為背景,對通信拒止及包含兩方對抗的戰(zhàn)場環(huán)境中的目標(biāo)搜尋問題進(jìn)行了建模,依據(jù)模型構(gòu)建了對抗仿真平臺,并通過實(shí)驗(yàn)研究的方式針對以下3個問題展開了探索:(1)強(qiáng)化學(xué)習(xí)在通信拒止環(huán)境下多無人機(jī)搜索問題的適用性;(2)各強(qiáng)化學(xué)習(xí)算法在該問題上的優(yōu)劣;(3)通信拒止程度對強(qiáng)化學(xué)習(xí)算法效果的影響.通過...
【文章來源】:中國科學(xué):信息科學(xué). 2020,50(03)北大核心CSCD
【文章頁數(shù)】:21 頁
【部分圖文】:
(網(wǎng)絡(luò)版彩圖)仿真環(huán)境
不同的算法完成任務(wù)時所需的探索時間是不同的,一般情況下,我們希望算法能夠盡可能快地完成任務(wù).因此,根據(jù)任務(wù)完成率MCR的定義,我們提出了平均成功時間來衡量算法完成目標(biāo)搜索任務(wù)的效率.這里的成功是指成功完成任務(wù),即一輪測試搜尋到兩個目標(biāo).若進(jìn)行N輪測試,其中有L輪成功完成任務(wù):其中為L輪成功完成任務(wù)的測試中,平均任務(wù)完成時間(mission complete time)的均值,MCTi為每輪測試成功完成任務(wù)所需探索時間.由第2.1小節(jié)可知,每輪測試無人機(jī)最大飛行時間為T,MCTi的取值范圍為MCTi∈[0,T],平均成功時間越小,則說明該算法完成目標(biāo)搜尋任務(wù)的效率越高該指標(biāo)可以幫助本文從算法性能角度回答RQ1和RQ2,同時作為分析RQ3影響程度的性能方面的評價指標(biāo).
RQ3實(shí)驗(yàn)結(jié)果
【參考文獻(xiàn)】:
期刊論文
[1]從狼群智能到無人機(jī)集群協(xié)同決策[J]. 段海濱,張岱峰,范彥銘,鄧亦敏. 中國科學(xué):信息科學(xué). 2019(01)
[2]DARPA拒止環(huán)境中協(xié)同作戰(zhàn)項(xiàng)目白軍網(wǎng)絡(luò)研究[J]. 李磊,王彤,胡勤蓮,蔣琪. 航天電子對抗. 2018(06)
[3]多無人機(jī)協(xié)同導(dǎo)航技術(shù)研究現(xiàn)狀及進(jìn)展[J]. 許曉偉,賴際舟,呂品,樊劉仡. 導(dǎo)航定位與授時. 2017(04)
[4]基于生物群集行為的無人機(jī)集群控制[J]. 段海濱,李沛. 科技導(dǎo)報. 2017(07)
[5]解析美海軍低成本無人機(jī)蜂群技術(shù)[J]. 陳晶. 飛航導(dǎo)彈. 2016(01)
[6]對GPS信號的干擾技術(shù)研究[J]. 武擁軍,張玉. 航天電子對抗. 2002(03)
本文編號:3624165
【文章來源】:中國科學(xué):信息科學(xué). 2020,50(03)北大核心CSCD
【文章頁數(shù)】:21 頁
【部分圖文】:
(網(wǎng)絡(luò)版彩圖)仿真環(huán)境
不同的算法完成任務(wù)時所需的探索時間是不同的,一般情況下,我們希望算法能夠盡可能快地完成任務(wù).因此,根據(jù)任務(wù)完成率MCR的定義,我們提出了平均成功時間來衡量算法完成目標(biāo)搜索任務(wù)的效率.這里的成功是指成功完成任務(wù),即一輪測試搜尋到兩個目標(biāo).若進(jìn)行N輪測試,其中有L輪成功完成任務(wù):其中為L輪成功完成任務(wù)的測試中,平均任務(wù)完成時間(mission complete time)的均值,MCTi為每輪測試成功完成任務(wù)所需探索時間.由第2.1小節(jié)可知,每輪測試無人機(jī)最大飛行時間為T,MCTi的取值范圍為MCTi∈[0,T],平均成功時間越小,則說明該算法完成目標(biāo)搜尋任務(wù)的效率越高該指標(biāo)可以幫助本文從算法性能角度回答RQ1和RQ2,同時作為分析RQ3影響程度的性能方面的評價指標(biāo).
RQ3實(shí)驗(yàn)結(jié)果
【參考文獻(xiàn)】:
期刊論文
[1]從狼群智能到無人機(jī)集群協(xié)同決策[J]. 段海濱,張岱峰,范彥銘,鄧亦敏. 中國科學(xué):信息科學(xué). 2019(01)
[2]DARPA拒止環(huán)境中協(xié)同作戰(zhàn)項(xiàng)目白軍網(wǎng)絡(luò)研究[J]. 李磊,王彤,胡勤蓮,蔣琪. 航天電子對抗. 2018(06)
[3]多無人機(jī)協(xié)同導(dǎo)航技術(shù)研究現(xiàn)狀及進(jìn)展[J]. 許曉偉,賴際舟,呂品,樊劉仡. 導(dǎo)航定位與授時. 2017(04)
[4]基于生物群集行為的無人機(jī)集群控制[J]. 段海濱,李沛. 科技導(dǎo)報. 2017(07)
[5]解析美海軍低成本無人機(jī)蜂群技術(shù)[J]. 陳晶. 飛航導(dǎo)彈. 2016(01)
[6]對GPS信號的干擾技術(shù)研究[J]. 武擁軍,張玉. 航天電子對抗. 2002(03)
本文編號:3624165
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/3624165.html
最近更新
教材專著