深度強(qiáng)化學(xué)習(xí)在作戰(zhàn)任務(wù)規(guī)劃中的應(yīng)用
發(fā)布時(shí)間:2021-10-23 11:36
針對(duì)軍事(戰(zhàn)術(shù)級(jí))作戰(zhàn)任務(wù)規(guī)劃面臨的戰(zhàn)場(chǎng)環(huán)境復(fù)雜、信息不完全、不確定性大、策略復(fù)雜度高等挑戰(zhàn),梳理了作戰(zhàn)任務(wù)規(guī)劃基本概念和流程框架,介紹了深度強(qiáng)化學(xué)習(xí)的基本原理和發(fā)展現(xiàn)狀,分析了深度強(qiáng)化學(xué)習(xí)在作戰(zhàn)任務(wù)規(guī)劃中場(chǎng)景識(shí)別、目標(biāo)檢測(cè)、行為判斷、威脅評(píng)估、路徑規(guī)劃、火力分配等方面的應(yīng)用,為作戰(zhàn)任務(wù)規(guī)劃的智能化發(fā)展提供了新的研究思路。
【文章來源】:飛航導(dǎo)彈. 2020,(04)北大核心
【文章頁數(shù)】:6 頁
【部分圖文】:
作戰(zhàn)任務(wù)規(guī)劃OODA循環(huán)
2016年,麻省理工大學(xué)計(jì)算機(jī)科學(xué)與人工智能實(shí)驗(yàn)室公開了場(chǎng)景數(shù)據(jù)集Places,包含百萬張不同場(chǎng)景圖片,同時(shí)用AlexNet、GoogleNet、VGGNet等深度網(wǎng)絡(luò)在該數(shù)據(jù)集上進(jìn)行訓(xùn)練,得到的模型顯著提高了場(chǎng)景識(shí)別的準(zhǔn)確率,并公開了網(wǎng)絡(luò)訓(xùn)練的模型參數(shù),可將這些網(wǎng)絡(luò)模型作為預(yù)訓(xùn)練模型在小樣本戰(zhàn)場(chǎng)場(chǎng)景數(shù)據(jù)集上進(jìn)行遷移學(xué)習(xí),找出輸出結(jié)果可用的層,用這些層的輸出作為輸入對(duì)網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行微調(diào),訓(xùn)練一個(gè)參數(shù)量更小、規(guī)模也更小的網(wǎng)絡(luò)模型,提高模型準(zhǔn)確率和魯棒性的同時(shí)縮短訓(xùn)練時(shí)長(zhǎng)。3.1.2 目標(biāo)檢測(cè)
本文從作戰(zhàn)任務(wù)規(guī)劃的概念和框架出發(fā),簡(jiǎn)要介紹了深度強(qiáng)化學(xué)習(xí)的原理和發(fā)展,分析了深度強(qiáng)化學(xué)習(xí)在作戰(zhàn)任務(wù)規(guī)劃中的應(yīng)用,為未來作戰(zhàn)任務(wù)規(guī)劃信息化、智能化發(fā)展提出了新的研究思路。1 作戰(zhàn)任務(wù)規(guī)劃框架
【參考文獻(xiàn)】:
期刊論文
[1]深度強(qiáng)化學(xué)習(xí)進(jìn)展:從AlphaGo到AlphaGo Zero[J]. 唐振韜,邵坤,趙冬斌,朱圓恒. 控制理論與應(yīng)用. 2017(12)
[2]深度強(qiáng)化學(xué)習(xí)綜述[J]. 劉全,翟建偉,章宗長(zhǎng),鐘珊,周倩,章鵬,徐進(jìn). 計(jì)算機(jī)學(xué)報(bào). 2018(01)
本文編號(hào):3453116
【文章來源】:飛航導(dǎo)彈. 2020,(04)北大核心
【文章頁數(shù)】:6 頁
【部分圖文】:
作戰(zhàn)任務(wù)規(guī)劃OODA循環(huán)
2016年,麻省理工大學(xué)計(jì)算機(jī)科學(xué)與人工智能實(shí)驗(yàn)室公開了場(chǎng)景數(shù)據(jù)集Places,包含百萬張不同場(chǎng)景圖片,同時(shí)用AlexNet、GoogleNet、VGGNet等深度網(wǎng)絡(luò)在該數(shù)據(jù)集上進(jìn)行訓(xùn)練,得到的模型顯著提高了場(chǎng)景識(shí)別的準(zhǔn)確率,并公開了網(wǎng)絡(luò)訓(xùn)練的模型參數(shù),可將這些網(wǎng)絡(luò)模型作為預(yù)訓(xùn)練模型在小樣本戰(zhàn)場(chǎng)場(chǎng)景數(shù)據(jù)集上進(jìn)行遷移學(xué)習(xí),找出輸出結(jié)果可用的層,用這些層的輸出作為輸入對(duì)網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行微調(diào),訓(xùn)練一個(gè)參數(shù)量更小、規(guī)模也更小的網(wǎng)絡(luò)模型,提高模型準(zhǔn)確率和魯棒性的同時(shí)縮短訓(xùn)練時(shí)長(zhǎng)。3.1.2 目標(biāo)檢測(cè)
本文從作戰(zhàn)任務(wù)規(guī)劃的概念和框架出發(fā),簡(jiǎn)要介紹了深度強(qiáng)化學(xué)習(xí)的原理和發(fā)展,分析了深度強(qiáng)化學(xué)習(xí)在作戰(zhàn)任務(wù)規(guī)劃中的應(yīng)用,為未來作戰(zhàn)任務(wù)規(guī)劃信息化、智能化發(fā)展提出了新的研究思路。1 作戰(zhàn)任務(wù)規(guī)劃框架
【參考文獻(xiàn)】:
期刊論文
[1]深度強(qiáng)化學(xué)習(xí)進(jìn)展:從AlphaGo到AlphaGo Zero[J]. 唐振韜,邵坤,趙冬斌,朱圓恒. 控制理論與應(yīng)用. 2017(12)
[2]深度強(qiáng)化學(xué)習(xí)綜述[J]. 劉全,翟建偉,章宗長(zhǎng),鐘珊,周倩,章鵬,徐進(jìn). 計(jì)算機(jī)學(xué)報(bào). 2018(01)
本文編號(hào):3453116
本文鏈接:http://sikaile.net/kejilunwen/jingguansheji/3453116.html
最近更新
教材專著