強化學(xué)習(xí)算法在雷達智能抗干擾中的應(yīng)用

發(fā)布時間：2020-12-22 22:46

　　雷達在工作過程中所應(yīng)對的干擾場景復(fù)雜且多變,所具有的反干擾措施難以窮舉。人工設(shè)計的反干擾流程與抑制策略在面對這些對抗場景時,由于受限于專家的經(jīng)驗知識,其反干擾性能難以保證。對此,文中從雷達抗干擾的應(yīng)用需求出發(fā),通過引入強化學(xué)習(xí)方法,提出一種基于強化學(xué)習(xí)模型的智能抗干擾方法。分別利用Q學(xué)習(xí)與Sarsa兩種典型的強化學(xué)習(xí)算法對反干擾模型中的值函數(shù)進行了計算并迭代,使得反干擾策略具備了自主更新與優(yōu)化功能。仿真結(jié)果表明,強化學(xué)習(xí)算法在訓(xùn)練過程中能夠收斂并實現(xiàn)反干擾策略的優(yōu)化。相比于傳統(tǒng)的反干擾設(shè)計手段,雷達反干擾的智能化程度得到了有效提升。

【文章來源】：現(xiàn)代雷達. 2020年03期北大核心

【文章頁數(shù)】：6 頁

【部分圖文】：

強化學(xué)習(xí)模型原理框圖

示意圖,智能,值函數(shù),模型

圖2為智能反干擾強化學(xué)習(xí)模型訓(xùn)練過程示意圖,圖2由雷達常規(guī)信號處理部分與反干擾強化學(xué)習(xí)的訓(xùn)練部分組成。常規(guī)信號處理部分包括DBF與脈沖壓縮等過程。訓(xùn)練部分包括干擾狀態(tài)集合、雷達智能體(圖2中虛線框部分,包含用于值函數(shù)迭代的訓(xùn)練算法以及用于存儲值函數(shù)結(jié)果的知識庫)、策略更新(采用ε-貪婪策略,即雷達以知識庫為依據(jù),以1-ε的概率選擇當前值函數(shù)最大的反干擾措施,以ε的概率隨機選擇反干擾措施。訓(xùn)練通過對參數(shù)ε進行衰減從而完成策略的更新)、反干擾措施集合。圖2中的模型訓(xùn)練過程描述如下:

示意圖,脈壓,時域,策略

針對上一節(jié)給出的干擾場景與反干擾措施集合,圖4給出了人工設(shè)計反干擾策略的過程示意圖。若不考慮各反干擾措施間組合方式的合理性,圖4中的措施之間共具有C 4 1 +C 4 2 +C 4 3 +C 4 4 =10種排列組合方式,這些不同組合方式即對應(yīng)著不同的反干擾策略。上述反干擾策略需要經(jīng)過人工經(jīng)驗知識的判斷以實現(xiàn)優(yōu)化選擇,策略優(yōu)化過程的智能化程度不足,并且所設(shè)計出的反干擾策略的性能可能是次優(yōu)的。圖4 人工設(shè)計反干擾策略過程示意圖

【參考文獻】：
期刊論文
[1]基于Q-學(xué)習(xí)的智能雷達對抗[J]. 邢強,賈鑫,朱衛(wèi)綱.  系統(tǒng)工程與電子技術(shù). 2018(05)
[2]基于Q-學(xué)習(xí)算法的認知雷達對抗過程設(shè)計[J]. 李云杰,朱云鵬,高梅國.  北京理工大學(xué)學(xué)報. 2015(11)
[3]雷達智能抗干擾體系研究[J]. 王峰,雷志勇,黃桂根,陳慶,麻清華.  現(xiàn)代雷達. 2014(01)
[4]基于稀疏矩陣計算的外輻射源多徑雜波抑制算法[J]. 王峰,傅有光,李明.  現(xiàn)代雷達. 2011(11)

本文編號：2932575

資料下載

論文發(fā)表

支付寶下載

Download by Alipay
微信下載

Download by Wechat
會員下載

Download by Member

本文鏈接：http://sikaile.net/kejilunwen/wltx/2932575.html

上一篇：基于OMAP的捷聯(lián)慣導(dǎo)系統(tǒng)硬件平臺研究與設(shè)計
下一篇：高通量衛(wèi)星及融合組網(wǎng)技術(shù)在自然保護地生物多樣性監(jiān)測領(lǐng)域的應(yīng)用研究

論文發(fā)表

·知網(wǎng)|萬方|維普|龍源|省級|國家級|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|

天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

強化學(xué)習(xí)算法在雷達智能抗干擾中的應(yīng)用