強化學(xué)習(xí)算法在雷達智能抗干擾中的應(yīng)用
發(fā)布時間:2020-12-22 22:46
雷達在工作過程中所應(yīng)對的干擾場景復(fù)雜且多變,所具有的反干擾措施難以窮舉。人工設(shè)計的反干擾流程與抑制策略在面對這些對抗場景時,由于受限于專家的經(jīng)驗知識,其反干擾性能難以保證。對此,文中從雷達抗干擾的應(yīng)用需求出發(fā),通過引入強化學(xué)習(xí)方法,提出一種基于強化學(xué)習(xí)模型的智能抗干擾方法。分別利用Q學(xué)習(xí)與Sarsa兩種典型的強化學(xué)習(xí)算法對反干擾模型中的值函數(shù)進行了計算并迭代,使得反干擾策略具備了自主更新與優(yōu)化功能。仿真結(jié)果表明,強化學(xué)習(xí)算法在訓(xùn)練過程中能夠收斂并實現(xiàn)反干擾策略的優(yōu)化。相比于傳統(tǒng)的反干擾設(shè)計手段,雷達反干擾的智能化程度得到了有效提升。
【文章來源】:現(xiàn)代雷達. 2020年03期 北大核心
【文章頁數(shù)】:6 頁
【部分圖文】:
強化學(xué)習(xí)模型原理框圖
圖2為智能反干擾強化學(xué)習(xí)模型訓(xùn)練過程示意圖,圖2由雷達常規(guī)信號處理部分與反干擾強化學(xué)習(xí)的訓(xùn)練部分組成。常規(guī)信號處理部分包括DBF與脈沖壓縮等過程。訓(xùn)練部分包括干擾狀態(tài)集合、雷達智能體(圖2中虛線框部分,包含用于值函數(shù)迭代的訓(xùn)練算法以及用于存儲值函數(shù)結(jié)果的知識庫)、策略更新(采用ε-貪婪策略,即雷達以知識庫為依據(jù),以1-ε的概率選擇當前值函數(shù)最大的反干擾措施,以ε的概率隨機選擇反干擾措施。訓(xùn)練通過對參數(shù)ε進行衰減從而完成策略的更新)、反干擾措施集合。圖2中的模型訓(xùn)練過程描述如下:
針對上一節(jié)給出的干擾場景與反干擾措施集合,圖4給出了人工設(shè)計反干擾策略的過程示意圖。若不考慮各反干擾措施間組合方式的合理性,圖4中的措施之間共具有C 4 1 +C 4 2 +C 4 3 +C 4 4 =10種排列組合方式,這些不同組合方式即對應(yīng)著不同的反干擾策略。上述反干擾策略需要經(jīng)過人工經(jīng)驗知識的判斷以實現(xiàn)優(yōu)化選擇,策略優(yōu)化過程的智能化程度不足,并且所設(shè)計出的反干擾策略的性能可能是次優(yōu)的。圖4 人工設(shè)計反干擾策略過程示意圖
【參考文獻】:
期刊論文
[1]基于Q-學(xué)習(xí)的智能雷達對抗[J]. 邢強,賈鑫,朱衛(wèi)綱. 系統(tǒng)工程與電子技術(shù). 2018(05)
[2]基于Q-學(xué)習(xí)算法的認知雷達對抗過程設(shè)計[J]. 李云杰,朱云鵬,高梅國. 北京理工大學(xué)學(xué)報. 2015(11)
[3]雷達智能抗干擾體系研究[J]. 王峰,雷志勇,黃桂根,陳慶,麻清華. 現(xiàn)代雷達. 2014(01)
[4]基于稀疏矩陣計算的外輻射源多徑雜波抑制算法[J]. 王峰,傅有光,李明. 現(xiàn)代雷達. 2011(11)
本文編號:2932575
【文章來源】:現(xiàn)代雷達. 2020年03期 北大核心
【文章頁數(shù)】:6 頁
【部分圖文】:
強化學(xué)習(xí)模型原理框圖
圖2為智能反干擾強化學(xué)習(xí)模型訓(xùn)練過程示意圖,圖2由雷達常規(guī)信號處理部分與反干擾強化學(xué)習(xí)的訓(xùn)練部分組成。常規(guī)信號處理部分包括DBF與脈沖壓縮等過程。訓(xùn)練部分包括干擾狀態(tài)集合、雷達智能體(圖2中虛線框部分,包含用于值函數(shù)迭代的訓(xùn)練算法以及用于存儲值函數(shù)結(jié)果的知識庫)、策略更新(采用ε-貪婪策略,即雷達以知識庫為依據(jù),以1-ε的概率選擇當前值函數(shù)最大的反干擾措施,以ε的概率隨機選擇反干擾措施。訓(xùn)練通過對參數(shù)ε進行衰減從而完成策略的更新)、反干擾措施集合。圖2中的模型訓(xùn)練過程描述如下:
針對上一節(jié)給出的干擾場景與反干擾措施集合,圖4給出了人工設(shè)計反干擾策略的過程示意圖。若不考慮各反干擾措施間組合方式的合理性,圖4中的措施之間共具有C 4 1 +C 4 2 +C 4 3 +C 4 4 =10種排列組合方式,這些不同組合方式即對應(yīng)著不同的反干擾策略。上述反干擾策略需要經(jīng)過人工經(jīng)驗知識的判斷以實現(xiàn)優(yōu)化選擇,策略優(yōu)化過程的智能化程度不足,并且所設(shè)計出的反干擾策略的性能可能是次優(yōu)的。圖4 人工設(shè)計反干擾策略過程示意圖
【參考文獻】:
期刊論文
[1]基于Q-學(xué)習(xí)的智能雷達對抗[J]. 邢強,賈鑫,朱衛(wèi)綱. 系統(tǒng)工程與電子技術(shù). 2018(05)
[2]基于Q-學(xué)習(xí)算法的認知雷達對抗過程設(shè)計[J]. 李云杰,朱云鵬,高梅國. 北京理工大學(xué)學(xué)報. 2015(11)
[3]雷達智能抗干擾體系研究[J]. 王峰,雷志勇,黃桂根,陳慶,麻清華. 現(xiàn)代雷達. 2014(01)
[4]基于稀疏矩陣計算的外輻射源多徑雜波抑制算法[J]. 王峰,傅有光,李明. 現(xiàn)代雷達. 2011(11)
本文編號:2932575
本文鏈接:http://sikaile.net/kejilunwen/wltx/2932575.html
最近更新
教材專著