強(qiáng)化學(xué)習(xí)算法在雷達(dá)智能抗干擾中的應(yīng)用
發(fā)布時(shí)間:2020-12-22 22:46
雷達(dá)在工作過(guò)程中所應(yīng)對(duì)的干擾場(chǎng)景復(fù)雜且多變,所具有的反干擾措施難以窮舉。人工設(shè)計(jì)的反干擾流程與抑制策略在面對(duì)這些對(duì)抗場(chǎng)景時(shí),由于受限于專家的經(jīng)驗(yàn)知識(shí),其反干擾性能難以保證。對(duì)此,文中從雷達(dá)抗干擾的應(yīng)用需求出發(fā),通過(guò)引入強(qiáng)化學(xué)習(xí)方法,提出一種基于強(qiáng)化學(xué)習(xí)模型的智能抗干擾方法。分別利用Q學(xué)習(xí)與Sarsa兩種典型的強(qiáng)化學(xué)習(xí)算法對(duì)反干擾模型中的值函數(shù)進(jìn)行了計(jì)算并迭代,使得反干擾策略具備了自主更新與優(yōu)化功能。仿真結(jié)果表明,強(qiáng)化學(xué)習(xí)算法在訓(xùn)練過(guò)程中能夠收斂并實(shí)現(xiàn)反干擾策略的優(yōu)化。相比于傳統(tǒng)的反干擾設(shè)計(jì)手段,雷達(dá)反干擾的智能化程度得到了有效提升。
【文章來(lái)源】:現(xiàn)代雷達(dá). 2020年03期 北大核心
【文章頁(yè)數(shù)】:6 頁(yè)
【部分圖文】:
強(qiáng)化學(xué)習(xí)模型原理框圖
圖2為智能反干擾強(qiáng)化學(xué)習(xí)模型訓(xùn)練過(guò)程示意圖,圖2由雷達(dá)常規(guī)信號(hào)處理部分與反干擾強(qiáng)化學(xué)習(xí)的訓(xùn)練部分組成。常規(guī)信號(hào)處理部分包括DBF與脈沖壓縮等過(guò)程。訓(xùn)練部分包括干擾狀態(tài)集合、雷達(dá)智能體(圖2中虛線框部分,包含用于值函數(shù)迭代的訓(xùn)練算法以及用于存儲(chǔ)值函數(shù)結(jié)果的知識(shí)庫(kù))、策略更新(采用ε-貪婪策略,即雷達(dá)以知識(shí)庫(kù)為依據(jù),以1-ε的概率選擇當(dāng)前值函數(shù)最大的反干擾措施,以ε的概率隨機(jī)選擇反干擾措施。訓(xùn)練通過(guò)對(duì)參數(shù)ε進(jìn)行衰減從而完成策略的更新)、反干擾措施集合。圖2中的模型訓(xùn)練過(guò)程描述如下:
針對(duì)上一節(jié)給出的干擾場(chǎng)景與反干擾措施集合,圖4給出了人工設(shè)計(jì)反干擾策略的過(guò)程示意圖。若不考慮各反干擾措施間組合方式的合理性,圖4中的措施之間共具有C 4 1 +C 4 2 +C 4 3 +C 4 4 =10種排列組合方式,這些不同組合方式即對(duì)應(yīng)著不同的反干擾策略。上述反干擾策略需要經(jīng)過(guò)人工經(jīng)驗(yàn)知識(shí)的判斷以實(shí)現(xiàn)優(yōu)化選擇,策略優(yōu)化過(guò)程的智能化程度不足,并且所設(shè)計(jì)出的反干擾策略的性能可能是次優(yōu)的。圖4 人工設(shè)計(jì)反干擾策略過(guò)程示意圖
【參考文獻(xiàn)】:
期刊論文
[1]基于Q-學(xué)習(xí)的智能雷達(dá)對(duì)抗[J]. 邢強(qiáng),賈鑫,朱衛(wèi)綱. 系統(tǒng)工程與電子技術(shù). 2018(05)
[2]基于Q-學(xué)習(xí)算法的認(rèn)知雷達(dá)對(duì)抗過(guò)程設(shè)計(jì)[J]. 李云杰,朱云鵬,高梅國(guó). 北京理工大學(xué)學(xué)報(bào). 2015(11)
[3]雷達(dá)智能抗干擾體系研究[J]. 王峰,雷志勇,黃桂根,陳慶,麻清華. 現(xiàn)代雷達(dá). 2014(01)
[4]基于稀疏矩陣計(jì)算的外輻射源多徑雜波抑制算法[J]. 王峰,傅有光,李明. 現(xiàn)代雷達(dá). 2011(11)
本文編號(hào):2932575
【文章來(lái)源】:現(xiàn)代雷達(dá). 2020年03期 北大核心
【文章頁(yè)數(shù)】:6 頁(yè)
【部分圖文】:
強(qiáng)化學(xué)習(xí)模型原理框圖
圖2為智能反干擾強(qiáng)化學(xué)習(xí)模型訓(xùn)練過(guò)程示意圖,圖2由雷達(dá)常規(guī)信號(hào)處理部分與反干擾強(qiáng)化學(xué)習(xí)的訓(xùn)練部分組成。常規(guī)信號(hào)處理部分包括DBF與脈沖壓縮等過(guò)程。訓(xùn)練部分包括干擾狀態(tài)集合、雷達(dá)智能體(圖2中虛線框部分,包含用于值函數(shù)迭代的訓(xùn)練算法以及用于存儲(chǔ)值函數(shù)結(jié)果的知識(shí)庫(kù))、策略更新(采用ε-貪婪策略,即雷達(dá)以知識(shí)庫(kù)為依據(jù),以1-ε的概率選擇當(dāng)前值函數(shù)最大的反干擾措施,以ε的概率隨機(jī)選擇反干擾措施。訓(xùn)練通過(guò)對(duì)參數(shù)ε進(jìn)行衰減從而完成策略的更新)、反干擾措施集合。圖2中的模型訓(xùn)練過(guò)程描述如下:
針對(duì)上一節(jié)給出的干擾場(chǎng)景與反干擾措施集合,圖4給出了人工設(shè)計(jì)反干擾策略的過(guò)程示意圖。若不考慮各反干擾措施間組合方式的合理性,圖4中的措施之間共具有C 4 1 +C 4 2 +C 4 3 +C 4 4 =10種排列組合方式,這些不同組合方式即對(duì)應(yīng)著不同的反干擾策略。上述反干擾策略需要經(jīng)過(guò)人工經(jīng)驗(yàn)知識(shí)的判斷以實(shí)現(xiàn)優(yōu)化選擇,策略優(yōu)化過(guò)程的智能化程度不足,并且所設(shè)計(jì)出的反干擾策略的性能可能是次優(yōu)的。圖4 人工設(shè)計(jì)反干擾策略過(guò)程示意圖
【參考文獻(xiàn)】:
期刊論文
[1]基于Q-學(xué)習(xí)的智能雷達(dá)對(duì)抗[J]. 邢強(qiáng),賈鑫,朱衛(wèi)綱. 系統(tǒng)工程與電子技術(shù). 2018(05)
[2]基于Q-學(xué)習(xí)算法的認(rèn)知雷達(dá)對(duì)抗過(guò)程設(shè)計(jì)[J]. 李云杰,朱云鵬,高梅國(guó). 北京理工大學(xué)學(xué)報(bào). 2015(11)
[3]雷達(dá)智能抗干擾體系研究[J]. 王峰,雷志勇,黃桂根,陳慶,麻清華. 現(xiàn)代雷達(dá). 2014(01)
[4]基于稀疏矩陣計(jì)算的外輻射源多徑雜波抑制算法[J]. 王峰,傅有光,李明. 現(xiàn)代雷達(dá). 2011(11)
本文編號(hào):2932575
本文鏈接:http://www.sikaile.net/kejilunwen/wltx/2932575.html
最近更新
教材專著