基于隨機博弈與禁忌搜索的網(wǎng)絡防御策略選取
發(fā)布時間:2021-11-26 19:53
網(wǎng)絡防御策略是決定網(wǎng)絡安全防護效果的關鍵因素,現(xiàn)有的網(wǎng)絡防御決策研究的是完全理性前提條件以及攻防效益函數(shù)參數(shù)選擇等方面,對實際網(wǎng)絡攻防中信息不對稱、法律懲戒等因素存在模型偏差,降低了策略的實用性與可靠性.結合實際問題,在有限理性的前置條件基礎上構建禁忌隨機博弈模型,引入了禁忌搜索方法對隨機博弈進行有限理性的分析,并設計具有記憶功能的搜索方法,通過禁忌表數(shù)據(jù)結構實現(xiàn)記憶功能,并利用數(shù)據(jù)驅動的記憶結合博弈模型得出最優(yōu)防御策略.實驗結果表明:該方法在攻防收益量化方面提高了精準度,防御效益相對于現(xiàn)有典型的方法提高了準確度,方法空間復雜度優(yōu)于強化學習等典型方法.
【文章來源】:計算機研究與發(fā)展. 2020,57(04)北大核心EICSCD
【文章頁數(shù)】:11 頁
【部分圖文】:
攻防過程
本文從時間片的角度考慮網(wǎng)絡攻防過程,每個時間片是一個網(wǎng)絡安全狀態(tài),并將其作為博弈狀態(tài)集合.某時刻T網(wǎng)絡安全狀態(tài)反映的是當前時刻T網(wǎng)絡的脆弱性信息、節(jié)點服務信息、節(jié)點訪問權限等.而攻防雙方采取的動作會影響這些信息的改變,進而使得網(wǎng)絡安全狀態(tài)發(fā)生轉變.依據(jù)圖1的攻防過程可以將攻防博弈狀態(tài)用如圖2所示的有向圖G=(S,E)來表示,其中S表示攻防過程中的博弈狀態(tài)集合,E表示攻防狀態(tài)轉換關系且用有向邊來表示.圖2中S={S1,S2,S3}表示博弈過程的3個狀態(tài),這3個狀態(tài)可以轉換.在實際的網(wǎng)絡環(huán)境中,每個狀態(tài)之間不一定可以轉換,導致狀態(tài)的難以確定,因此本文對于狀態(tài)的考慮是從時間片去考慮每個狀態(tài)相對于彼此都是獨立的,這是因為時間片不同的關系導致其狀態(tài)的不同,這樣對于狀態(tài)的考慮就可以對于每個時間片的狀態(tài)進行最優(yōu)策略選取,使得防御效益最大化.1.2 攻防收益量化
算法1對于策略優(yōu)劣的評判是對每一個不同策略的效益值與禁忌表中的最優(yōu)進行比較,算法1的空間復雜度主要在于對禁忌表、πd以及防御收益DR的存儲,|S|為狀態(tài)數(shù),|D|為每個狀態(tài)防御者的策略數(shù),禁忌表中存儲著策略以及相應的效益值,本文中將禁忌表的長度設定為10可知,算法1的空間復雜度為O(2|S||D|+20),本文對于禁忌搜索方法操作的主要過程有獲取初始解、鄰域的生成、對禁忌表進行判斷以及解除禁忌表,這些操作的時間復雜度依次為n2,C n 2 ,n×l,n×l,這里n為問題規(guī)模,l為禁忌表長度,因此可知算法1的時間復雜度為O(n2+n×l).禁忌搜索方法為了避免陷入局部最優(yōu)解,采用了一種靈活的“記憶”技術即禁忌表來對目前最優(yōu)的解進行記錄和選擇,并指導下一步的搜索方向是一種全局逐步尋優(yōu)方法[14].因此,禁忌搜索不會陷入局部最優(yōu).在本文所提禁忌搜索中,最終所得到的策略即是全局搜索的最優(yōu)均衡策略,因為每次將所得策略往禁忌表中添加時都會將現(xiàn)在策略與禁忌表中的策略進行比較,使得禁忌表中的策略永遠是“best so far”狀態(tài),然后只需在禁忌表中選取最優(yōu)的策略即可獲取最優(yōu)均衡策略,并且禁忌搜索方法的引入會使得對博弈求均衡解變得更加便捷.
【參考文獻】:
期刊論文
[1]基于非零和博弈的多路徑組合攻擊防御決策方法[J]. 孫騫,高嶺,劉濤,姚軍,鄭杰,王海. 西北大學學報(自然科學版). 2019(03)
[2]基于隨機博弈與改進WoLF-PHC的網(wǎng)絡防御決策方法[J]. 楊峻楠,張紅旗,張傳富. 計算機研究與發(fā)展. 2019(05)
[3]基于不完全信息隨機博弈與Q-learning的防御決策方法[J]. 張紅旗,楊峻楠,張傳富. 通信學報. 2018(08)
[4]遺傳禁忌搜索算法收斂性和時間復雜度分析[J]. 牟乃夏,徐玉靜,李潔,張靈先. 河南理工大學學報(自然科學版). 2018(04)
[5]基于改進復制動態(tài)演化博弈模型的最優(yōu)防御策略選取[J]. 黃健明,張恒巍. 通信學報. 2018(01)
[6]基于多階段攻防信號博弈的最優(yōu)主動防御[J]. 張恒巍,李濤. 電子學報. 2017(02)
[7]模塊化動態(tài)博弈的網(wǎng)絡可生存性態(tài)勢跟蹤方法[J]. 伍文,孟相如,馬志強,陳鐸龍. 西安交通大學學報. 2012(12)
[8]基于非合作動態(tài)博弈的網(wǎng)絡安全主動防御技術研究[J]. 林旺群,王慧,劉家紅,鄧鐳,李愛平,吳泉源,賈焰. 計算機研究與發(fā)展. 2011(02)
[9]基于攻防隨機博弈模型的防御策略選取研究[J]. 姜偉,方濱興,田志宏,張宏莉. 計算機研究與發(fā)展. 2010(10)
[10]基于隨機博弈模型的網(wǎng)絡攻防量化分析方法[J]. 王元卓,林闖,程學旗,方濱興. 計算機學報. 2010(09)
本文編號:3520819
【文章來源】:計算機研究與發(fā)展. 2020,57(04)北大核心EICSCD
【文章頁數(shù)】:11 頁
【部分圖文】:
攻防過程
本文從時間片的角度考慮網(wǎng)絡攻防過程,每個時間片是一個網(wǎng)絡安全狀態(tài),并將其作為博弈狀態(tài)集合.某時刻T網(wǎng)絡安全狀態(tài)反映的是當前時刻T網(wǎng)絡的脆弱性信息、節(jié)點服務信息、節(jié)點訪問權限等.而攻防雙方采取的動作會影響這些信息的改變,進而使得網(wǎng)絡安全狀態(tài)發(fā)生轉變.依據(jù)圖1的攻防過程可以將攻防博弈狀態(tài)用如圖2所示的有向圖G=(S,E)來表示,其中S表示攻防過程中的博弈狀態(tài)集合,E表示攻防狀態(tài)轉換關系且用有向邊來表示.圖2中S={S1,S2,S3}表示博弈過程的3個狀態(tài),這3個狀態(tài)可以轉換.在實際的網(wǎng)絡環(huán)境中,每個狀態(tài)之間不一定可以轉換,導致狀態(tài)的難以確定,因此本文對于狀態(tài)的考慮是從時間片去考慮每個狀態(tài)相對于彼此都是獨立的,這是因為時間片不同的關系導致其狀態(tài)的不同,這樣對于狀態(tài)的考慮就可以對于每個時間片的狀態(tài)進行最優(yōu)策略選取,使得防御效益最大化.1.2 攻防收益量化
算法1對于策略優(yōu)劣的評判是對每一個不同策略的效益值與禁忌表中的最優(yōu)進行比較,算法1的空間復雜度主要在于對禁忌表、πd以及防御收益DR的存儲,|S|為狀態(tài)數(shù),|D|為每個狀態(tài)防御者的策略數(shù),禁忌表中存儲著策略以及相應的效益值,本文中將禁忌表的長度設定為10可知,算法1的空間復雜度為O(2|S||D|+20),本文對于禁忌搜索方法操作的主要過程有獲取初始解、鄰域的生成、對禁忌表進行判斷以及解除禁忌表,這些操作的時間復雜度依次為n2,C n 2 ,n×l,n×l,這里n為問題規(guī)模,l為禁忌表長度,因此可知算法1的時間復雜度為O(n2+n×l).禁忌搜索方法為了避免陷入局部最優(yōu)解,采用了一種靈活的“記憶”技術即禁忌表來對目前最優(yōu)的解進行記錄和選擇,并指導下一步的搜索方向是一種全局逐步尋優(yōu)方法[14].因此,禁忌搜索不會陷入局部最優(yōu).在本文所提禁忌搜索中,最終所得到的策略即是全局搜索的最優(yōu)均衡策略,因為每次將所得策略往禁忌表中添加時都會將現(xiàn)在策略與禁忌表中的策略進行比較,使得禁忌表中的策略永遠是“best so far”狀態(tài),然后只需在禁忌表中選取最優(yōu)的策略即可獲取最優(yōu)均衡策略,并且禁忌搜索方法的引入會使得對博弈求均衡解變得更加便捷.
【參考文獻】:
期刊論文
[1]基于非零和博弈的多路徑組合攻擊防御決策方法[J]. 孫騫,高嶺,劉濤,姚軍,鄭杰,王海. 西北大學學報(自然科學版). 2019(03)
[2]基于隨機博弈與改進WoLF-PHC的網(wǎng)絡防御決策方法[J]. 楊峻楠,張紅旗,張傳富. 計算機研究與發(fā)展. 2019(05)
[3]基于不完全信息隨機博弈與Q-learning的防御決策方法[J]. 張紅旗,楊峻楠,張傳富. 通信學報. 2018(08)
[4]遺傳禁忌搜索算法收斂性和時間復雜度分析[J]. 牟乃夏,徐玉靜,李潔,張靈先. 河南理工大學學報(自然科學版). 2018(04)
[5]基于改進復制動態(tài)演化博弈模型的最優(yōu)防御策略選取[J]. 黃健明,張恒巍. 通信學報. 2018(01)
[6]基于多階段攻防信號博弈的最優(yōu)主動防御[J]. 張恒巍,李濤. 電子學報. 2017(02)
[7]模塊化動態(tài)博弈的網(wǎng)絡可生存性態(tài)勢跟蹤方法[J]. 伍文,孟相如,馬志強,陳鐸龍. 西安交通大學學報. 2012(12)
[8]基于非合作動態(tài)博弈的網(wǎng)絡安全主動防御技術研究[J]. 林旺群,王慧,劉家紅,鄧鐳,李愛平,吳泉源,賈焰. 計算機研究與發(fā)展. 2011(02)
[9]基于攻防隨機博弈模型的防御策略選取研究[J]. 姜偉,方濱興,田志宏,張宏莉. 計算機研究與發(fā)展. 2010(10)
[10]基于隨機博弈模型的網(wǎng)絡攻防量化分析方法[J]. 王元卓,林闖,程學旗,方濱興. 計算機學報. 2010(09)
本文編號:3520819
本文鏈接:http://www.sikaile.net/kejilunwen/sousuoyinqinglunwen/3520819.html
最近更新
教材專著