基于并行化混合粒子群算法的網(wǎng)絡入侵檢測技術研究
發(fā)布時間:2020-08-13 06:56
【摘要】:網(wǎng)絡入侵檢測技術是保障網(wǎng)絡安全的方法之一,在現(xiàn)有的各類網(wǎng)絡入侵檢測方法中,以基于機器學習算法的方法效果最為突出,即使用機器學習算法作為分類器來對相關數(shù)據(jù)進行歸類以檢測出入侵行為的方法。最小二乘支持向量機作為分類器具有檢測精度高、泛化能力好等優(yōu)點,而且相對于標準支持向量機,由于簡化了算法中待解決的問題,在計算效率上也有一定程度上的改進,但由于其分類性能很大程度上受到自身參數(shù)選擇的影響,因此如何更好的去選擇合適的參數(shù)成為提高該類方法檢測精度的關鍵。當前對于模型參數(shù)選擇的方法主要分為兩類,一類是基于人工后驗經(jīng)驗的選擇,該方法具有較強的主觀性,會由于研究人員在對待目標問題上相關經(jīng)驗的不同而導致選擇的參數(shù)對分類結果產(chǎn)生潛在的影響;另一類是基于智能優(yōu)化算法對分類器作參數(shù)尋優(yōu)的方法,但由于智能優(yōu)化算法自身存在的一些缺陷會導致參數(shù)尋優(yōu)精度欠佳,應用智能算法尋優(yōu)得到的參數(shù)后也會影響分類器的分類準確率,因此該類方法仍存在一定的改進。針對智能算法對分類器作參數(shù)尋優(yōu)的方法,本文在現(xiàn)有理論基礎之上首先結合反向學習理論提出了一種改進的綜合學習粒子群優(yōu)化算法,并通過改進后的算法對最小二乘支持向量機進行參數(shù)尋優(yōu),提出了一種改進的網(wǎng)絡入侵檢測模型。隨后,針對改進后的綜合學習粒子群算法中存在大量迭代、解決復雜問題時收斂時間較長的缺陷,結合目前已有的并行化模型,提出了一種改進的并行化混合粒子群算法。并行化混合粒子群算法分為整體種群和子群兩部分,整體種群中每個粒子又作為一個子群獨立進化。通過在整體種群中使用標準粒子群算法并且在子群中混入融合反向學習機制的綜合學習粒子群算法,可以有效減少算法進行參數(shù)尋優(yōu)的時間。此外,針對最小二乘支持向量機在處理多分類問題上需要構造多個相互獨立的二值分類器特性,結合改進的并行化混合粒子群算法,將網(wǎng)絡入侵檢測模型整體進行了并行化改進,在檢測效率和準確度方面都有所提高,同時在網(wǎng)絡入侵檢測的實時性方面也有所改進。本文實驗部分基于KDDCUP99數(shù)據(jù)集進行研究,首先通過人工篩選明顯無意義的特征維度,再通過PCA主元成分分析計算各個剩余特征維度的貢獻率,通過篩選累計貢獻率大于98%的特征進行主成分提取,從而達到特征選擇目的。模型的并行化實驗驗證主要借助于Spark分布式計算框架來實現(xiàn),通過相關實驗比較證明本文提出的模型具有較好的效果。
【學位授予單位】:上海師范大學
【學位級別】:碩士
【學位授予年份】:2019
【分類號】:TP393.08;TP18
【圖文】:
Anderson 在一份報告中首次提出了網(wǎng)絡入侵的相關概念[3],出所謂網(wǎng)絡入侵就是指連接在網(wǎng)絡中的某一臺主機遭到同處于該士的越權訪問,并且對主機上的文件進行篡改以導致主機無法網(wǎng)絡入侵行為的出現(xiàn)嚴重威脅著計算機網(wǎng)絡的信息安全,在這的相關概念誕生了,即通過收集相關特征信息來識別網(wǎng)絡入侵全目的的一種技術。近年來隨著互聯(lián)網(wǎng)的蓬勃發(fā)展、網(wǎng)絡安全侵檢測技術也有了巨大的突破。入侵檢測技術需要借助額外的現(xiàn),通過部署在區(qū)域網(wǎng)絡中的采集裝置來對原始網(wǎng)絡信息進行是網(wǎng)絡中主機的系統(tǒng)日志,也可以是網(wǎng)絡設備中進行數(shù)據(jù)包傳。通過對這些原始數(shù)據(jù)的分析、處理可以及時發(fā)現(xiàn)一些潛在的絡的平穩(wěn)安全運行。測基本步驟,網(wǎng)絡入侵檢測主要分為四個步驟,即原始網(wǎng)絡數(shù)據(jù)采集、數(shù)策響應,它們之間的關系可以參照圖 2-1 所示。
的表現(xiàn)形式: ( ) = ∑ ( , ) + (2-6)根據(jù) Mercer 條件,其中 ( , ) = j( ) × j( )為核函數(shù)。2.3 數(shù)據(jù)處理平臺介紹Hadoop是Apache基金會旗下的一款開源分布式計算框架,主要用于方便用戶進行分布式計算。Hadoop 框架的出現(xiàn)可以讓用戶在并不了解分布式計算技術中集群計算機之前底層通信交互原理的情況下依然可以開發(fā)出分布式程序,降低了分布式程序開發(fā)的門檻。目前,Hadoop 技術主要應用在數(shù)據(jù)離線分析、海量日志文件的底層分布式存儲以及一些面向業(yè)務的分布式程序開發(fā)等。對于 Hadoop 自身來講,其核心組件主要由MapReduce 編程模型以及 HDFS 分布式文件系統(tǒng)所組成,但還有其他一些同樣重要的組件如 Hadoop YARN 系統(tǒng)資源協(xié)調器、分布式鍵值對數(shù)據(jù)庫 HBase 以及可以用作數(shù)據(jù)倉庫的 Hive 等,這些組件一并構成了 Hadoop 的生態(tài)體系,體系內(nèi)具體所包含的組件、模塊可以參照圖 2-2 所示。
圖 2-3 YARN各組件之間的關系ResourceManager 是基于運行在集群中分布式應用對資源的需求來進行調度的,它本身也是一個調度器,不過不會去監(jiān)視運行中的應用程序。不同的應用程序所調用的系統(tǒng)資源不同,因此也就需要不同的容器來承載。ResourceManager 可以進行管理和調度的系統(tǒng)資源主要包括 CPU、內(nèi)存、硬盤和網(wǎng)絡等。Hadoop 集群中的每一個節(jié)點上都會運行一個 NodeManager 進程,主要負責保障當前節(jié)點上程序的正常運行,相當于該節(jié)點計算機的一個代理,并會對該計算機系統(tǒng)資源進行管理和監(jiān)控。集群中每個節(jié)點中的 NodeManager 會監(jiān)控當前節(jié)點上資源的使用情況以及容器(Container)的運行狀態(tài),然后會定期向集群中的 ResourceManager進行匯報。容器是 YARN 體系中系統(tǒng)資源的抽象,它在所運行的節(jié)點上封裝了一定量的系統(tǒng)資源(包括CPU、內(nèi)存等)。YARN容器是有AppMaster向ResourceManager申請的,由 ResourceManager 中的資源分配器異步調度給 AppMaster。YARN 容器就是分布式應用程序的基本載體,它的運行是由 AppMaster 向應用所在的 NodeManager 發(fā)起的,容器在運行時必須包含內(nèi)部可執(zhí)行的命令(如 jar 包等)。
本文編號:2791679
【學位授予單位】:上海師范大學
【學位級別】:碩士
【學位授予年份】:2019
【分類號】:TP393.08;TP18
【圖文】:
Anderson 在一份報告中首次提出了網(wǎng)絡入侵的相關概念[3],出所謂網(wǎng)絡入侵就是指連接在網(wǎng)絡中的某一臺主機遭到同處于該士的越權訪問,并且對主機上的文件進行篡改以導致主機無法網(wǎng)絡入侵行為的出現(xiàn)嚴重威脅著計算機網(wǎng)絡的信息安全,在這的相關概念誕生了,即通過收集相關特征信息來識別網(wǎng)絡入侵全目的的一種技術。近年來隨著互聯(lián)網(wǎng)的蓬勃發(fā)展、網(wǎng)絡安全侵檢測技術也有了巨大的突破。入侵檢測技術需要借助額外的現(xiàn),通過部署在區(qū)域網(wǎng)絡中的采集裝置來對原始網(wǎng)絡信息進行是網(wǎng)絡中主機的系統(tǒng)日志,也可以是網(wǎng)絡設備中進行數(shù)據(jù)包傳。通過對這些原始數(shù)據(jù)的分析、處理可以及時發(fā)現(xiàn)一些潛在的絡的平穩(wěn)安全運行。測基本步驟,網(wǎng)絡入侵檢測主要分為四個步驟,即原始網(wǎng)絡數(shù)據(jù)采集、數(shù)策響應,它們之間的關系可以參照圖 2-1 所示。
的表現(xiàn)形式: ( ) = ∑ ( , ) + (2-6)根據(jù) Mercer 條件,其中 ( , ) = j( ) × j( )為核函數(shù)。2.3 數(shù)據(jù)處理平臺介紹Hadoop是Apache基金會旗下的一款開源分布式計算框架,主要用于方便用戶進行分布式計算。Hadoop 框架的出現(xiàn)可以讓用戶在并不了解分布式計算技術中集群計算機之前底層通信交互原理的情況下依然可以開發(fā)出分布式程序,降低了分布式程序開發(fā)的門檻。目前,Hadoop 技術主要應用在數(shù)據(jù)離線分析、海量日志文件的底層分布式存儲以及一些面向業(yè)務的分布式程序開發(fā)等。對于 Hadoop 自身來講,其核心組件主要由MapReduce 編程模型以及 HDFS 分布式文件系統(tǒng)所組成,但還有其他一些同樣重要的組件如 Hadoop YARN 系統(tǒng)資源協(xié)調器、分布式鍵值對數(shù)據(jù)庫 HBase 以及可以用作數(shù)據(jù)倉庫的 Hive 等,這些組件一并構成了 Hadoop 的生態(tài)體系,體系內(nèi)具體所包含的組件、模塊可以參照圖 2-2 所示。
圖 2-3 YARN各組件之間的關系ResourceManager 是基于運行在集群中分布式應用對資源的需求來進行調度的,它本身也是一個調度器,不過不會去監(jiān)視運行中的應用程序。不同的應用程序所調用的系統(tǒng)資源不同,因此也就需要不同的容器來承載。ResourceManager 可以進行管理和調度的系統(tǒng)資源主要包括 CPU、內(nèi)存、硬盤和網(wǎng)絡等。Hadoop 集群中的每一個節(jié)點上都會運行一個 NodeManager 進程,主要負責保障當前節(jié)點上程序的正常運行,相當于該節(jié)點計算機的一個代理,并會對該計算機系統(tǒng)資源進行管理和監(jiān)控。集群中每個節(jié)點中的 NodeManager 會監(jiān)控當前節(jié)點上資源的使用情況以及容器(Container)的運行狀態(tài),然后會定期向集群中的 ResourceManager進行匯報。容器是 YARN 體系中系統(tǒng)資源的抽象,它在所運行的節(jié)點上封裝了一定量的系統(tǒng)資源(包括CPU、內(nèi)存等)。YARN容器是有AppMaster向ResourceManager申請的,由 ResourceManager 中的資源分配器異步調度給 AppMaster。YARN 容器就是分布式應用程序的基本載體,它的運行是由 AppMaster 向應用所在的 NodeManager 發(fā)起的,容器在運行時必須包含內(nèi)部可執(zhí)行的命令(如 jar 包等)。
【參考文獻】
相關期刊論文 前1條
1 黨小超;郝占軍;;基于改進Elman神經(jīng)網(wǎng)絡的網(wǎng)絡流量預測[J];計算機應用;2010年10期
本文編號:2791679
本文鏈接:http://www.sikaile.net/guanlilunwen/ydhl/2791679.html
最近更新
教材專著