天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于Stacking算法的惡意軟件檢測方法研究

發(fā)布時間:2021-06-10 23:02
  惡意軟件是在計算機系統(tǒng)上執(zhí)行惡意任務(wù)的程序。隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,惡意軟件攻擊的頻率呈指數(shù)級增長,惡意攻擊已成為威脅互聯(lián)網(wǎng)安全的關(guān)鍵所在。惡意軟件的檢測方法對于防范安全漏洞、數(shù)據(jù)盜竊和其他危險至關(guān)重要,因此,惡意軟件檢測已經(jīng)成為一個重要的研究領(lǐng)域。傳統(tǒng)的檢測方法容易受到混淆和變形技術(shù)的干擾,這些干擾降低了惡意軟件檢測的正確率和效率。隨著機器學習和深度學習技術(shù)的興起,部分研究人員已經(jīng)將這兩種技術(shù)應(yīng)用到惡意軟件檢測的領(lǐng)域中,并取得了顯著效果,但是現(xiàn)有的惡意軟件研究中,并沒有考慮惡意軟件數(shù)據(jù)集的屬性重要度問題,導致檢測效率低,無法凸顯有效信息,另一方面數(shù)據(jù)集的不平衡性會影響惡意軟件檢測的正確率。針對這些問題,本文提出一種基于Stacking算法的惡意軟件檢測方法。主要內(nèi)容包括以下三個方面:(1)針對惡意軟件屬性維度高、篩選重要屬性困難,導致檢測正確率和效率低的問題,本文利用天牛須搜索算法能夠?qū)ふ易顑?yōu)值的特性以及屬性重要度公式,對PCA降維算法進行優(yōu)化,從而去除重要度較小的屬性,降低維度的同時得到重要屬性。該方法在保證原有數(shù)據(jù)分布和重要信息的情況下,有效地簡化數(shù)據(jù),凸顯重要信息,降低檢測方法的... 

【文章來源】:大連海事大學遼寧省 211工程院校

【文章頁數(shù)】:67 頁

【學位級別】:碩士

【部分圖文】:

基于Stacking算法的惡意軟件檢測方法研究


圖2.1隨機森林算法示例圖??Fig.?2.1?Figure?of?Random?Forest??

算法,決策樹,梯度,分類器


?大連海事大學碩士學位論文???當輸入訓練樣本時,最終的分類結(jié)果由每個決策樹的輸出結(jié)果投票得到,訓練過程??如圖2.1所示。??A……A??I??1?I??瑜出??圖2.1隨機森林算法示例圖??Fig.?2.1?Figure?of?Random?Forest??2.3.2梯度提升決策樹算法??梯度提升決策樹(GBDT)?_也叫梯度提升樹,將回歸樹和提升樹的思想結(jié)合在一??起,并將分類與回歸樹作為基學習器的一種集成學習算法,它的繼承方式采用的是梯度??提升(GradientBoosting)。??GBDT算法的訓練過程如圖2.2所示。??*分類器——?學習?一?加權(quán)?q??■? ̄1—????i?'?'??????數(shù)據(jù)樣本一-?基分類器一?學習?一?加權(quán)?一一?融合樓型??,基分類器一?學習?一?加權(quán)?—??圖2.2?C出DT算法的訓練過程??Fig.?2.2?Training?process?of?GBDT?algorithm??梯度提升樹中的每棵決策樹的建立都是在之前決策樹損失函數(shù)的梯度下降方向,將??新產(chǎn)生的預(yù)測值與上一個預(yù)測值所形成的殘差進行匹配,進而對決策模型進行改進。由??于Boosting算法是通過殘差進行學習,GBDT主要是針對偏差的優(yōu)化來達到總體誤差下??降的目的,所以盡管每個基分類器學習能力很弱,也能集成出一個強學習器[39]。??-9?-??

邏輯圖,回歸預(yù)測,邏輯


定類的概率,如果估計的概率大于某一閾值,則模型預(yù)測這個實例屬于該類(稱??為正類,標記為“1”),否則預(yù)測實例不屬于該類(即,它屬于標記為“〇”的負類)。??LR在計算輸入特征的加權(quán)和方面與線性回歸一樣,但是它并不像線性回歸那樣直接輸??出最終結(jié)果,而是輸出該結(jié)果的估計概率,如公式(2.1)所示??P?=?he、x、=?CT(0r?.x)?(21)??邏輯回歸的函數(shù)如公式(2.2)所示[4Q]。??〇■(/)=-?— ̄-??l?+?exp(-〇?(2.2)??邏輯回歸的圖像W如圖2.3所示。??1.0????????os-?—??0.6?/??〇.4?y??0.2?-??0.0???—"???-10?-5?0?5?10??圖2.3邏輯回歸預(yù)測圖??Fig.?2.3?Logistic?Regression?model?prediction??由圖像可以看出,邏輯回歸可以得到數(shù)據(jù)樣本的概率分數(shù),便于理解和實現(xiàn)。并且??邏輯回歸直接對分類可能性進行建模,避免了進行假設(shè)分布所帶來的不正確問題,同時??具有很好的數(shù)學性質(zhì),配合正則化參數(shù)可減少過擬合[41],訓練速度快,是一個很好的分??類工具。??2.?3.?4?PCA?算法??主成分分析(PCA)算法是一種被廣泛應(yīng)用于數(shù)據(jù)降維領(lǐng)域的算法,它的主要思想??是通過線性變換將一個高維度的數(shù)據(jù)集轉(zhuǎn)換成低維度的數(shù)據(jù)集,并且各維度之間線性無??關(guān)。??假定J空間的數(shù)據(jù)樣本集£>?=丨(\>〇,...,(;^;;,),...,(^)丨,其線性變化后得到〃'維??空間中的數(shù)據(jù)樣本集為公式(2.3)所示。??Z?=?WtD?(2.3)??


本文編號:3223279

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/guanlilunwen/lindaojc/3223279.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶8e1ad***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com