基于深度學(xué)習(xí)的惡意程序檢測(cè)與分類(lèi)
發(fā)布時(shí)間:2021-06-24 10:52
隨著計(jì)算機(jī)技術(shù)的飛快發(fā)展,惡意程序給人們帶來(lái)的危險(xiǎn)也與日俱增。由于混淆編碼技術(shù)的提高,惡意程序的數(shù)量日益龐大且不易識(shí)別,傳統(tǒng)的惡意程序檢測(cè)技術(shù)已經(jīng)難以滿(mǎn)足人們的需求。本文采取深度學(xué)習(xí)的方法來(lái)提高模型檢測(cè)惡意程序的能力。深度學(xué)習(xí)是機(jī)器學(xué)習(xí)延伸出來(lái)的一個(gè)新型技術(shù),被廣泛應(yīng)用在圖像處理、自然語(yǔ)言處理、計(jì)算機(jī)視覺(jué)以及語(yǔ)言識(shí)別等領(lǐng)域,而深度學(xué)習(xí)中的卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)源于人工神經(jīng)網(wǎng)絡(luò)的深入研究,具有良好的分類(lèi)性能,對(duì)于未知樣本的預(yù)測(cè)能力也較高。傳統(tǒng)方法中提取日志文件進(jìn)行分析,但是,這樣會(huì)損失詞向量模型中某些維度的語(yǔ)法信息,也不能表現(xiàn)出可執(zhí)行程序行為的本質(zhì)。本文具體采取的方法是,通過(guò)相關(guān)工具對(duì)可執(zhí)行程序進(jìn)行分析,得到自然語(yǔ)言描述的行為信息的語(yǔ)料庫(kù),并根據(jù)語(yǔ)料庫(kù)訓(xùn)練詞向量空間,用其中的詞向量對(duì)提取的行為信息進(jìn)行表示,得到行為特征圖,最后用卷積神經(jīng)網(wǎng)絡(luò)的方法訓(xùn)練模型并進(jìn)行檢測(cè)。為了改進(jìn)傳統(tǒng)的檢測(cè)方法以及對(duì)實(shí)驗(yàn)效果進(jìn)行證明,本文做了兩個(gè)對(duì)比實(shí)驗(yàn)。第一個(gè)實(shí)驗(yàn)提取了惡意軟件的API調(diào)用序列作為文本信息,建立一個(gè)向量空間模型(Vector Space...
【文章來(lái)源】:西安電子科技大學(xué)陜西省 211工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:74 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
Sigmoid和Tanh函數(shù)圖像
這樣的特性可以去掉數(shù)據(jù)中的冗雜值 Tanh 兩種激活函數(shù)的形式相比,Relu 不需oid 和 Tanh 一樣需要進(jìn)行歸一化處理來(lái)減輕多優(yōu)秀特性,所以在深度神經(jīng)網(wǎng)絡(luò)中應(yīng)用比層也稱(chēng)為匯聚層,下采樣層。其作用是在保的無(wú)關(guān)信息,提高模型的訓(xùn)練效率,減小計(jì),方便對(duì)卷積處理后的信息進(jìn)行篩選和過(guò)濾合現(xiàn)象。過(guò)程就是在一個(gè)小區(qū)域內(nèi),取一個(gè)特定的值作域的一個(gè)隨機(jī)值、平均值、最大或最小值。以及最終分類(lèi)結(jié)果的準(zhǔn)確性。圖2.6中對(duì)最大 中最大值的操作進(jìn)行了展示,本文中使
驗(yàn)中使用的描述信息是“自然語(yǔ)言”描述的行為文本信息,由改進(jìn)工具進(jìn)行提取。本章對(duì)提取該信息的 Cuckoo 工具進(jìn)行了展示,介紹了工和使用方法,而后對(duì)本文中使用的兩種文本特征提取算法進(jìn)行了論述,過(guò)文本得到特征圖和特征向量的過(guò)程,最后介紹了整個(gè)實(shí)驗(yàn)的出發(fā)點(diǎn)和第四章的實(shí)驗(yàn)展示作了鋪墊。本信息的獲取行程序的行為文本信息通過(guò) Cuckoo 沙箱工具進(jìn)行獲取。Cuckoo 沙箱工pen Source Cuckoo Sandbox Project,是一種用Python編寫(xiě)的開(kāi)源自動(dòng)化工件分析領(lǐng)域應(yīng)用廣泛。其架構(gòu)如圖 3.1 所示,通過(guò) Cuckoo 工具可以幫員獲取惡意程序動(dòng)態(tài)靜態(tài)的特征信息。沙箱是一種將未知、不可信的軟行的安全機(jī)制,惡意軟件分析領(lǐng)域中沙箱工具一般用法是,將不可信軟境中動(dòng)態(tài)執(zhí)行,然后提取其運(yùn)行過(guò)程中的進(jìn)程、網(wǎng)絡(luò)、文件等動(dòng)態(tài)行為人員可以根據(jù)這些行為記錄對(duì)惡意軟件進(jìn)行更深入地分析。
【參考文獻(xiàn)】:
期刊論文
[1]深度學(xué)習(xí)在統(tǒng)計(jì)機(jī)器翻譯領(lǐng)域自適應(yīng)中的應(yīng)用研究[J]. 丁亮,姚長(zhǎng)青,何彥青,李輝. 情報(bào)工程. 2017(03)
[2]基于Hopfield神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)分類(lèi)[J]. 王振華. 計(jì)算機(jī)應(yīng)用. 2011(S2)
[3]基于BP人工神經(jīng)網(wǎng)絡(luò)的絕緣子泄漏電流預(yù)測(cè)[J]. 毛穎科,關(guān)志成,王黎明,樂(lè)波. 中國(guó)電機(jī)工程學(xué)報(bào). 2007(27)
[4]Benchmark性能測(cè)試綜述[J]. 王良. 計(jì)算機(jī)工程與應(yīng)用. 2006(15)
[5]BP神經(jīng)網(wǎng)絡(luò)的應(yīng)用設(shè)計(jì)[J]. 尹念東. 信息技術(shù). 2003(06)
[6]人工神經(jīng)網(wǎng)絡(luò)在遙感數(shù)字圖像分類(lèi)處理中的應(yīng)用[J]. 張寶光. 國(guó)土資源遙感. 1998(01)
碩士論文
[1]基于神經(jīng)網(wǎng)絡(luò)的股票預(yù)測(cè)[D]. 俞福福.哈爾濱工業(yè)大學(xué) 2016
[2]基于CNN的字符識(shí)別方法研究[D]. 王強(qiáng).天津師范大學(xué) 2014
[3]Kappa系數(shù)在一致性評(píng)價(jià)中的應(yīng)用研究[D]. 王軍.四川大學(xué) 2006
本文編號(hào):3246957
【文章來(lái)源】:西安電子科技大學(xué)陜西省 211工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:74 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
Sigmoid和Tanh函數(shù)圖像
這樣的特性可以去掉數(shù)據(jù)中的冗雜值 Tanh 兩種激活函數(shù)的形式相比,Relu 不需oid 和 Tanh 一樣需要進(jìn)行歸一化處理來(lái)減輕多優(yōu)秀特性,所以在深度神經(jīng)網(wǎng)絡(luò)中應(yīng)用比層也稱(chēng)為匯聚層,下采樣層。其作用是在保的無(wú)關(guān)信息,提高模型的訓(xùn)練效率,減小計(jì),方便對(duì)卷積處理后的信息進(jìn)行篩選和過(guò)濾合現(xiàn)象。過(guò)程就是在一個(gè)小區(qū)域內(nèi),取一個(gè)特定的值作域的一個(gè)隨機(jī)值、平均值、最大或最小值。以及最終分類(lèi)結(jié)果的準(zhǔn)確性。圖2.6中對(duì)最大 中最大值的操作進(jìn)行了展示,本文中使
驗(yàn)中使用的描述信息是“自然語(yǔ)言”描述的行為文本信息,由改進(jìn)工具進(jìn)行提取。本章對(duì)提取該信息的 Cuckoo 工具進(jìn)行了展示,介紹了工和使用方法,而后對(duì)本文中使用的兩種文本特征提取算法進(jìn)行了論述,過(guò)文本得到特征圖和特征向量的過(guò)程,最后介紹了整個(gè)實(shí)驗(yàn)的出發(fā)點(diǎn)和第四章的實(shí)驗(yàn)展示作了鋪墊。本信息的獲取行程序的行為文本信息通過(guò) Cuckoo 沙箱工具進(jìn)行獲取。Cuckoo 沙箱工pen Source Cuckoo Sandbox Project,是一種用Python編寫(xiě)的開(kāi)源自動(dòng)化工件分析領(lǐng)域應(yīng)用廣泛。其架構(gòu)如圖 3.1 所示,通過(guò) Cuckoo 工具可以幫員獲取惡意程序動(dòng)態(tài)靜態(tài)的特征信息。沙箱是一種將未知、不可信的軟行的安全機(jī)制,惡意軟件分析領(lǐng)域中沙箱工具一般用法是,將不可信軟境中動(dòng)態(tài)執(zhí)行,然后提取其運(yùn)行過(guò)程中的進(jìn)程、網(wǎng)絡(luò)、文件等動(dòng)態(tài)行為人員可以根據(jù)這些行為記錄對(duì)惡意軟件進(jìn)行更深入地分析。
【參考文獻(xiàn)】:
期刊論文
[1]深度學(xué)習(xí)在統(tǒng)計(jì)機(jī)器翻譯領(lǐng)域自適應(yīng)中的應(yīng)用研究[J]. 丁亮,姚長(zhǎng)青,何彥青,李輝. 情報(bào)工程. 2017(03)
[2]基于Hopfield神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)分類(lèi)[J]. 王振華. 計(jì)算機(jī)應(yīng)用. 2011(S2)
[3]基于BP人工神經(jīng)網(wǎng)絡(luò)的絕緣子泄漏電流預(yù)測(cè)[J]. 毛穎科,關(guān)志成,王黎明,樂(lè)波. 中國(guó)電機(jī)工程學(xué)報(bào). 2007(27)
[4]Benchmark性能測(cè)試綜述[J]. 王良. 計(jì)算機(jī)工程與應(yīng)用. 2006(15)
[5]BP神經(jīng)網(wǎng)絡(luò)的應(yīng)用設(shè)計(jì)[J]. 尹念東. 信息技術(shù). 2003(06)
[6]人工神經(jīng)網(wǎng)絡(luò)在遙感數(shù)字圖像分類(lèi)處理中的應(yīng)用[J]. 張寶光. 國(guó)土資源遙感. 1998(01)
碩士論文
[1]基于神經(jīng)網(wǎng)絡(luò)的股票預(yù)測(cè)[D]. 俞福福.哈爾濱工業(yè)大學(xué) 2016
[2]基于CNN的字符識(shí)別方法研究[D]. 王強(qiáng).天津師范大學(xué) 2014
[3]Kappa系數(shù)在一致性評(píng)價(jià)中的應(yīng)用研究[D]. 王軍.四川大學(xué) 2006
本文編號(hào):3246957
本文鏈接:http://www.sikaile.net/kejilunwen/zidonghuakongzhilunwen/3246957.html
最近更新
教材專(zhuān)著