基于深度變分學習的異常檢測模型研究
發(fā)布時間:2021-08-18 14:32
異常檢測是數(shù)據(jù)挖掘中的重要任務(wù),其基本目標是檢測出偏離整體數(shù)據(jù)特征的數(shù)據(jù)值,同時隨著信息技術(shù)的發(fā)展,現(xiàn)有的異常檢測模型已經(jīng)無法滿足當下的異常檢測需求,基于深度學習的異常檢測模型逐漸成為了一個新的研究方向。在深度異常檢測領(lǐng)域中主要兩類模型,一是混合模型,混合模型是將傳統(tǒng)的異常檢測算法和深度學習降維算法相結(jié)合,從而提高檢測效率的模型。二是生成模型,生成模型通過訓練數(shù)據(jù)直接對數(shù)據(jù)進行建模,通過觀測樣本估計其分布特征,同時結(jié)合判別模型進行高維數(shù)據(jù)的異常檢測。針對目前異常檢測模型的優(yōu)缺點,提出了一種混合檢測模型,通過結(jié)合深度學習降維算法和改進的傳統(tǒng)檢測模型進行異常檢測,本文的主要工作如下:(1).對異常檢測相關(guān)工作的討論和分析概述了深度學習在異常檢測領(lǐng)域中現(xiàn)階段的發(fā)展情況,總結(jié)了在異常檢測領(lǐng)域中相關(guān)技術(shù)以及數(shù)據(jù)降維的研究現(xiàn)狀。提出了基于深度變分降維的混合模型并用于異常檢測,并概述了其優(yōu)勢與不足,同時闡明了研究方向。(2).基于雙向鄰居修正的局部異常因子算法提出基于雙向鄰居修正的局部異常因子算法,利用雙向鄰居搜索算法選取較優(yōu)參數(shù)用于計算異常值,結(jié)合所提剪枝算法減少了鄰域搜索時間和不必要的異常值計算...
【文章來源】:河北大學河北省
【文章頁數(shù)】:63 頁
【學位級別】:碩士
【部分圖文】:
離群點
河北大學碩士學位論文8下面是LOF算法的主要概念:1)d(p,o)表示p和o兩點之間的距離;2)kdistance表示第k距離。對于點p的第k距離dk(p)=d(p,o),并且滿足a)在集合中至少有不包括p在內(nèi)的k個點o′∈C{x≠p},滿足d(p,o′)≤d(p,o)b)在集合中最多有不包括p在內(nèi)的k1個點o′∈C{x≠p},滿足d(p,o′)<d(p,o)p的第k距離,即距離p第k遠的點的距離,不包括p。如圖2-2圖2-2第k距離3)第k距離鄰域:kdistanceneighborhoodofp表示p的第k距離鄰域點p的第k距離鄰域Nk(p)表示距離小于p的第k距離內(nèi)的所有數(shù)據(jù)點,包括第k距離的數(shù)據(jù)點。因此p的第k鄰域點的個數(shù)∣Nk(p)∣≥k4)reachdistance表示可達距離,點o到點p的第k可達距離定義為:reachdistance(p,o)max{kdistance(o),d(p,o)}(2.1)即點O到點p的第k可達距離,至少是O的第k距離,或者為O,p間的真實距離。這意味著,離點O最近的k個點,O到他們的可達距離被認為相等,且都等于dkO)如圖,O1到p的第5可達距離為d(p,O1),O2到p的第5可達距離為d5(O2),如圖2-3所示。圖2-3可達距離
可達距離
【參考文獻】:
期刊論文
[1]基于網(wǎng)絡(luò)通信異常識別的多步攻擊檢測方法[J]. 琚安康,郭淵博,李濤,葉子維. 通信學報. 2019(07)
[2]基于密度偏倚抽樣的局部距離異常檢測方法[J]. 付培國,胡曉惠. 軟件學報. 2017(10)
本文編號:3350066
【文章來源】:河北大學河北省
【文章頁數(shù)】:63 頁
【學位級別】:碩士
【部分圖文】:
離群點
河北大學碩士學位論文8下面是LOF算法的主要概念:1)d(p,o)表示p和o兩點之間的距離;2)kdistance表示第k距離。對于點p的第k距離dk(p)=d(p,o),并且滿足a)在集合中至少有不包括p在內(nèi)的k個點o′∈C{x≠p},滿足d(p,o′)≤d(p,o)b)在集合中最多有不包括p在內(nèi)的k1個點o′∈C{x≠p},滿足d(p,o′)<d(p,o)p的第k距離,即距離p第k遠的點的距離,不包括p。如圖2-2圖2-2第k距離3)第k距離鄰域:kdistanceneighborhoodofp表示p的第k距離鄰域點p的第k距離鄰域Nk(p)表示距離小于p的第k距離內(nèi)的所有數(shù)據(jù)點,包括第k距離的數(shù)據(jù)點。因此p的第k鄰域點的個數(shù)∣Nk(p)∣≥k4)reachdistance表示可達距離,點o到點p的第k可達距離定義為:reachdistance(p,o)max{kdistance(o),d(p,o)}(2.1)即點O到點p的第k可達距離,至少是O的第k距離,或者為O,p間的真實距離。這意味著,離點O最近的k個點,O到他們的可達距離被認為相等,且都等于dkO)如圖,O1到p的第5可達距離為d(p,O1),O2到p的第5可達距離為d5(O2),如圖2-3所示。圖2-3可達距離
可達距離
【參考文獻】:
期刊論文
[1]基于網(wǎng)絡(luò)通信異常識別的多步攻擊檢測方法[J]. 琚安康,郭淵博,李濤,葉子維. 通信學報. 2019(07)
[2]基于密度偏倚抽樣的局部距離異常檢測方法[J]. 付培國,胡曉惠. 軟件學報. 2017(10)
本文編號:3350066
本文鏈接:http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/3350066.html
最近更新
教材專著