基于關(guān)聯(lián)感知的無(wú)監(jiān)督深度異常檢測(cè)模型研究
發(fā)布時(shí)間:2021-06-05 09:47
異常檢測(cè)已經(jīng)被廣泛應(yīng)用于網(wǎng)絡(luò)安全、模式識(shí)別、數(shù)據(jù)挖掘等應(yīng)用領(lǐng)域。異常檢測(cè)旨在發(fā)現(xiàn)正常模式中的異常模式。無(wú)監(jiān)督異常檢測(cè)方法通過(guò)對(duì)樣本的概率分布估計(jì)來(lái)發(fā)現(xiàn)異常數(shù)據(jù),是當(dāng)今異常檢測(cè)主要采用的方法之一。已有的無(wú)監(jiān)督異常檢測(cè)方法通常只對(duì)數(shù)據(jù)的原始特征進(jìn)行分析,忽略了數(shù)據(jù)間隱含的關(guān)聯(lián)性信息,導(dǎo)致異常檢測(cè)效果不甚理想。本文針對(duì)此問(wèn)題提出了基于關(guān)聯(lián)感知的無(wú)監(jiān)督深度異常檢測(cè)模型。為了提取數(shù)據(jù)的關(guān)聯(lián)性信息,本文通過(guò)圖結(jié)構(gòu)對(duì)數(shù)據(jù)間關(guān)聯(lián)性進(jìn)行建模。首先,在數(shù)據(jù)的原始特征空間中,使用k最近鄰算法(k-nearest neighbor,k-NN)來(lái)對(duì)數(shù)據(jù)的相似性進(jìn)行分析;然后,根據(jù)數(shù)據(jù)之間的相似性來(lái)構(gòu)建無(wú)向圖,以此表示數(shù)據(jù)間關(guān)聯(lián)性;最后,設(shè)計(jì)數(shù)據(jù)間關(guān)聯(lián)性挖掘方法,對(duì)數(shù)據(jù)之間關(guān)聯(lián)性信息進(jìn)行深入挖掘。為了利用數(shù)據(jù)的關(guān)聯(lián)性信息,本文設(shè)計(jì)了基于關(guān)聯(lián)感知自編碼器的高斯混合模型(Correlation-aware autoencoders in Gaussian mixed model,CAAE-GMM),設(shè)計(jì)基于高斯混合模型的估計(jì)網(wǎng)絡(luò),以深入挖掘的數(shù)據(jù)間關(guān)聯(lián)性信息為輸入,估計(jì)數(shù)據(jù)的概率分布,并基于此進(jìn)行異常檢測(cè);然后,在C...
【文章來(lái)源】:哈爾濱理工大學(xué)黑龍江省
【文章頁(yè)數(shù)】:58 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖卷積神經(jīng)網(wǎng)絡(luò)Fig.2-1Graphconvolutionalneuralnetwork
哈爾濱理工大學(xué)工學(xué)碩士學(xué)位論文-9-neuralnetwork,CNN),用于抽取圖數(shù)據(jù)中的局部空間信息,并將其融合構(gòu)建為新的特征表示。傳統(tǒng)的卷積神經(jīng)網(wǎng)絡(luò)必須以圖數(shù)據(jù)所有可能的節(jié)點(diǎn)排列作為輸入,然而圖數(shù)據(jù)的節(jié)點(diǎn)之間無(wú)順序性,即圖數(shù)據(jù)經(jīng)旋轉(zhuǎn)、翻折操作不影響數(shù)據(jù)本身,如圖2-2(a)中,數(shù)據(jù)必須從左上開(kāi)始依次輸入,而圖2-2(b)中,以數(shù)據(jù)所有可能的節(jié)點(diǎn)排列作為輸入。因此,圖數(shù)據(jù)會(huì)導(dǎo)致卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練困難。為解決此問(wèn)題,圖卷積神經(jīng)網(wǎng)絡(luò)采用在節(jié)點(diǎn)上進(jìn)行信息傳播,從而使模型輸出不隨節(jié)點(diǎn)的輸入順序而發(fā)生變化。除此之外,圖數(shù)據(jù)中的邊也可表示兩個(gè)節(jié)點(diǎn)之間的依賴關(guān)系,可以利用節(jié)點(diǎn)周圍的狀態(tài)來(lái)對(duì)節(jié)點(diǎn)的狀態(tài)進(jìn)行更新,從而利用數(shù)據(jù)之間的關(guān)聯(lián)性進(jìn)行推理學(xué)習(xí),使模型具有與人類相似的推理能力。而在傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)中,這種依賴關(guān)系只能通過(guò)節(jié)點(diǎn)的特征表示來(lái)體現(xiàn),只能通過(guò)大量的經(jīng)驗(yàn)數(shù)據(jù)學(xué)習(xí)信息。因此,圖卷積神經(jīng)網(wǎng)絡(luò)在處理數(shù)據(jù)關(guān)聯(lián)性信息上,具有傳統(tǒng)方法無(wú)法比擬的優(yōu)勢(shì)。(a)傳統(tǒng)數(shù)據(jù)(b)圖數(shù)據(jù)(a)Traditionaldata(b)Graphdata圖2-2傳統(tǒng)數(shù)據(jù)與圖數(shù)據(jù)區(qū)別FIG.2-2Differencesbetweentraditionaldataandgraphdata圖卷積神經(jīng)網(wǎng)絡(luò)的主要目標(biāo)是訓(xùn)練一個(gè)函數(shù),此函數(shù)的輸入包含了節(jié)點(diǎn)與節(jié)點(diǎn)之間的信息,如圖2-3所示。具體工作原理如下:在圖數(shù)據(jù)中,節(jié)點(diǎn)是由節(jié)點(diǎn)特征與鄰居節(jié)點(diǎn)共同表示的。圖卷積神經(jīng)網(wǎng)絡(luò)通過(guò)訓(xùn)練,得到節(jié)點(diǎn)高質(zhì)量的低維表示。其中圖卷積神經(jīng)網(wǎng)絡(luò)層與層之間的傳播方式如公式2-1。)~~~(2121ll1lWHDADH(2-1)其中,D~表示A~度矩陣,LAD~~,L表示Laplacian矩陣;IAA~,A表示鄰接矩陣;H表示每一層的輸出,當(dāng)為輸入層時(shí),H為輸入數(shù)據(jù);W表示每層
哈爾濱理工大學(xué)工學(xué)碩士學(xué)位論文-10-的權(quán)重;表示非線性激活函數(shù)。圖卷積神經(jīng)網(wǎng)絡(luò)通過(guò)多層的迭代,最終得到節(jié)點(diǎn)的高質(zhì)量表示。圖2-3圖卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練過(guò)程Fig.2-3ThetrainingprocessofGraphconvolutionalneuralnetwork由以上分析可以看出,圖神經(jīng)網(wǎng)絡(luò)可利用圖結(jié)構(gòu)挖掘數(shù)據(jù)間的關(guān)聯(lián)性信息,符合本文核心研究?jī)?nèi)容的需要。因此,本文將對(duì)數(shù)據(jù)進(jìn)行圖結(jié)構(gòu)建模,并選擇圖卷積神經(jīng)網(wǎng)絡(luò)作為挖掘數(shù)據(jù)關(guān)聯(lián)性信息的基本方法。2.3自編碼器自編碼器作為生成模型的一種,早在1986年被Hinton等人提出,是一種能夠通過(guò)無(wú)監(jiān)督方式學(xué)習(xí)到數(shù)據(jù)的高質(zhì)量低維表示的人工神經(jīng)網(wǎng)絡(luò)。在自編碼器中,將輸入數(shù)據(jù)降維并生成高質(zhì)量的低維表示的過(guò)程稱為編碼過(guò)程。另外,自編碼器作為一種強(qiáng)大的特征檢測(cè)器,能夠應(yīng)用于深度學(xué)習(xí)的預(yù)訓(xùn)練中,從而提高模型的學(xué)習(xí)性能。作為生成模型的一種,自編碼器可以隨機(jī)生成與輸入數(shù)據(jù)相似的數(shù)據(jù),從而實(shí)現(xiàn)對(duì)數(shù)據(jù)的建模。圖2-4自編碼器框架Fig.2-4FrameofAutoEncoders自編碼器通常學(xué)習(xí)輸入數(shù)據(jù),并將輸入數(shù)據(jù)簡(jiǎn)單地重構(gòu)到輸出中。如圖2-4所示。其中,X表示輸入數(shù)據(jù),X"表示自編碼器輸出數(shù)據(jù),f表示編碼函數(shù),g
【參考文獻(xiàn)】:
期刊論文
[1]深度學(xué)習(xí)目標(biāo)檢測(cè)方法綜述[J]. 趙永強(qiáng),饒?jiān)?董世鵬,張君毅. 中國(guó)圖象圖形學(xué)報(bào). 2020(04)
[2]基于圖神經(jīng)網(wǎng)絡(luò)的動(dòng)態(tài)網(wǎng)絡(luò)異常檢測(cè)算法[J]. 郭嘉琰,李榮華,張巖,王國(guó)仁. 軟件學(xué)報(bào). 2020(03)
[3]深度自編碼器在數(shù)據(jù)異常檢測(cè)中的應(yīng)用研究[J]. 張常華,周雄圖,張永愛(ài),姚劍敏,郭太良,嚴(yán)群. 計(jì)算機(jī)工程與應(yīng)用. 2020(17)
[4]基于鄰域保持嵌入-主成分分析的高壓電纜狀態(tài)數(shù)據(jù)異常檢測(cè)及分析[J]. 劉敏,方義治,孫廷璽,羅思琴,王升,周念成,蘭雪珂. 科學(xué)技術(shù)與工程. 2019(27)
[5]基于無(wú)監(jiān)督學(xué)習(xí)的圖像風(fēng)格遷移方法[J]. 簡(jiǎn)麗瓊,高翔. 信息與電腦(理論版). 2019(17)
[6]融合時(shí)空興趣點(diǎn)和多元廣義高斯混合模型的人體動(dòng)作識(shí)別[J]. 何冰倩,魏維,宋巖貝,高聯(lián)欣,張斌. 成都信息工程大學(xué)學(xué)報(bào). 2019(04)
[7]基于自編碼器的分組光網(wǎng)絡(luò)監(jiān)測(cè)數(shù)據(jù)分析與優(yōu)化方法研究[J]. 趙星,呂博. 信息通信技術(shù)與政策. 2019(07)
[8]基于深度信念網(wǎng)絡(luò)的高維傳感器數(shù)據(jù)異常檢測(cè)算法[J]. 金鵬,夏曉峰,喬焰,崔信紅. 傳感技術(shù)學(xué)報(bào). 2019(06)
[9]基于深度學(xué)習(xí)的網(wǎng)絡(luò)入侵檢測(cè)研究綜述[J]. 張勇東,陳思洋,彭雨荷,楊堅(jiān). 廣州大學(xué)學(xué)報(bào)(自然科學(xué)版). 2019(03)
[10]基于自適應(yīng)人工魚(yú)群FCM的異常檢測(cè)算法[J]. 席亮,王勇,張鳳斌. 計(jì)算機(jī)研究與發(fā)展. 2019(05)
本文編號(hào):3211933
【文章來(lái)源】:哈爾濱理工大學(xué)黑龍江省
【文章頁(yè)數(shù)】:58 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖卷積神經(jīng)網(wǎng)絡(luò)Fig.2-1Graphconvolutionalneuralnetwork
哈爾濱理工大學(xué)工學(xué)碩士學(xué)位論文-9-neuralnetwork,CNN),用于抽取圖數(shù)據(jù)中的局部空間信息,并將其融合構(gòu)建為新的特征表示。傳統(tǒng)的卷積神經(jīng)網(wǎng)絡(luò)必須以圖數(shù)據(jù)所有可能的節(jié)點(diǎn)排列作為輸入,然而圖數(shù)據(jù)的節(jié)點(diǎn)之間無(wú)順序性,即圖數(shù)據(jù)經(jīng)旋轉(zhuǎn)、翻折操作不影響數(shù)據(jù)本身,如圖2-2(a)中,數(shù)據(jù)必須從左上開(kāi)始依次輸入,而圖2-2(b)中,以數(shù)據(jù)所有可能的節(jié)點(diǎn)排列作為輸入。因此,圖數(shù)據(jù)會(huì)導(dǎo)致卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練困難。為解決此問(wèn)題,圖卷積神經(jīng)網(wǎng)絡(luò)采用在節(jié)點(diǎn)上進(jìn)行信息傳播,從而使模型輸出不隨節(jié)點(diǎn)的輸入順序而發(fā)生變化。除此之外,圖數(shù)據(jù)中的邊也可表示兩個(gè)節(jié)點(diǎn)之間的依賴關(guān)系,可以利用節(jié)點(diǎn)周圍的狀態(tài)來(lái)對(duì)節(jié)點(diǎn)的狀態(tài)進(jìn)行更新,從而利用數(shù)據(jù)之間的關(guān)聯(lián)性進(jìn)行推理學(xué)習(xí),使模型具有與人類相似的推理能力。而在傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)中,這種依賴關(guān)系只能通過(guò)節(jié)點(diǎn)的特征表示來(lái)體現(xiàn),只能通過(guò)大量的經(jīng)驗(yàn)數(shù)據(jù)學(xué)習(xí)信息。因此,圖卷積神經(jīng)網(wǎng)絡(luò)在處理數(shù)據(jù)關(guān)聯(lián)性信息上,具有傳統(tǒng)方法無(wú)法比擬的優(yōu)勢(shì)。(a)傳統(tǒng)數(shù)據(jù)(b)圖數(shù)據(jù)(a)Traditionaldata(b)Graphdata圖2-2傳統(tǒng)數(shù)據(jù)與圖數(shù)據(jù)區(qū)別FIG.2-2Differencesbetweentraditionaldataandgraphdata圖卷積神經(jīng)網(wǎng)絡(luò)的主要目標(biāo)是訓(xùn)練一個(gè)函數(shù),此函數(shù)的輸入包含了節(jié)點(diǎn)與節(jié)點(diǎn)之間的信息,如圖2-3所示。具體工作原理如下:在圖數(shù)據(jù)中,節(jié)點(diǎn)是由節(jié)點(diǎn)特征與鄰居節(jié)點(diǎn)共同表示的。圖卷積神經(jīng)網(wǎng)絡(luò)通過(guò)訓(xùn)練,得到節(jié)點(diǎn)高質(zhì)量的低維表示。其中圖卷積神經(jīng)網(wǎng)絡(luò)層與層之間的傳播方式如公式2-1。)~~~(2121ll1lWHDADH(2-1)其中,D~表示A~度矩陣,LAD~~,L表示Laplacian矩陣;IAA~,A表示鄰接矩陣;H表示每一層的輸出,當(dāng)為輸入層時(shí),H為輸入數(shù)據(jù);W表示每層
哈爾濱理工大學(xué)工學(xué)碩士學(xué)位論文-10-的權(quán)重;表示非線性激活函數(shù)。圖卷積神經(jīng)網(wǎng)絡(luò)通過(guò)多層的迭代,最終得到節(jié)點(diǎn)的高質(zhì)量表示。圖2-3圖卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練過(guò)程Fig.2-3ThetrainingprocessofGraphconvolutionalneuralnetwork由以上分析可以看出,圖神經(jīng)網(wǎng)絡(luò)可利用圖結(jié)構(gòu)挖掘數(shù)據(jù)間的關(guān)聯(lián)性信息,符合本文核心研究?jī)?nèi)容的需要。因此,本文將對(duì)數(shù)據(jù)進(jìn)行圖結(jié)構(gòu)建模,并選擇圖卷積神經(jīng)網(wǎng)絡(luò)作為挖掘數(shù)據(jù)關(guān)聯(lián)性信息的基本方法。2.3自編碼器自編碼器作為生成模型的一種,早在1986年被Hinton等人提出,是一種能夠通過(guò)無(wú)監(jiān)督方式學(xué)習(xí)到數(shù)據(jù)的高質(zhì)量低維表示的人工神經(jīng)網(wǎng)絡(luò)。在自編碼器中,將輸入數(shù)據(jù)降維并生成高質(zhì)量的低維表示的過(guò)程稱為編碼過(guò)程。另外,自編碼器作為一種強(qiáng)大的特征檢測(cè)器,能夠應(yīng)用于深度學(xué)習(xí)的預(yù)訓(xùn)練中,從而提高模型的學(xué)習(xí)性能。作為生成模型的一種,自編碼器可以隨機(jī)生成與輸入數(shù)據(jù)相似的數(shù)據(jù),從而實(shí)現(xiàn)對(duì)數(shù)據(jù)的建模。圖2-4自編碼器框架Fig.2-4FrameofAutoEncoders自編碼器通常學(xué)習(xí)輸入數(shù)據(jù),并將輸入數(shù)據(jù)簡(jiǎn)單地重構(gòu)到輸出中。如圖2-4所示。其中,X表示輸入數(shù)據(jù),X"表示自編碼器輸出數(shù)據(jù),f表示編碼函數(shù),g
【參考文獻(xiàn)】:
期刊論文
[1]深度學(xué)習(xí)目標(biāo)檢測(cè)方法綜述[J]. 趙永強(qiáng),饒?jiān)?董世鵬,張君毅. 中國(guó)圖象圖形學(xué)報(bào). 2020(04)
[2]基于圖神經(jīng)網(wǎng)絡(luò)的動(dòng)態(tài)網(wǎng)絡(luò)異常檢測(cè)算法[J]. 郭嘉琰,李榮華,張巖,王國(guó)仁. 軟件學(xué)報(bào). 2020(03)
[3]深度自編碼器在數(shù)據(jù)異常檢測(cè)中的應(yīng)用研究[J]. 張常華,周雄圖,張永愛(ài),姚劍敏,郭太良,嚴(yán)群. 計(jì)算機(jī)工程與應(yīng)用. 2020(17)
[4]基于鄰域保持嵌入-主成分分析的高壓電纜狀態(tài)數(shù)據(jù)異常檢測(cè)及分析[J]. 劉敏,方義治,孫廷璽,羅思琴,王升,周念成,蘭雪珂. 科學(xué)技術(shù)與工程. 2019(27)
[5]基于無(wú)監(jiān)督學(xué)習(xí)的圖像風(fēng)格遷移方法[J]. 簡(jiǎn)麗瓊,高翔. 信息與電腦(理論版). 2019(17)
[6]融合時(shí)空興趣點(diǎn)和多元廣義高斯混合模型的人體動(dòng)作識(shí)別[J]. 何冰倩,魏維,宋巖貝,高聯(lián)欣,張斌. 成都信息工程大學(xué)學(xué)報(bào). 2019(04)
[7]基于自編碼器的分組光網(wǎng)絡(luò)監(jiān)測(cè)數(shù)據(jù)分析與優(yōu)化方法研究[J]. 趙星,呂博. 信息通信技術(shù)與政策. 2019(07)
[8]基于深度信念網(wǎng)絡(luò)的高維傳感器數(shù)據(jù)異常檢測(cè)算法[J]. 金鵬,夏曉峰,喬焰,崔信紅. 傳感技術(shù)學(xué)報(bào). 2019(06)
[9]基于深度學(xué)習(xí)的網(wǎng)絡(luò)入侵檢測(cè)研究綜述[J]. 張勇東,陳思洋,彭雨荷,楊堅(jiān). 廣州大學(xué)學(xué)報(bào)(自然科學(xué)版). 2019(03)
[10]基于自適應(yīng)人工魚(yú)群FCM的異常檢測(cè)算法[J]. 席亮,王勇,張鳳斌. 計(jì)算機(jī)研究與發(fā)展. 2019(05)
本文編號(hào):3211933
本文鏈接:http://www.sikaile.net/kejilunwen/shengwushengchang/3211933.html
最近更新
教材專著