基于DBSCAN算法的異常檢測方法研究
發(fā)布時間:2021-01-25 17:54
異常檢測是數(shù)據(jù)挖掘領(lǐng)域常用的一種手段,其中基于聚類的異常檢測技術(shù)最為流行。目前已經(jīng)提出了多種聚類算法,主要分為劃分、層次和基于密度的聚類算法;诿芏鹊木垲惸芴幚砣我庑螤畹拇亟Y(jié)構(gòu),并且易于實現(xiàn),因此該算法變得非常流行,其中DBSCAN算法最具代表性。由于其在識別噪聲數(shù)據(jù)方面的性能,因此也常被用于異常數(shù)據(jù)的檢測。但在實際應(yīng)用中,DBSCAN算法時間復(fù)雜度較高,執(zhí)行效率較低,不利于處理海量數(shù)據(jù)集;且對輸入全局參數(shù)敏感,不利于處理非均勻數(shù)據(jù)集。本文從以上問題出發(fā),提出了解決方法,主要工作包括以下幾個方面:首先,為了降低算法的運(yùn)行時間,結(jié)合MCMC(Markov Chain Monte Carlo,馬爾可夫鏈蒙特卡洛)采樣方法對DBSCAN(Density-based spatial clustering of applications with noise,簡稱DBSCAN)進(jìn)行改進(jìn),提出了一種新的聚類算法,稱為DBSCAN++。其基本思想是優(yōu)先擴(kuò)展拓展能力較強(qiáng)的核心對象。理論分析和模擬實驗表明DBSCAN++相對于DBSCAN聚類準(zhǔn)確性相當(dāng),而DBSCAN++具有更低的運(yùn)行時間。因此,DB...
【文章來源】:中國民航大學(xué)天津市
【文章頁數(shù)】:59 頁
【學(xué)位級別】:碩士
【部分圖文】:
對象p的鄰域
中國民航大學(xué)碩士學(xué)位論文對象。 密度可達(dá):對于對象 p 和對象 q,若存在一系列的對象 p1=q,p對于 pi是密度可達(dá)的,則認(rèn)為 p 相對于 q 是密度可達(dá)的,此時 稱為 p 的密度可達(dá)對象。如圖 2-2 所示。
7圖 2-3 密度相連對象擴(kuò)展操作:對核心對象 p 進(jìn)行擴(kuò)展操作即為確定其鄰域 N 2-2 可以看出,對象擴(kuò)展操作即遍歷核心對象 p 鄰域內(nèi)所有的邊界點(diǎn):在半徑ε內(nèi)部的對象數(shù)量小于 MinPts,但是仍屬于核其實并不是核心對象,只不過與其他核心對象的距離小于 Min
【參考文獻(xiàn)】:
期刊論文
[1]基于核密度估計的K-CFSFDP聚類算法[J]. 董曉君,程春玲. 計算機(jī)科學(xué). 2018(11)
[2]面向時序數(shù)據(jù)異常檢測的可視分析綜述[J]. 韓東明,郭方舟,潘嘉鋮,鄭文庭,陳為. 計算機(jī)研究與發(fā)展. 2018(09)
[3]Greedy DBSCAN:一種針對多密度聚類的DBSCAN改進(jìn)算法[J]. 馮振華,錢雪忠,趙娜娜. 計算機(jī)應(yīng)用研究. 2016(09)
[4]DBSCAN算法中參數(shù)的自適應(yīng)確定[J]. 李宗林,羅可. 計算機(jī)工程與應(yīng)用. 2016(03)
[5]回溯式在線EASI盲源分離算法[J]. 陳海平,張杭,張江. 信號處理. 2013(09)
[6]基于限定區(qū)域數(shù)據(jù)取樣的密度聚類算法[J]. 周紅芳,趙雪涵,周揚(yáng). 計算機(jī)應(yīng)用. 2012(08)
[7]SA-DBSCAN:一種自適應(yīng)基于密度聚類算法[J]. 夏魯寧,荊繼武. 中國科學(xué)院研究生院學(xué)報. 2009(04)
[8]一種基于參考點(diǎn)和密度的快速聚類算法[J]. 馬帥,王騰蛟,唐世渭,楊冬青,高軍. 軟件學(xué)報. 2003(06)
[9]一種基于密度的快速聚類算法[J]. 周水庚,周傲英,曹晶,胡運(yùn)發(fā). 計算機(jī)研究與發(fā)展. 2000(11)
碩士論文
[1]基于貝葉斯MCMC算法的股指VaR實證研究[D]. 李睿.哈爾濱工業(yè)大學(xué) 2018
[2]基于DBSCAN的自適應(yīng)非均勻密度聚類算法研究[D]. 王實美.北京交通大學(xué) 2017
[3]基于層次聚類的數(shù)據(jù)分析[D]. 繆元武.安徽大學(xué) 2013
[4]數(shù)據(jù)挖掘算法及其應(yīng)用研究[D]. 黃雯.南京郵電大學(xué) 2013
本文編號:2999635
【文章來源】:中國民航大學(xué)天津市
【文章頁數(shù)】:59 頁
【學(xué)位級別】:碩士
【部分圖文】:
對象p的鄰域
中國民航大學(xué)碩士學(xué)位論文對象。 密度可達(dá):對于對象 p 和對象 q,若存在一系列的對象 p1=q,p對于 pi是密度可達(dá)的,則認(rèn)為 p 相對于 q 是密度可達(dá)的,此時 稱為 p 的密度可達(dá)對象。如圖 2-2 所示。
7圖 2-3 密度相連對象擴(kuò)展操作:對核心對象 p 進(jìn)行擴(kuò)展操作即為確定其鄰域 N 2-2 可以看出,對象擴(kuò)展操作即遍歷核心對象 p 鄰域內(nèi)所有的邊界點(diǎn):在半徑ε內(nèi)部的對象數(shù)量小于 MinPts,但是仍屬于核其實并不是核心對象,只不過與其他核心對象的距離小于 Min
【參考文獻(xiàn)】:
期刊論文
[1]基于核密度估計的K-CFSFDP聚類算法[J]. 董曉君,程春玲. 計算機(jī)科學(xué). 2018(11)
[2]面向時序數(shù)據(jù)異常檢測的可視分析綜述[J]. 韓東明,郭方舟,潘嘉鋮,鄭文庭,陳為. 計算機(jī)研究與發(fā)展. 2018(09)
[3]Greedy DBSCAN:一種針對多密度聚類的DBSCAN改進(jìn)算法[J]. 馮振華,錢雪忠,趙娜娜. 計算機(jī)應(yīng)用研究. 2016(09)
[4]DBSCAN算法中參數(shù)的自適應(yīng)確定[J]. 李宗林,羅可. 計算機(jī)工程與應(yīng)用. 2016(03)
[5]回溯式在線EASI盲源分離算法[J]. 陳海平,張杭,張江. 信號處理. 2013(09)
[6]基于限定區(qū)域數(shù)據(jù)取樣的密度聚類算法[J]. 周紅芳,趙雪涵,周揚(yáng). 計算機(jī)應(yīng)用. 2012(08)
[7]SA-DBSCAN:一種自適應(yīng)基于密度聚類算法[J]. 夏魯寧,荊繼武. 中國科學(xué)院研究生院學(xué)報. 2009(04)
[8]一種基于參考點(diǎn)和密度的快速聚類算法[J]. 馬帥,王騰蛟,唐世渭,楊冬青,高軍. 軟件學(xué)報. 2003(06)
[9]一種基于密度的快速聚類算法[J]. 周水庚,周傲英,曹晶,胡運(yùn)發(fā). 計算機(jī)研究與發(fā)展. 2000(11)
碩士論文
[1]基于貝葉斯MCMC算法的股指VaR實證研究[D]. 李睿.哈爾濱工業(yè)大學(xué) 2018
[2]基于DBSCAN的自適應(yīng)非均勻密度聚類算法研究[D]. 王實美.北京交通大學(xué) 2017
[3]基于層次聚類的數(shù)據(jù)分析[D]. 繆元武.安徽大學(xué) 2013
[4]數(shù)據(jù)挖掘算法及其應(yīng)用研究[D]. 黃雯.南京郵電大學(xué) 2013
本文編號:2999635
本文鏈接:http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/2999635.html
最近更新
教材專著