基于K-means的數(shù)據(jù)流離群點(diǎn)檢測(cè)算法
本文選題:概念漂移 切入點(diǎn):數(shù)據(jù)流 出處:《計(jì)算機(jī)工程與應(yīng)用》2017年03期 論文類型:期刊論文
【摘要】:針對(duì)數(shù)據(jù)流中離群點(diǎn)挖掘問題,在K-means聚類算法基礎(chǔ)上,提出了基于距離的準(zhǔn)則進(jìn)行數(shù)據(jù)間離群點(diǎn)判斷的離群點(diǎn)檢測(cè)DOKM算法。根據(jù)數(shù)據(jù)流概念漂移檢測(cè)結(jié)果來(lái)自適應(yīng)地調(diào)整滑動(dòng)窗口大小,從而實(shí)現(xiàn)對(duì)數(shù)據(jù)流的離群點(diǎn)檢測(cè),與其他離群點(diǎn)算法的一系列實(shí)驗(yàn)驗(yàn)證和對(duì)比結(jié)果表明,DOKM算法在人工數(shù)據(jù)集和真實(shí)數(shù)據(jù)集中均可以實(shí)現(xiàn)對(duì)離群點(diǎn)的有效檢測(cè)。
[Abstract]:Aiming at the problem of outlier mining in data flow, based on K-means clustering algorithm, An outlier detection algorithm based on distance criterion is proposed to detect outliers in data streams. According to the results of data stream conceptual drift detection, the sliding window size is adjusted adaptively to realize outlier detection of data streams. A series of experiments and comparisons with other outliers show that the DOKM algorithm can effectively detect outliers in both artificial and real datasets.
【作者單位】: 南京郵電大學(xué)計(jì)算機(jī)學(xué)院;南京郵電大學(xué)通達(dá)學(xué)院;
【基金】:江蘇省自然科學(xué)基金(No.BK20150868) 江蘇省交通運(yùn)輸與安全保障重點(diǎn)實(shí)驗(yàn)室開放課題(No.TTS201502) 江蘇省無(wú)線傳感網(wǎng)高技術(shù)研究重點(diǎn)實(shí)驗(yàn)室開放課題(No.WSNLBZY201505) 南京郵電大學(xué)引進(jìn)人才科研啟動(dòng)基金(No.NY214013);南京郵電大學(xué)通達(dá)學(xué)院大學(xué)生科技創(chuàng)新訓(xùn)練計(jì)劃STITP(No.201513989010Y)
【分類號(hào)】:TP311.13
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 薛安榮;姚林;鞠時(shí)光;陳偉鶴;馬漢達(dá);;離群點(diǎn)挖掘方法綜述[J];計(jì)算機(jī)科學(xué);2008年11期
2 李存華;;l_∞度量意義下的離群點(diǎn)檢測(cè)[J];淮海工學(xué)院學(xué)報(bào)(自然科學(xué)版);2008年02期
3 李昕;顏學(xué)峰;;融合離群點(diǎn)判別的穩(wěn)態(tài)檢測(cè)方法及其應(yīng)用[J];華東理工大學(xué)學(xué)報(bào)(自然科學(xué)版);2009年01期
4 封海岳;薛安榮;;基于重疊模塊度的社區(qū)離群點(diǎn)檢測(cè)[J];計(jì)算機(jī)應(yīng)用與軟件;2013年05期
5 王柏鈞,王力勤;《穩(wěn)健回歸與離群點(diǎn)檢測(cè)》介紹[J];成都?xì)庀髮W(xué)院學(xué)報(bào);1989年04期
6 黃添強(qiáng);秦小麟;葉飛躍;;基于方形鄰域的離群點(diǎn)查找新方法[J];控制與決策;2006年05期
7 熊君麗;;高維空間下基于密度的離群點(diǎn)探測(cè)算法實(shí)現(xiàn)[J];現(xiàn)代電子技術(shù);2006年15期
8 黃添強(qiáng);秦小麟;王欽敏;;空間離群點(diǎn)的模型與跳躍取樣查找算法[J];中國(guó)圖象圖形學(xué)報(bào);2006年09期
9 陳光平;葉東毅;;一種改進(jìn)的離群點(diǎn)檢測(cè)方法[J];福州大學(xué)學(xué)報(bào)(自然科學(xué)版);2007年03期
10 薛安榮;鞠時(shí)光;;基于空間約束的離群點(diǎn)挖掘[J];計(jì)算機(jī)科學(xué);2007年06期
相關(guān)會(huì)議論文 前9條
1 張鋒;常會(huì)友;;茫然第三方支持的隱私保持離群點(diǎn)探測(cè)協(xié)議[A];第二十四屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2007年
2 連鳳娜;吳錦林;薛永生;;一種改進(jìn)的基于距離的離群挖掘算法[A];第二十四屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2007年
3 梁雪琴;劉紅生;代秀梅;周亞芬;;聚類離群點(diǎn)挖掘技術(shù)在內(nèi)部審計(jì)信息化中的應(yīng)用——一個(gè)來(lái)自商業(yè)銀行信用卡審計(jì)的實(shí)例[A];全國(guó)內(nèi)部審計(jì)理論研討優(yōu)秀論文集(2013)[C];2014年
4 于浩;王斌;肖剛;楊曉春;;基于距離的不確定離群點(diǎn)檢測(cè)[A];第26屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(A輯)[C];2009年
5 許龍飛;熊君麗;段敏;;基于粗糙集的高維空間離群點(diǎn)發(fā)現(xiàn)算法研究[A];第二十屆全國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2003年
6 劉文遠(yuǎn);李振平;王寶文;裴繼輝;;一種多維數(shù)據(jù)的離群點(diǎn)檢測(cè)算法[A];2007年全國(guó)第十一屆企業(yè)信息化與工業(yè)工程學(xué)術(shù)會(huì)議論文集[C];2007年
7 魏藜;錢衛(wèi)寧;周傲英;;HOT:尋找高維空間中的離群點(diǎn)[A];第十八屆全國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2001年
8 周紅福;錢衛(wèi)寧;魏藜;周傲英;;EDOLOIS:高效準(zhǔn)確的子空間局部離群點(diǎn)發(fā)現(xiàn)[A];第二十屆全國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2003年
9 魏藜;錢衛(wèi)寧;周傲英;;SLOT:基于估計(jì)的高效子空間局部離群點(diǎn)發(fā)現(xiàn)[A];第十九屆全國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2002年
相關(guān)博士學(xué)位論文 前10條
1 Chitrakar Roshan;[D];武漢大學(xué);2015年
2 劉莘;基于時(shí)空分析的CCS泄漏預(yù)警關(guān)鍵技術(shù)研究[D];中國(guó)礦業(yè)大學(xué);2016年
3 楊鵬;離群檢測(cè)及其優(yōu)化算法研究[D];重慶大學(xué);2010年
4 林海;離群檢測(cè)及離群釋義空間查找算法研究[D];重慶大學(xué);2012年
5 薛安榮;空間離群點(diǎn)挖掘技術(shù)的研究[D];江蘇大學(xué);2008年
6 楊茂林;離群檢測(cè)算法研究[D];華中科技大學(xué);2012年
7 金義富;高維稀疏離群數(shù)據(jù)集延伸知識(shí)發(fā)現(xiàn)研究[D];重慶大學(xué);2007年
8 雷大江;離群檢測(cè)與離群釋義算法研究[D];重慶大學(xué);2012年
9 萬(wàn)家強(qiáng);基于連通性的離群檢測(cè)與聚類研究[D];重慶大學(xué);2014年
10 唐向紅;數(shù)據(jù)流離群點(diǎn)檢測(cè)研究[D];華中科技大學(xué);2010年
相關(guān)碩士學(xué)位論文 前10條
1 韓紅霞;基于距離離群點(diǎn)的分析與研究[D];江蘇大學(xué);2007年
2 黃馨玉;基于鄰域重心變化的離群點(diǎn)檢測(cè)算法研究[D];遼寧大學(xué);2015年
3 程百球;基于EP模式的離群點(diǎn)發(fā)現(xiàn)[D];安慶師范學(xué)院;2015年
4 歐陽(yáng)根平;Hadoop云平臺(tái)下基于離群點(diǎn)挖掘的入侵檢測(cè)技術(shù)研究[D];電子科技大學(xué);2015年
5 鄧璇;數(shù)據(jù)流挖掘關(guān)鍵技術(shù)研究與實(shí)現(xiàn)[D];電子科技大學(xué);2015年
6 周瑩瑩;利用離群點(diǎn)檢測(cè)改進(jìn)協(xié)同過(guò)濾推薦算法[D];南京郵電大學(xué);2015年
7 陳娟;基于離群特征提取和能量計(jì)算的SVM股市預(yù)測(cè)研究[D];合肥工業(yè)大學(xué);2014年
8 文靜云;基于加權(quán)自然鄰域?qū)傩院挽氐碾x群檢測(cè)研究[D];重慶大學(xué);2015年
9 梅孝輝;基于聚類的離群點(diǎn)挖掘在入侵檢測(cè)中的應(yīng)用研究[D];重慶大學(xué);2015年
10 秦浩;基于密度的局部離群點(diǎn)挖掘及在入侵檢測(cè)中應(yīng)用研究[D];大連海事大學(xué);2016年
,本文編號(hào):1617854
本文鏈接:http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/1617854.html