基于核心點的大數(shù)據(jù)譜聚類算法
本文關鍵詞:基于核心點的大數(shù)據(jù)譜聚類算法
更多相關文章: 大數(shù)據(jù) 譜聚類 核心點 數(shù)據(jù)分組
【摘要】:針對譜聚類性能優(yōu)異但因計算復雜度太高而無法應用于大數(shù)據(jù)的問題,提出一種將譜聚類應用于大數(shù)據(jù)的新算法.首先,基于數(shù)據(jù)相似性與隨機抽樣選取核心點集,并利用核心集對大數(shù)據(jù)分組;然后在核心集上應用譜聚類;最后綜合核心集的聚類結果和數(shù)據(jù)的分組信息完成大數(shù)據(jù)聚類.該算法既將譜聚類推廣到大數(shù)據(jù),又通過核心點選取降低了噪聲及異常數(shù)據(jù)的影響.實驗充分驗證了推廣后的譜聚類應用于大數(shù)據(jù)的高效性.
【作者單位】: 南京航空航天大學理學院;
【分類號】:TP311.13
【正文快照】: 0引言聚類是一種強有力的數(shù)據(jù)分析工具,它將相似的數(shù)據(jù)劃分到同一類,無監(jiān)督地完成數(shù)據(jù)的分組處理,對數(shù)據(jù)集的進一步分析和處理具有重要意義[1-3].作為目前聚類算法的研究熱點之一,譜聚類算法[4]相比傳統(tǒng)的聚類算法(如K-means[5-6]和層次聚類[2]等)具有明顯優(yōu)勢,它可以處理任意
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 王娜;杜海峰;莊健;余進濤;王孫安;;三種典型的基于圖分割的譜聚類方法比較[J];系統(tǒng)仿真學報;2009年11期
2 王會青;陳俊杰;;基于圖劃分的譜聚類方法的研究[J];計算機工程與設計;2011年01期
3 王春騰;符傳誼;邢潔清;;基于非負約束的譜聚類方法[J];電腦知識與技術;2011年17期
4 何飛;王曉晨;馬粹;梁治國;;生產(chǎn)狀態(tài)的測地距離譜聚類分析[J];計算機工程與應用;2012年24期
5 薛寧靜;;生產(chǎn)狀態(tài)的熵值評估譜聚類分析[J];計算機工程與應用;2012年19期
6 管濤;王杰;;譜聚類的算子理論研究進展[J];計算機科學;2013年S1期
7 周文剛;陳雷霆;董仕;;基于譜聚類的網(wǎng)絡流量分類識別算法[J];電子測量與儀器學報;2013年12期
8 王玲;薄列峰;焦李成;;密度敏感的半監(jiān)督譜聚類[J];軟件學報;2007年10期
9 林立;胡俠;朱俊彥;;基于譜聚類的多文檔摘要新方法[J];計算機工程;2010年22期
10 劉馨月;李靜偉;于紅;尤全增;林鴻飛;;基于共享近鄰的自適應譜聚類[J];小型微型計算機系統(tǒng);2011年09期
中國博士學位論文全文數(shù)據(jù)庫 前1條
1 孔敏;關聯(lián)圖的譜分析及譜聚類方法研究[D];安徽大學;2006年
中國碩士學位論文全文數(shù)據(jù)庫 前10條
1 陳昭彤;基于拓撲勢和譜聚類的社區(qū)發(fā)現(xiàn)研究[D];中國礦業(yè)大學;2015年
2 張吉文;基于譜聚類的文本聚類算法研究[D];貴州大學;2015年
3 李偉龍;基于面向對象SVM和譜聚類的極化SAR分類[D];西安電子科技大學;2014年
4 崔竹冬;基于譜聚類的三維血管點云分割技術研究[D];哈爾濱工業(yè)大學;2016年
5 崔海玉;基于譜聚類的域間社區(qū)挖掘算法研究[D];大連海事大學;2016年
6 付剛;基于譜聚類的混合流形學習算法研究[D];安徽理工大學;2016年
7 林珍香;基于譜聚類的個性化推薦系統(tǒng)研究[D];福建農林大學;2016年
8 何心琪;基于譜聚類的水聲圖像分割技術研究[D];哈爾濱工程大學;2013年
9 趙冬琴;基于譜聚類的MCI影像學分類特征研究與應用[D];太原理工大學;2014年
10 張俊英;基于譜聚類的圖書目錄重構[D];浙江大學;2010年
,本文編號:1295171
本文鏈接:http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/1295171.html