快速搜索與發(fā)現(xiàn)密度峰值聚類算法的優(yōu)化研究
發(fā)布時間:2017-09-28 05:38
本文關(guān)鍵詞:快速搜索與發(fā)現(xiàn)密度峰值聚類算法的優(yōu)化研究
更多相關(guān)文章: 聚類 密度峰值 近鄰距離曲線 類合并
【摘要】:CFSFDP是基于密度的新聚類算法,可聚類非球形數(shù)據(jù)集,具有聚類速度快、實現(xiàn)簡單等優(yōu)點。CFSFDP需人工嘗試確定密度閾值dc,且對一個類中存在多密度峰值的數(shù)據(jù)無法進行準確聚類。為解決該缺點,提出基于近鄰距離曲線和類合并優(yōu)化CFSFDP(簡稱NM-CFSFDP)的聚類算法。算法用近鄰距離曲線變化情況自動確定密度閾值dc,采用確定dc的CFSFDP對數(shù)據(jù)聚類,并利用計算dc值的方法指導類的合并,引入內(nèi)聚程度衡量參數(shù)解決了類合并后不能撤銷的難題,從而實現(xiàn)對多密度峰值數(shù)據(jù)的正確聚類。通過實驗對比,NM-CFSFDP算法確實比CFSFDP算法具有更加精確的聚類效果。
【作者單位】: 中國礦業(yè)大學計算機科學與技術(shù)學院;常熟理工學院計算機科學與工程學院;重慶大學計算機科學與技術(shù)學院;
【關(guān)鍵詞】: 聚類 密度峰值 近鄰距離曲線 類合并
【基金】:國家自然科學基金資助項目(61173130)
【分類號】:TP311.13
【正文快照】: 0引言聚類分析(cluster analysis)簡稱聚類(clustering),是一個將數(shù)據(jù)對象(或觀測)劃分成子集的過程,也稱做無監(jiān)督分類。聚類分析已經(jīng)廣泛用于許多領(lǐng)域[1],許多不同的聚類策略被提出,但都具有非一致性的缺點。K-means和K-中心點算法,數(shù)據(jù)點通常分配到最近距離中心點,該類方法
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前1條
1 陰晉嶺;;解決詞義分類合并問題的一種方法[J];中國科教創(chuàng)新導刊;2009年02期
,本文編號:934098
本文鏈接:http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/934098.html
最近更新
教材專著