一種優(yōu)化初始聚類中心的k-means算法
本文關(guān)鍵詞:一種優(yōu)化初始聚類中心的k-means算法,由筆耕文化傳播整理發(fā)布。
【摘要】:隨機選擇初始聚類中心的k-means算法易使聚類陷入局部最優(yōu)解、聚類結(jié)果不穩(wěn)定且受孤立點影響大等問題.針對這些問題,提出了一種優(yōu)化初始聚類中心的方法及孤立點排除法.該算法首先選擇距離最遠(yuǎn)的兩點加入初始化中心,再根據(jù)這兩點將原始簇分成兩個聚簇,在這兩個簇中挑選方差較大的簇按照一定的規(guī)則進行分裂直至找到k個中心,初始中心的選擇過程中用到孤立點排除法.在UCI數(shù)據(jù)集及人造含一定比例的噪音數(shù)據(jù)集下,通過實驗比較了改進算法與其他算法的優(yōu)劣.實驗表明,改進后的算法不僅受孤立點的影響小、穩(wěn)定性好而且準(zhǔn)確度也高.
【作者單位】: 上海師范大學(xué)信息與機電工程學(xué)院;
【關(guān)鍵詞】: 初始聚類中心 k-means算法 孤立點排除法 聚簇 UCI數(shù)據(jù)集
【分類號】:TP311.13
【正文快照】: 0引言聚類分析是數(shù)據(jù)挖掘研究的一項重要技術(shù),它的誕生為從大量的數(shù)據(jù)中獲取有價值的知識提供了一種有效的方法.它廣泛地應(yīng)用于文本搜索、模式識別人工智能、圖像分析等領(lǐng)域[1].常用的聚類分析方法包括基于劃分、基于層次、基于密度、基于網(wǎng)格和基于模型等算法[2].k-means是劃
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 李瑋;薛惠鋒;詹海亮;;基于劃分采樣的初始聚類中心算法[J];太原理工大學(xué)學(xué)報;2011年04期
2 孟子健;馬江洪;;一種可選初始聚類中心的改進k均值算法[J];統(tǒng)計與決策;2014年12期
3 顧洪博;張繼懷;;聚類算法初始聚類中心的優(yōu)化[J];西安工程大學(xué)學(xué)報;2010年02期
4 沈國珍;;依賴數(shù)據(jù)密度的K均值初始化調(diào)優(yōu)[J];計算機工程與應(yīng)用;2014年11期
5 王漢芝;劉振全;;一種新的確定K-均值算法初始聚類中心的方法[J];天津科技大學(xué)學(xué)報;2005年04期
6 劉峰,孫超,李斌;一種改進的C均值法初始類劃分方法[J];計算機工程與設(shè)計;2005年02期
7 謝娟英;郭文娟;謝維信;高新波;;基于樣本空間分布密度的初始聚類中心優(yōu)化K-均值算法[J];計算機應(yīng)用研究;2012年03期
8 蘇錦旗;薛惠鋒;詹海亮;;基于劃分的K-均值初始聚類中心優(yōu)化算法[J];微電子學(xué)與計算機;2009年01期
9 王賽芳;戴芳;王萬斌;張曉宇;;基于初始聚類中心優(yōu)化的K-均值算法[J];計算機工程與科學(xué);2010年10期
10 韓凌波;王強;蔣正鋒;郝志強;;一種改進的k-means初始聚類中心選取算法[J];計算機工程與應(yīng)用;2010年17期
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前1條
1 張永晶;初始聚類中心優(yōu)化的K-means改進算法[D];東北師范大學(xué);2013年
本文關(guān)鍵詞:一種優(yōu)化初始聚類中心的k-means算法,,由筆耕文化傳播整理發(fā)布。
本文編號:458780
本文鏈接:http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/458780.html