一種面向大數(shù)據(jù)的快速自動聚類算法
發(fā)布時間:2018-08-26 08:08
【摘要】:針對大數(shù)據(jù)環(huán)境下高維數(shù)據(jù)聚類速度慢、準確率低的問題,提出了一種面向大數(shù)據(jù)的快速自動聚類算法(FACABD)。FACABD聚類算法利用譜聚類算法對大數(shù)據(jù)集進行歸一化和列降維,提出了一種新的快速區(qū)域進化的粒子群算法(FRE-PSO),并利用該算法進行行降維;然后在行列降維的基礎上,引入聚類模糊隸屬度基數(shù),自動發(fā)現(xiàn)簇的數(shù)目,根據(jù)類簇數(shù)目,采用FRE-PSO算法結(jié)合模糊聚類算法,實現(xiàn)了快速自動聚類。在多個不同數(shù)據(jù)集上的實驗結(jié)果表明,該算法能夠在數(shù)據(jù)驅(qū)動下快速自動聚類,與其他聚類算法相比,有效地提高了運行速度和精度。
[Abstract]:Aiming at the problem of low accuracy and low speed of high-dimensional data clustering under big data environment, a fast automatic clustering algorithm (FACABD) .FACABD for big data is proposed. In this paper, a new fast region evolution particle swarm optimization algorithm (FRE-PSO) is proposed, and the row dimension is reduced by using this algorithm, and then, based on the reduction of column and column dimension, the fuzzy membership degree is introduced to automatically find the number of clusters, and according to the number of clusters, the number of clusters is automatically discovered. FRE-PSO algorithm combined with fuzzy clustering algorithm is used to realize fast automatic clustering. The experimental results on several different data sets show that the proposed algorithm can quickly and automatically cluster under the driving of data. Compared with other clustering algorithms, the algorithm can effectively improve the running speed and precision.
【作者單位】: 南陽理工學院計算機與信息工程學院;濟源職業(yè)技術學院;南通大學計算機科學與技術學院;
【基金】:國家自然科學基金資助項目(61402244)
【分類號】:TP18;TP311.13
本文編號:2204253
[Abstract]:Aiming at the problem of low accuracy and low speed of high-dimensional data clustering under big data environment, a fast automatic clustering algorithm (FACABD) .FACABD for big data is proposed. In this paper, a new fast region evolution particle swarm optimization algorithm (FRE-PSO) is proposed, and the row dimension is reduced by using this algorithm, and then, based on the reduction of column and column dimension, the fuzzy membership degree is introduced to automatically find the number of clusters, and according to the number of clusters, the number of clusters is automatically discovered. FRE-PSO algorithm combined with fuzzy clustering algorithm is used to realize fast automatic clustering. The experimental results on several different data sets show that the proposed algorithm can quickly and automatically cluster under the driving of data. Compared with other clustering algorithms, the algorithm can effectively improve the running speed and precision.
【作者單位】: 南陽理工學院計算機與信息工程學院;濟源職業(yè)技術學院;南通大學計算機科學與技術學院;
【基金】:國家自然科學基金資助項目(61402244)
【分類號】:TP18;TP311.13
【相似文獻】
相關期刊論文 前8條
1 陳瑜;唐常杰;葉尚玉;李川;姜鑰;劉齊宏;;基于基因表達式編程的自動聚類方法[J];四川大學學報(工程科學版);2007年06期
2 周勇;;基于不可分辨關系的文本自動聚類[J];計算機系統(tǒng)應用;2012年12期
3 王舵;郄君;張娟;李文斌;;一種快速詞自動聚類算法[J];計算機應用與軟件;2010年08期
4 孫靜,朱杰,徐向華;一種新的中文詞自動聚類算法[J];上海交通大學學報;2003年S2期
5 崔尚卿;馬秀莉;唐世渭;王文清;;基于不均勻密度的自動聚類算法[J];計算機工程;2008年23期
6 王沖鑏;趙旭;鄒毅;劉允才;;基于軌跡片段自動聚類的密集場景運動模式分析(英文)[J];中國通信;2013年04期
7 常娥;;基于LSI理論的文本自動聚類研究[J];圖書情報工作;2012年11期
8 鄧健爽;鄭啟倫;彭宏;鄧維維;;基于搜索引擎的關鍵詞自動聚類法[J];計算機科學;2007年03期
相關碩士學位論文 前3條
1 張彥儒;基于量子粒子群優(yōu)化的自動聚類算法研究[D];西安電子科技大學;2013年
2 馬亞娟;基于人工免疫系統(tǒng)的自動聚類算法及其應用[D];西安電子科技大學;2012年
3 劉大剛;基于CUDA和GEP的并行自動聚類算法[D];福建師范大學;2014年
,本文編號:2204253
本文鏈接:http://www.sikaile.net/kejilunwen/zidonghuakongzhilunwen/2204253.html
最近更新
教材專著