一種適用于高維非線性特征數(shù)據(jù)的聚類算法及應(yīng)用
[Abstract]:In high dimensional data clustering analysis, there are many nonlinear feature relationships between the data, which lead to uneven distribution of data, failure of traditional similarity measurement and difficulty in accurate representation of result class centers, and so on. A high dimensional nonlinear feature data clustering technique based on kernel principal component analysis (KPCA) and density clustering (DBSCAN) is proposed. Firstly, in order to extract the nonlinear features of high-dimensional data effectively, the original data is mapped to higher-dimensional data space by using KPCA theory, and the direction set of data change is obtained by principal component analysis, and then the dimensionality reduction analysis is carried out. The traditional DBSCAN clustering method is improved by redefining the similarity distance of data samples in the principal component space, and each cluster center is represented by using the 3 未 statistical theory to realize the accurate classification of high-dimensional data and the knowledge representation of the cluster center. The validity of the method is verified by taking the cluster problem of real hypertension patients as an example. The experimental results show that the proposed method can effectively obtain the nonlinear characteristics of the original data. In order to solve the problem that traditional DBSCAN clustering method is not applicable to high dimensional data, the effective division of patient individual characteristic groups and the expression of cluster center knowledge are realized.
【作者單位】: 西安交通大學(xué)機(jī)械制造系統(tǒng)工程國(guó)家重點(diǎn)實(shí)驗(yàn)室;西安交通大學(xué)第二附屬醫(yī)院;
【基金】:國(guó)家自然科學(xué)基金資助項(xiàng)目(51375375) 中央高校基本科研業(yè)務(wù)費(fèi)專項(xiàng)資金資助項(xiàng)目(xjj2014108)
【分類號(hào)】:TP311.13
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 肖化昆;;一種高維數(shù)據(jù)類模板的設(shè)計(jì)方法與應(yīng)用[J];計(jì)算機(jī)科學(xué);2006年08期
2 賀玲;蔡益朝;楊征;;高維數(shù)據(jù)空間的一種網(wǎng)格劃分方法[J];計(jì)算機(jī)工程與應(yīng)用;2011年05期
3 何進(jìn)榮;丁立新;胡慶輝;李照奎;;高維數(shù)據(jù)空間的性質(zhì)及度量選擇[J];計(jì)算機(jī)科學(xué);2014年03期
4 劉洪波,王秀坤,趙晶;高維數(shù)據(jù)空間金字塔技術(shù)研究[J];計(jì)算機(jī)工程與應(yīng)用;2003年16期
5 沈萍;;高維數(shù)據(jù)挖掘技術(shù)研究[J];電腦知識(shí)與技術(shù);2009年06期
6 謝楓平;;聚類分析中的高維數(shù)據(jù)降維方法研究[J];閩西職業(yè)技術(shù)學(xué)院學(xué)報(bào);2009年04期
7 余元輝;鄧瑩;;一種新的高維數(shù)據(jù)聚類自適應(yīng)算法的研究[J];沈陽(yáng)化工大學(xué)學(xué)報(bào);2010年02期
8 王寅峰;劉昊;狄盛;胡昊宇;;一種支持高維數(shù)據(jù)查詢的并行索引機(jī)制[J];華中科技大學(xué)學(xué)報(bào)(自然科學(xué)版);2011年S1期
9 周勇;盧曉偉;程春田;;非規(guī)則流中高維數(shù)據(jù)流典型相關(guān)性分析并行計(jì)算方法[J];軟件學(xué)報(bào);2012年05期
10 王素芳;;基于組件的高維數(shù)據(jù)降維方法研究[J];電腦與電信;2012年10期
相關(guān)會(huì)議論文 前5條
1 周煜人;彭輝;桂衛(wèi)華;;基于映射的高維數(shù)據(jù)聚類方法[A];04'中國(guó)企業(yè)自動(dòng)化和信息化建設(shè)論壇暨中南六省區(qū)自動(dòng)化學(xué)會(huì)學(xué)術(shù)年會(huì)專輯[C];2004年
2 梁俊杰;楊澤新;馮玉才;;大規(guī)模高維數(shù)據(jù)庫(kù)索引結(jié)構(gòu)[A];第二十三屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2006年
3 陳冠華;馬秀莉;楊冬青;唐世渭;帥猛;;面向高維數(shù)據(jù)的低冗余Top-k異常點(diǎn)發(fā)現(xiàn)方法[A];第26屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(A輯)[C];2009年
4 劉運(yùn)濤;鮑玉斌;吳丹;冷芳玲;孫煥良;于戈;;CBFrag-Cubing:一種基于壓縮位圖的高維數(shù)據(jù)立方創(chuàng)建算法(英文)[A];第二十二屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2005年
5 甘俊英;張有為;;核主元分析特征提取法的研究[A];第十一屆全國(guó)信號(hào)處理學(xué)術(shù)年會(huì)(CCSP-2003)論文集[C];2003年
相關(guān)博士學(xué)位論文 前10條
1 黃曉輝;高維數(shù)據(jù)的若干聚類問(wèn)題及算法研究[D];哈爾濱工業(yè)大學(xué);2015年
2 楊崇;高維數(shù)據(jù)流上的K近鄰問(wèn)題研究[D];山東大學(xué);2016年
3 徐微微;高維數(shù)據(jù)降維可視化研究及其在生物醫(yī)學(xué)中的應(yīng)用[D];武漢大學(xué);2016年
4 楊風(fēng)召;高維數(shù)據(jù)挖掘中若干關(guān)鍵問(wèn)題的研究[D];復(fù)旦大學(xué);2003年
5 陳黎飛;高維數(shù)據(jù)的聚類方法研究與應(yīng)用[D];廈門大學(xué);2008年
6 吳慶耀;高維數(shù)據(jù)的若干分類問(wèn)題及算法研究[D];哈爾濱工業(yè)大學(xué);2013年
7 樓巍;面向大數(shù)據(jù)的高維數(shù)據(jù)挖掘技術(shù)研究[D];上海大學(xué);2013年
8 黃健美;高維數(shù)據(jù)索引及其查詢處理技術(shù)研究[D];東北大學(xué);2009年
9 董道國(guó);高維數(shù)據(jù)索引結(jié)構(gòu)研究[D];復(fù)旦大學(xué);2005年
10 劉翠響;人臉識(shí)別中高維數(shù)據(jù)特征分析[D];河北工業(yè)大學(xué);2008年
相關(guān)碩士學(xué)位論文 前10條
1 沈江炎;基于軟子空間的高維數(shù)據(jù)樹(shù)形索引研究[D];昆明理工大學(xué);2015年
2 侯小麗;高維數(shù)據(jù)聚類中的神經(jīng)網(wǎng)絡(luò)降維方法研究[D];蘭州大學(xué);2015年
3 何熒;高維數(shù)據(jù)下的特征選擇與聚類方法研究[D];西南大學(xué);2015年
4 胡昌杰;基于Autoencoder的高維數(shù)據(jù)降維方法研究[D];蘭州大學(xué);2015年
5 楊代君;基于進(jìn)化算法的高維數(shù)據(jù)聚類研究[D];西安電子科技大學(xué);2014年
6 楊庭庭;基于信息熵的高維數(shù)據(jù)流聚類及其應(yīng)用研究[D];重慶交通大學(xué);2015年
7 孫喜利;高維數(shù)據(jù)的降維及聚類方法研究[D];蘭州大學(xué);2016年
8 黃青君;基于稀疏子空間的高維數(shù)據(jù)聚類關(guān)鍵技術(shù)研究與應(yīng)用[D];電子科技大學(xué);2016年
9 劉建環(huán);面向高維數(shù)據(jù)降維與分類的深度模型構(gòu)建方法研究[D];重慶大學(xué);2016年
10 孫志鵬;高維數(shù)據(jù)聚類算法的研究及應(yīng)用[D];江南大學(xué);2017年
,本文編號(hào):2134201
本文鏈接:http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/2134201.html