天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 軟件論文 >

一種適用于高維非線性特征數(shù)據(jù)的聚類算法及應(yīng)用

發(fā)布時(shí)間:2018-07-20 17:14
【摘要】:針對(duì)高維數(shù)據(jù)聚類分析中數(shù)據(jù)之間具有多種非線性特征關(guān)系,導(dǎo)致數(shù)據(jù)分布不均、傳統(tǒng)相似性度量失效及結(jié)果類中心難以精準(zhǔn)表征等問(wèn)題,提出了一種基于核主元分析(KPCA)與密度聚類(DBSCAN)的高維非線性特征數(shù)據(jù)聚類分析技術(shù)。首先,為有效提取高維數(shù)據(jù)的非線性特征,利用KPCA理論將原始數(shù)據(jù)映射到更高維數(shù)據(jù)空間,利用主元分析獲得數(shù)據(jù)變化的方向集合,并進(jìn)行降維分析;然后,通過(guò)重新定義數(shù)據(jù)樣本在主元空間的相似性距離對(duì)傳統(tǒng)DBSCAN聚類方法進(jìn)行改進(jìn),并利用3δ統(tǒng)計(jì)理論對(duì)各簇中心的進(jìn)行表征,從而實(shí)現(xiàn)高維數(shù)據(jù)的精確分類與類中心知識(shí)表達(dá)。以實(shí)際高血壓患者群體聚類問(wèn)題為例對(duì)方法進(jìn)行了有效性驗(yàn)證,實(shí)驗(yàn)表明,所提方法可以有效獲取原始數(shù)據(jù)的非線性特征,實(shí)現(xiàn)患者個(gè)體特征群體的有效劃分及簇類中心知識(shí)的表達(dá),解決傳統(tǒng)DBSCAN聚類方法對(duì)高維數(shù)據(jù)不適用的問(wèn)題。
[Abstract]:In high dimensional data clustering analysis, there are many nonlinear feature relationships between the data, which lead to uneven distribution of data, failure of traditional similarity measurement and difficulty in accurate representation of result class centers, and so on. A high dimensional nonlinear feature data clustering technique based on kernel principal component analysis (KPCA) and density clustering (DBSCAN) is proposed. Firstly, in order to extract the nonlinear features of high-dimensional data effectively, the original data is mapped to higher-dimensional data space by using KPCA theory, and the direction set of data change is obtained by principal component analysis, and then the dimensionality reduction analysis is carried out. The traditional DBSCAN clustering method is improved by redefining the similarity distance of data samples in the principal component space, and each cluster center is represented by using the 3 未 statistical theory to realize the accurate classification of high-dimensional data and the knowledge representation of the cluster center. The validity of the method is verified by taking the cluster problem of real hypertension patients as an example. The experimental results show that the proposed method can effectively obtain the nonlinear characteristics of the original data. In order to solve the problem that traditional DBSCAN clustering method is not applicable to high dimensional data, the effective division of patient individual characteristic groups and the expression of cluster center knowledge are realized.
【作者單位】: 西安交通大學(xué)機(jī)械制造系統(tǒng)工程國(guó)家重點(diǎn)實(shí)驗(yàn)室;西安交通大學(xué)第二附屬醫(yī)院;
【基金】:國(guó)家自然科學(xué)基金資助項(xiàng)目(51375375) 中央高校基本科研業(yè)務(wù)費(fèi)專項(xiàng)資金資助項(xiàng)目(xjj2014108)
【分類號(hào)】:TP311.13

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 肖化昆;;一種高維數(shù)據(jù)類模板的設(shè)計(jì)方法與應(yīng)用[J];計(jì)算機(jī)科學(xué);2006年08期

2 賀玲;蔡益朝;楊征;;高維數(shù)據(jù)空間的一種網(wǎng)格劃分方法[J];計(jì)算機(jī)工程與應(yīng)用;2011年05期

3 何進(jìn)榮;丁立新;胡慶輝;李照奎;;高維數(shù)據(jù)空間的性質(zhì)及度量選擇[J];計(jì)算機(jī)科學(xué);2014年03期

4 劉洪波,王秀坤,趙晶;高維數(shù)據(jù)空間金字塔技術(shù)研究[J];計(jì)算機(jī)工程與應(yīng)用;2003年16期

5 沈萍;;高維數(shù)據(jù)挖掘技術(shù)研究[J];電腦知識(shí)與技術(shù);2009年06期

6 謝楓平;;聚類分析中的高維數(shù)據(jù)降維方法研究[J];閩西職業(yè)技術(shù)學(xué)院學(xué)報(bào);2009年04期

7 余元輝;鄧瑩;;一種新的高維數(shù)據(jù)聚類自適應(yīng)算法的研究[J];沈陽(yáng)化工大學(xué)學(xué)報(bào);2010年02期

8 王寅峰;劉昊;狄盛;胡昊宇;;一種支持高維數(shù)據(jù)查詢的并行索引機(jī)制[J];華中科技大學(xué)學(xué)報(bào)(自然科學(xué)版);2011年S1期

9 周勇;盧曉偉;程春田;;非規(guī)則流中高維數(shù)據(jù)流典型相關(guān)性分析并行計(jì)算方法[J];軟件學(xué)報(bào);2012年05期

10 王素芳;;基于組件的高維數(shù)據(jù)降維方法研究[J];電腦與電信;2012年10期

相關(guān)會(huì)議論文 前5條

1 周煜人;彭輝;桂衛(wèi)華;;基于映射的高維數(shù)據(jù)聚類方法[A];04'中國(guó)企業(yè)自動(dòng)化和信息化建設(shè)論壇暨中南六省區(qū)自動(dòng)化學(xué)會(huì)學(xué)術(shù)年會(huì)專輯[C];2004年

2 梁俊杰;楊澤新;馮玉才;;大規(guī)模高維數(shù)據(jù)庫(kù)索引結(jié)構(gòu)[A];第二十三屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2006年

3 陳冠華;馬秀莉;楊冬青;唐世渭;帥猛;;面向高維數(shù)據(jù)的低冗余Top-k異常點(diǎn)發(fā)現(xiàn)方法[A];第26屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(A輯)[C];2009年

4 劉運(yùn)濤;鮑玉斌;吳丹;冷芳玲;孫煥良;于戈;;CBFrag-Cubing:一種基于壓縮位圖的高維數(shù)據(jù)立方創(chuàng)建算法(英文)[A];第二十二屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2005年

5 甘俊英;張有為;;核主元分析特征提取法的研究[A];第十一屆全國(guó)信號(hào)處理學(xué)術(shù)年會(huì)(CCSP-2003)論文集[C];2003年

相關(guān)博士學(xué)位論文 前10條

1 黃曉輝;高維數(shù)據(jù)的若干聚類問(wèn)題及算法研究[D];哈爾濱工業(yè)大學(xué);2015年

2 楊崇;高維數(shù)據(jù)流上的K近鄰問(wèn)題研究[D];山東大學(xué);2016年

3 徐微微;高維數(shù)據(jù)降維可視化研究及其在生物醫(yī)學(xué)中的應(yīng)用[D];武漢大學(xué);2016年

4 楊風(fēng)召;高維數(shù)據(jù)挖掘中若干關(guān)鍵問(wèn)題的研究[D];復(fù)旦大學(xué);2003年

5 陳黎飛;高維數(shù)據(jù)的聚類方法研究與應(yīng)用[D];廈門大學(xué);2008年

6 吳慶耀;高維數(shù)據(jù)的若干分類問(wèn)題及算法研究[D];哈爾濱工業(yè)大學(xué);2013年

7 樓巍;面向大數(shù)據(jù)的高維數(shù)據(jù)挖掘技術(shù)研究[D];上海大學(xué);2013年

8 黃健美;高維數(shù)據(jù)索引及其查詢處理技術(shù)研究[D];東北大學(xué);2009年

9 董道國(guó);高維數(shù)據(jù)索引結(jié)構(gòu)研究[D];復(fù)旦大學(xué);2005年

10 劉翠響;人臉識(shí)別中高維數(shù)據(jù)特征分析[D];河北工業(yè)大學(xué);2008年

相關(guān)碩士學(xué)位論文 前10條

1 沈江炎;基于軟子空間的高維數(shù)據(jù)樹(shù)形索引研究[D];昆明理工大學(xué);2015年

2 侯小麗;高維數(shù)據(jù)聚類中的神經(jīng)網(wǎng)絡(luò)降維方法研究[D];蘭州大學(xué);2015年

3 何熒;高維數(shù)據(jù)下的特征選擇與聚類方法研究[D];西南大學(xué);2015年

4 胡昌杰;基于Autoencoder的高維數(shù)據(jù)降維方法研究[D];蘭州大學(xué);2015年

5 楊代君;基于進(jìn)化算法的高維數(shù)據(jù)聚類研究[D];西安電子科技大學(xué);2014年

6 楊庭庭;基于信息熵的高維數(shù)據(jù)流聚類及其應(yīng)用研究[D];重慶交通大學(xué);2015年

7 孫喜利;高維數(shù)據(jù)的降維及聚類方法研究[D];蘭州大學(xué);2016年

8 黃青君;基于稀疏子空間的高維數(shù)據(jù)聚類關(guān)鍵技術(shù)研究與應(yīng)用[D];電子科技大學(xué);2016年

9 劉建環(huán);面向高維數(shù)據(jù)降維與分類的深度模型構(gòu)建方法研究[D];重慶大學(xué);2016年

10 孫志鵬;高維數(shù)據(jù)聚類算法的研究及應(yīng)用[D];江南大學(xué);2017年

,

本文編號(hào):2134201

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/2134201.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶8a20e***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com