一種不完備混合數(shù)據(jù)集成聚類(lèi)算法
本文關(guān)鍵詞:一種不完備混合數(shù)據(jù)集成聚類(lèi)算法
更多相關(guān)文章: 集成聚類(lèi) 不完備數(shù)據(jù) 混合數(shù)據(jù) 缺失值填充 K原型聚類(lèi)算法
【摘要】:集成聚類(lèi)技術(shù)由于具有較好的泛化能力,目前引起了研究者的高度關(guān)注.已有研究主要關(guān)注數(shù)值型完備數(shù)據(jù)的集成聚類(lèi)問(wèn)題.然而,實(shí)際應(yīng)用中面臨的數(shù)據(jù)往往是兼具數(shù)值屬性和分類(lèi)屬性共同描述的混合型數(shù)據(jù),而且通常帶有缺失值.為此,針對(duì)不完備混合數(shù)據(jù)提出了一種集成聚類(lèi)算法,首先利用3種缺失值填充方法對(duì)不完備混合數(shù)據(jù)進(jìn)行完備化處理;其次在3種填充后的不同完備數(shù)據(jù)集上分別多次執(zhí)行K-Prototypes算法產(chǎn)生基聚類(lèi)結(jié)果;最后對(duì)基聚類(lèi)結(jié)果進(jìn)行集成.在UCI真實(shí)數(shù)據(jù)集上與傳統(tǒng)聚類(lèi)算法通過(guò)實(shí)驗(yàn)進(jìn)行了比較分析,實(shí)驗(yàn)結(jié)果表明提出的算法是有效的.
【作者單位】: 山西大學(xué)計(jì)算機(jī)與信息技術(shù)學(xué)院;計(jì)算智能與中文信息處理教育部重點(diǎn)實(shí)驗(yàn)室(山西大學(xué));
【關(guān)鍵詞】: 集成聚類(lèi) 不完備數(shù)據(jù) 混合數(shù)據(jù) 缺失值填充 K原型聚類(lèi)算法
【分類(lèi)號(hào)】:TP391
【正文快照】: 聚類(lèi)分析是針對(duì)給定的數(shù)據(jù)集,根據(jù)元素之間因此,如何針對(duì)不完備混合數(shù)據(jù)進(jìn)行集成聚類(lèi)就顯的相似性度量自動(dòng)將相似的元素劃分到同一組,使得尤為必要.得組內(nèi)的元素相似性達(dá)到最大而組間元素的相似性為了解決這一問(wèn)題,本文提出了一個(gè)基于缺失達(dá)到最小的過(guò)程.目前,聚類(lèi)分析技術(shù)已
【相似文獻(xiàn)】
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前10條
1 蔡彪;廖聞劍;彭艷兵;;Deep Web數(shù)據(jù)集成和關(guān)鍵技術(shù)綜述[A];2009年研究生學(xué)術(shù)交流會(huì)通信與信息技術(shù)論文集[C];2009年
2 許國(guó)艷;王志堅(jiān);;基于主動(dòng)服務(wù)的領(lǐng)域數(shù)據(jù)集成研究[A];2008年全國(guó)開(kāi)放式分布與并行計(jì)算機(jī)學(xué)術(shù)會(huì)議論文集(上冊(cè))[C];2008年
3 胥永康;吳志杰;席傳裕;岳筱玲;;基于數(shù)據(jù)拆分的數(shù)據(jù)集成技術(shù)研究[A];2005全國(guó)計(jì)算機(jī)程序設(shè)計(jì)類(lèi)課程教學(xué)研討會(huì)論文集[C];2005年
4 李宗華;肖道綱;彭明軍;;數(shù)字武漢空間基礎(chǔ)數(shù)據(jù)集成建庫(kù)及應(yīng)用[A];堅(jiān)持科學(xué)發(fā)展觀(guān) 推進(jìn)自主創(chuàng)新 促進(jìn)國(guó)家創(chuàng)新型城市建設(shè)——武漢市第二屆學(xué)術(shù)年會(huì)論文集[C];2006年
5 喬慧捷;趙海軍;紀(jì)力強(qiáng);;生物多樣性數(shù)據(jù)集成模式初探[A];第五屆全國(guó)生物多樣性保護(hù)與持續(xù)利用研討會(huì)論文摘要集[C];2002年
6 張壽明;張?jiān)粕?向風(fēng)紅;繆爾康;;異構(gòu)設(shè)備數(shù)據(jù)集成實(shí)踐[A];中國(guó)自動(dòng)化學(xué)會(huì)全國(guó)第九屆自動(dòng)化新技術(shù)學(xué)術(shù)交流會(huì)論文集[C];2004年
7 張德欽;饒克鋒;顧進(jìn)廣;;基于語(yǔ)義的工業(yè)聯(lián)合體數(shù)據(jù)集成機(jī)制[A];全國(guó)冶金自動(dòng)化信息網(wǎng)2014年會(huì)論文集[C];2014年
8 劉靖;劉江寧;;數(shù)據(jù)集成體系架構(gòu)及其實(shí)現(xiàn)框架研究[A];山東省計(jì)算機(jī)學(xué)會(huì)2005年信息技術(shù)與信息化研討會(huì)論文集(二)[C];2005年
9 李宗華;彭明軍;;規(guī)劃國(guó)土資源管理空間數(shù)據(jù)集成應(yīng)用與運(yùn)行機(jī)制探討[A];2004城市規(guī)劃年會(huì)論文集(下)[C];2004年
10 祝曉紅;劉煒;李俊麗;;用WPF進(jìn)行復(fù)雜數(shù)據(jù)集成的方法研究[A];第二十七屆中國(guó)控制會(huì)議論文集[C];2008年
中國(guó)重要報(bào)紙全文數(shù)據(jù)庫(kù) 前10條
1 于翔;集成即服務(wù):面向云的數(shù)據(jù)集成[N];網(wǎng)絡(luò)世界;2009年
2 鄒大斌;發(fā)揮數(shù)據(jù)的最大價(jià)值[N];計(jì)算機(jī)世界;2007年
3 于翔;誰(shuí)碾碎了數(shù)據(jù)?[N];網(wǎng)絡(luò)世界;2007年
4 本報(bào)記者 于翔;數(shù)據(jù)集成驅(qū)動(dòng)企業(yè)實(shí)時(shí)創(chuàng)新[N];網(wǎng)絡(luò)世界;2010年
5 本報(bào)記者 于翔;數(shù)據(jù)集成市場(chǎng)演繹“大國(guó)崛起”[N];網(wǎng)絡(luò)世界;2010年
6 本報(bào)記者 于翔;數(shù)據(jù)集成開(kāi)啟云征程[N];網(wǎng)絡(luò)世界;2010年
7 本報(bào)記者 于翔;數(shù)據(jù)集成進(jìn)入快速成長(zhǎng)期[N];網(wǎng)絡(luò)世界;2010年
8 于翔 王翔;收復(fù)數(shù)據(jù)孤島[N];網(wǎng)絡(luò)世界;2007年
9 朱文;CIO希望攻克數(shù)據(jù)質(zhì)量關(guān)[N];計(jì)算機(jī)世界;2008年
10 呂梁市煤炭設(shè)計(jì)研究院 張萍;淺析數(shù)據(jù)集成環(huán)境下煤炭企業(yè)管理信息系統(tǒng)的構(gòu)建[N];呂梁日?qǐng)?bào);2012年
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 張燕;Web數(shù)據(jù)集成中實(shí)體演化與關(guān)聯(lián)問(wèn)題研究[D];山東大學(xué);2015年
2 鄂新華;面向服務(wù)的數(shù)據(jù)集成若干關(guān)鍵技術(shù)研究[D];北京郵電大學(xué);2015年
3 朱笑塵;異質(zhì)過(guò)程數(shù)據(jù)集成與修復(fù)[D];清華大學(xué);2015年
4 王欣;數(shù)據(jù)集成技術(shù)若干問(wèn)題的研究[D];上海交通大學(xué);2010年
5 張永新;面向Web數(shù)據(jù)集成的數(shù)據(jù)融合問(wèn)題研究[D];山東大學(xué);2012年
6 吳春明;Deep Web數(shù)據(jù)集成關(guān)鍵技術(shù)及其在農(nóng)業(yè)領(lǐng)域的應(yīng)用[D];西南大學(xué);2011年
7 魏紅雨;基于4G地學(xué)空間數(shù)據(jù)集成關(guān)鍵技術(shù)研究[D];吉林大學(xué);2014年
8 曹順良;生物學(xué)數(shù)據(jù)集成若干關(guān)鍵問(wèn)題研究[D];復(fù)旦大學(xué);2005年
9 周春英;超數(shù)據(jù)集成挖掘方法與技術(shù)研究[D];浙江大學(xué);2012年
10 陳義;面向數(shù)據(jù)集成的數(shù)據(jù)復(fù)制和查詢(xún)優(yōu)化[D];中國(guó)科學(xué)院研究生院(軟件研究所);2004年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 翟妍偉;基于聯(lián)邦的異構(gòu)數(shù)據(jù)集成與交換系統(tǒng)研究與實(shí)現(xiàn)[D];西南交通大學(xué);2015年
2 賈存鑫;鏈接數(shù)據(jù)技術(shù)在生物醫(yī)學(xué)領(lǐng)域的應(yīng)用技術(shù)研究[D];南京大學(xué);2015年
3 姜玉茹;變電站數(shù)據(jù)集成與智能化應(yīng)用研究[D];山東大學(xué);2015年
4 申亞鵬;基于用戶(hù)反饋的多源非結(jié)構(gòu)化數(shù)據(jù)集成研究[D];浙江大學(xué);2015年
5 李明;多元空間位置數(shù)據(jù)集成和服務(wù)方法研究[D];南京師范大學(xué);2015年
6 李莉;保障信息系統(tǒng)數(shù)據(jù)集成管理工具的研究與實(shí)現(xiàn)[D];西安電子科技大學(xué);2014年
7 徐U嗞,
本文編號(hào):806505
本文鏈接:http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/806505.html