基于模糊聚類和粗糙集的連續(xù)值屬性約簡(jiǎn)研究
本文關(guān)鍵詞:基于模糊聚類和粗糙集的連續(xù)值屬性約簡(jiǎn)研究
更多相關(guān)文章: 模糊聚類 粗糙集 屬性約簡(jiǎn) 連續(xù)值決策表
【摘要】:屬性約簡(jiǎn)是粗糙集理論的研究熱點(diǎn)之一,它是一種保證屬性分類能力不變的前提下,剔除冗余屬性的過(guò)程。通過(guò)屬性約簡(jiǎn),可以實(shí)現(xiàn)數(shù)據(jù)表的列壓縮,從而降低數(shù)據(jù)挖掘的數(shù)據(jù)量,提升挖掘效率。目前基于粗糙集的屬性約簡(jiǎn)算法多數(shù)只適用于離散型數(shù)據(jù)。然而,在現(xiàn)實(shí)工作中,不僅有符號(hào)、類別等離散型數(shù)據(jù),更有大量的連續(xù)型數(shù)據(jù),甚至二者的混合。因此,在粗糙集屬性約簡(jiǎn)算法的應(yīng)用中,通常先對(duì)連續(xù)數(shù)據(jù)進(jìn)行離散化處理。然而,離散化處理過(guò)程難以保存屬性在數(shù)值上的差異,難免造成一定程度的信息損失。因此本文深入研究以往文獻(xiàn),提出了一種基于模糊聚類和粗糙集的連續(xù)值屬性約簡(jiǎn)算法。基于模糊聚類和粗糙集的連續(xù)值屬性約簡(jiǎn)算法主要分為兩個(gè)部分:第一部分,引入模糊聚類,將屬性值上的模糊性轉(zhuǎn)化為對(duì)象關(guān)系的模糊性,并以此得到論域?qū)ο蟮膭澐?這部分相當(dāng)于粗糙集屬性約簡(jiǎn)中的等價(jià)類劃分;第二部分,同樣運(yùn)用模糊聚類,將相似度貼近的屬性聚為一類,并從每一類中選擇代表性的屬性構(gòu)成約簡(jiǎn)屬性子集,而在屬性子集的評(píng)價(jià)上,結(jié)合了粗糙集依賴度的概念。通過(guò)模糊聚類和粗糙集結(jié)合算法得到的屬性約簡(jiǎn),綜合考慮了屬性的相異性與相關(guān)性,在保證屬性信息覆蓋廣度的同時(shí),降低了約簡(jiǎn)過(guò)程的信息損失,并在依賴度概念上保持了信息系統(tǒng)的分類能力不變。區(qū)別于以往粗糙集的啟發(fā)式屬性約簡(jiǎn)算法,基于模糊聚類和粗糙集的屬性約簡(jiǎn)不需要計(jì)算核屬性,也省去了逐層逐個(gè)計(jì)算屬性重要度的過(guò)程,因而在算法上有所提升。最后通過(guò)7組UCI標(biāo)準(zhǔn)數(shù)據(jù)集以及3組經(jīng)濟(jì)金融數(shù)據(jù)的仿真實(shí)驗(yàn),表明本文提出的算法有效,并且在進(jìn)一步的決策樹分類中,基于約簡(jiǎn)屬性的預(yù)測(cè)精度多數(shù)情況下高于全部條件屬性的預(yù)測(cè)精度。
【關(guān)鍵詞】:模糊聚類 粗糙集 屬性約簡(jiǎn) 連續(xù)值決策表
【學(xué)位授予單位】:首都經(jīng)濟(jì)貿(mào)易大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:F224
【目錄】:
- 摘要4-5
- Abstract5-8
- 1 引言8-16
- 1.1 研究背景及意義8-9
- 1.2 屬性約簡(jiǎn)的研究現(xiàn)狀9-12
- 1.2.1 粗糙集理論的屬性約簡(jiǎn)9-11
- 1.2.2 模糊集理論的屬性約簡(jiǎn)11-12
- 1.3 本文的主要工作與創(chuàng)新12-14
- 1.4 本文組織結(jié)構(gòu)14-16
- 2 基于粗糙集的屬性約簡(jiǎn)算法分析16-27
- 2.1 粗糙集的理論分析16-20
- 2.1.1 粗糙集理論16-18
- 2.1.2 決策表屬性約簡(jiǎn)18-20
- 2.1.3 屬性選擇標(biāo)準(zhǔn)20
- 2.2 基于屬性重要性的啟發(fā)式屬性約簡(jiǎn)算法20-25
- 2.2.1 啟發(fā)式屬性約簡(jiǎn)算法20-21
- 2.2.2 基于Pawlak屬性重要度的屬性約簡(jiǎn)算法21
- 2.2.3 基于差別矩陣的屬性約簡(jiǎn)算法21-23
- 2.2.4 基于信息熵的屬性約簡(jiǎn)算法23-25
- 2.3 粗糙集屬性約簡(jiǎn)算法的局限性25-26
- 2.4 本章小結(jié)26-27
- 3 基于模糊聚類和粗糙集的屬性約簡(jiǎn)27-39
- 3.1 模糊集理論27-29
- 3.2 模糊聚類技術(shù)分析29-34
- 3.3 基于模糊聚類和粗糙集的屬性約簡(jiǎn)算法34-38
- 3.3.1 條件屬性的模糊聚類分析34-36
- 3.3.2 基于模糊聚類和粗糙集的屬性約簡(jiǎn)36-38
- 3.4 本章小結(jié)38-39
- 4 連續(xù)值屬性約簡(jiǎn)算法設(shè)計(jì)39-50
- 4.1 粗糙集與模糊聚類結(jié)合39-42
- 4.2 連續(xù)值屬性約簡(jiǎn)算法設(shè)計(jì)與實(shí)現(xiàn)42-49
- 4.2.1 基于模糊聚類和粗糙集的連續(xù)型決策表對(duì)象離散化43-44
- 4.2.2 基于模糊聚類和粗糙集的連續(xù)值屬性約簡(jiǎn)44-49
- 4.3 本章小結(jié)49-50
- 5 仿真實(shí)驗(yàn)及分析50-55
- 5.1 數(shù)據(jù)準(zhǔn)備與參數(shù)設(shè)定50-51
- 5.2 實(shí)驗(yàn)結(jié)果分析51-54
- 5.3 本章小結(jié)54-55
- 6 總結(jié)與展望55-57
- 參考文獻(xiàn)57-61
- 附錄61-65
- 在學(xué)期間發(fā)表的學(xué)術(shù)論文和研究成果65-66
- 致謝66-67
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 譚耀武;;基于數(shù)據(jù)挖掘粗糙集技術(shù)的電信運(yùn)營(yíng)商客戶價(jià)值評(píng)價(jià)[J];沿海企業(yè)與科技;2006年01期
2 范霄文;郭惠英;;粗糙集理論的統(tǒng)計(jì)擴(kuò)展及應(yīng)用[J];統(tǒng)計(jì)與決策;2008年13期
3 劉昭斌;李金祥;劉文芝;;基于粗糙集的研究性學(xué)習(xí)的評(píng)價(jià)[J];管理觀察;2008年15期
4 梁如冰;蔡小娟;;粗糙集理論在水文水資源方面的應(yīng)用現(xiàn)狀及展望[J];水利科技與經(jīng)濟(jì);2009年12期
5 劉香怡;;粗糙集在教學(xué)質(zhì)量評(píng)價(jià)中的應(yīng)用[J];中國(guó)管理信息化;2011年22期
6 于迎春;;覆蓋粗糙集中基于信息熵的幾個(gè)定義[J];商業(yè)文化(下半月);2012年02期
7 梁第;張銘麗;鄧偉;;粗糙集理論與其他理論結(jié)合的研究[J];山東省農(nóng)業(yè)管理干部學(xué)院學(xué)報(bào);2012年02期
8 呂躍進(jìn);張旭娜;韋碧鵬;;基于優(yōu)勢(shì)關(guān)系粗糙集的模糊綜合評(píng)價(jià)的權(quán)重確定[J];統(tǒng)計(jì)與決策;2012年20期
9 劉超;吳洪波;;粗糙集理論及其在管理決策中的應(yīng)用現(xiàn)狀[J];職業(yè)技術(shù);2007年12期
10 駱公志;楊曉江;;基于劃分類歸并的粗糙集屬性約簡(jiǎn)新算法[J];統(tǒng)計(jì)與決策;2009年20期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前10條
1 黎文航;陳善本;王兵;;粗糙集理論在焊接中的應(yīng)用綜述[A];第十一次全國(guó)焊接會(huì)議論文集(第2冊(cè))[C];2005年
2 尹宗成;;粗糙集理論在我國(guó)糧食產(chǎn)量預(yù)測(cè)中的應(yīng)用[A];現(xiàn)代農(nóng)業(yè)理論與實(shí)踐——安徽現(xiàn)代農(nóng)業(yè)博士科技論壇論文集[C];2007年
3 鄒剛;滕書華;孫即祥;陳森林;敖永紅;;一種粗糙集優(yōu)化協(xié)同原型模式約簡(jiǎn)分類方法[A];第十四屆全國(guó)信號(hào)處理學(xué)術(shù)年會(huì)(CCSP-2009)論文集[C];2009年
4 葛麗;傅彥;;粗糙集在科學(xué)數(shù)據(jù)屬性約簡(jiǎn)中的應(yīng)用[A];第二十一屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2004年
5 陳雪飛;;粗糙集分類中耦合數(shù)據(jù)的處理方法研究[A];2008年全國(guó)開放式分布與并行計(jì)算機(jī)學(xué)術(shù)會(huì)議論文集(上冊(cè))[C];2008年
6 肖健梅;蘆曉明;王錫淮;;集裝箱起重機(jī)防搖系統(tǒng)粗糙集控制[A];第二十六屆中國(guó)控制會(huì)議論文集[C];2007年
7 王印松;馮康;;主汽溫調(diào)節(jié)系統(tǒng)性能評(píng)價(jià)的粗糙集實(shí)現(xiàn)方法[A];第二十七屆中國(guó)控制會(huì)議論文集[C];2008年
8 王紅萍;萬(wàn)程亮;金彥豐;;應(yīng)用粗糙集理論的對(duì)抗效果權(quán)重確定方法[A];2009’中國(guó)西部地區(qū)聲學(xué)學(xué)術(shù)交流會(huì)論文集[C];2009年
9 王莉;周獻(xiàn)中;;一種基于粗糙集的模糊神經(jīng)網(wǎng)絡(luò)模型在鋼材力學(xué)性能預(yù)測(cè)中的研究[A];2009年中國(guó)智能自動(dòng)化會(huì)議論文集(第二分冊(cè))[C];2009年
10 卓明;王麗珍;譚旭;;基于粗糙集近似集擴(kuò)展的規(guī)則提取算法[A];第十七屆全國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2000年
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 馬希驁;概率粗糙集屬性約簡(jiǎn)理論及方法研究[D];西南交通大學(xué);2014年
2 唐孝;基于粗糙集的知識(shí)發(fā)現(xiàn)方法及其在ECG信號(hào)識(shí)別中的應(yīng)用[D];電子科技大學(xué);2015年
3 曾凱;鄰域;植谟(jì)算的關(guān)鍵技術(shù)研究與應(yīng)用[D];電子科技大學(xué);2015年
4 鮑忠奎;面向不確定信息系統(tǒng)的粗糙集擴(kuò)展模型研究[D];合肥工業(yè)大學(xué);2015年
5 王永生;基于粗糙集理論的動(dòng)態(tài)數(shù)據(jù)挖掘關(guān)鍵技術(shù)研究[D];北京科技大學(xué);2016年
6 薛佩軍;正負(fù)域覆蓋廣義粗糙集與知識(shí)粗傳播研究[D];山東大學(xué);2007年
7 孔芝;粗糙集理論若干問題的研究與應(yīng)用[D];東北大學(xué);2009年
8 秦中廣;基于粗糙集的交叉研究及其在中醫(yī)診斷的應(yīng)用[D];華南理工大學(xué);2002年
9 劉少輝;知識(shí)發(fā)現(xiàn)中粗糙集理論的研究[D];中國(guó)科學(xué)院研究生院(計(jì)算技術(shù)研究所);2003年
10 鄧大勇;基于粗糙集的數(shù)據(jù)約簡(jiǎn)及粗糙集擴(kuò)展模型的研究[D];北京交通大學(xué);2007年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 江飛;粗糙集神經(jīng)網(wǎng)絡(luò)故障診斷方法研究[D];西安石油大學(xué);2015年
2 何理榮;粗糙集理論在銀行信貸風(fēng)險(xiǎn)評(píng)估中的應(yīng)用研究[D];華南理工大學(xué);2015年
3 張德齊;基于粗糙集理論的電機(jī)故障診斷方法研究[D];渤海大學(xué);2015年
4 楊禮;基于粗糙集的公路交通安全預(yù)警研究[D];西南交通大學(xué);2015年
5 聶萌瑤;基于泛系串并模型的粗糙集概念擴(kuò)展與拓?fù)淇臻g[D];蘭州大學(xué);2015年
6 徐鵬;基于粗糙集的建筑起重機(jī)械安全精細(xì)化評(píng)價(jià)研究[D];西安建筑科技大學(xué);2015年
7 孫宇航;粗糙集屬性約簡(jiǎn)方法在醫(yī)療診斷中的應(yīng)用研究[D];蘇州大學(xué);2015年
8 張曼;基于粗糙集和包含度的聚類分類算法研究[D];青島理工大學(xué);2015年
9 車世遠(yuǎn);基于群搜索優(yōu)化粗糙集的腦科學(xué)數(shù)據(jù)研究[D];大連海事大學(xué);2015年
10 林哲;基于粗糙集的馬田系統(tǒng)研究及其在銀行直接營(yíng)銷客戶分類中的應(yīng)用[D];南京理工大學(xué);2015年
,本文編號(hào):668445
本文鏈接:http://www.sikaile.net/jingjifazhanlunwen/668445.html