一種基于決策森林的單調分類方法
本文選題:單調分類 + 決策樹 ; 參考:《計算機研究與發(fā)展》2017年07期
【摘要】:單調分類問題是特征與類別之間帶有單調性約束的有序分類問題.對于符號數(shù)據(jù)的單調分類問題已有較好的方法,但對于數(shù)值數(shù)據(jù),現(xiàn)有的方法分類精度和運行效率有限.提出一種基于決策森林的單調分類方法(monotonic classification method based on decision forest,MCDF),設計采樣策略來構造決策樹,可以保持數(shù)據(jù)子集與原數(shù)據(jù)集分布一致,并通過樣本權重避免非單調數(shù)據(jù)的影響,在保持較高分類精度的同時有效提高了運行效率,同時這種策略可以自動確定決策森林中決策樹的個數(shù).在決策森林進行分類時,給出了決策沖突時的解決方法.提出的方法既可以處理符號數(shù)據(jù),也可以處理數(shù)值數(shù)據(jù).在人造數(shù)據(jù)集、UCI及真實數(shù)據(jù)集上的實驗數(shù)據(jù)表明:該方法可以提高單調分類性能和運行效率,縮短分類規(guī)則的長度,解決數(shù)據(jù)集規(guī)模較大的單調分類問題.
[Abstract]:Monotone classification is an ordered classification problem with monotonicity constraints between features and categories. There are good methods for monotone classification of symbolic data, but for numerical data, the classification accuracy and operational efficiency of the existing methods are limited. A monotone classification method based on decision forest (monotonic classification method based on decision forestMCDF) is proposed. Sampling strategy is designed to construct decision tree. It can keep the distribution of data subset consistent with the original data set, and avoid the influence of non-monotone data through sample weight. This strategy can automatically determine the number of decision trees in the decision-making forest. In the process of classification of decision-making forest, the solution of decision-making conflict is given. The proposed method can deal with both symbolic and numerical data. The experimental data on UCI and real data sets show that this method can improve the performance and efficiency of monotone classification, shorten the length of classification rules, and solve the problem of monotone classification with large scale of data sets.
【作者單位】: 山西大學計算機與信息技術學院;計算智能與中文信息處理教育部重點實驗室(山西大學);山西財經(jīng)大學應用數(shù)學學院;
【基金】:國家自然科學基金項目(61673249,61503229) 山西省回國留學人員科研基金項目(2016-004) 山西省研究生教育創(chuàng)新項目(2016BY003)~~
【分類號】:TP181
【參考文獻】
相關期刊論文 前1條
1 ;Information entropy for ordinal classification[J];Science China(Information Sciences);2010年06期
相關碩士學位論文 前1條
1 車勛建;基于有序決策樹的故障程度診斷研究[D];哈爾濱工業(yè)大學;2011年
【共引文獻】
相關期刊論文 前10條
1 許行;王文劍;任麗芳;;一種基于決策森林的單調分類方法[J];計算機研究與發(fā)展;2017年07期
2 潘偉;佘X;;基于偏好不一致熵的有序決策[J];計算機應用;2017年03期
3 黃金晶;黃黎;;基于信息熵的網(wǎng)絡課程學生分類模型研究[J];寧波職業(yè)技術學院學報;2016年05期
4 李敬;張盼盼;王利東;;基于拓撲鄰域的序信息系統(tǒng)屬性權重確定方法[J];數(shù)碼設計;2016年02期
5 Lili MEI;Heyan HUANG;Xiaochi WEI;Xianling MAO;;A novel unsupervised method for new word extraction[J];Science China(Information Sciences);2016年09期
6 潘巍巍;宋彥萍;于達仁;;齒輪裂紋程度識別的有序分類算法[J];哈爾濱工業(yè)大學學報;2016年07期
7 陳建凱;王鑫;何強;王熙照;;區(qū)間值屬性的單調決策樹算法[J];模式識別與人工智能;2016年01期
8 李敬;王利東;李曉慶;;基于優(yōu)勢度的序信息系統(tǒng)屬性重要性度量[J];瓊州學院學報;2015年05期
9 潘巍巍;;基于排序熵的故障嚴重程度識別特征選擇算法[J];廈門理工學院學報;2015年03期
10 趙春宇;劉景江;馬倫;張偉君;;Monotonicity Evaluation Method of Monitoring Feature Series Based on Ranking Mutual Information[J];Journal of Shanghai Jiaotong University(Science);2015年03期
相關碩士學位論文 前3條
1 王鑫;基于FRMI的有序決策樹算法及其比較研究[D];河北大學;2014年
2 陳建凱;基于排序熵的有序決策樹高效算法研究[D];河北大學;2014年
3 周楊;滾動軸承性能退化評估技術研究[D];電子科技大學;2014年
【二級參考文獻】
相關期刊論文 前2條
1 ;The information content of rules and rule sets and its application[J];Science in China(Series F:Information Sciences);2008年12期
2 ;Information granules and entropy theory in information systems[J];Science in China(Series F:Information Sciences);2008年10期
相關碩士學位論文 前4條
1 朱義;基于CHMM的設備性能退化評估方法研究[D];上海交通大學;2009年
2 劉雨;基于支持向量數(shù)據(jù)描述與信息融合的設備性能退化評估研究[D];上海交通大學;2009年
3 柴春勝;基于決策樹的坦克故障診斷系統(tǒng)的設計與實現(xiàn)[D];大連理工大學;2006年
4 王惠蓮;決策樹算法在火電機組故障診斷中的應用[D];華北電力大學(北京);2006年
【相似文獻】
相關期刊論文 前10條
1 張曉斌;魏永祥;韓德民;夏寅;李希平;原林;唐雷;王興海;;數(shù)字化耳鼻咽喉數(shù)據(jù)集的采集[J];中華耳鼻咽喉頭頸外科雜志;2005年06期
2 職為梅;郭華平;范明;葉陽東;;非平衡數(shù)據(jù)集分類方法探討[J];計算機科學;2012年S1期
3 韓慧;王路;溫明;王文淵;;不均衡數(shù)據(jù)集學習中基于初分類的過抽樣算法[J];計算機應用;2006年08期
4 高嘉偉;梁吉業(yè);;非平衡數(shù)據(jù)集分類問題研究進展[J];計算機科學;2008年04期
5 吳克壽;曾志強;;非平衡數(shù)據(jù)集分類研究[J];計算機技術與發(fā)展;2011年09期
6 顏杰,李彩霞,曾芳芳,方積乾;如何控制SAS結果的輸出[J];中國衛(wèi)生統(tǒng)計;2004年02期
7 王雙成;冷翠平;李小琳;;小數(shù)據(jù)集的貝葉斯網(wǎng)絡結構學習[J];自動化學報;2009年08期
8 李鵬;王曉龍;劉遠超;王寶勛;;一種基于混合策略的失衡數(shù)據(jù)集分類方法[J];電子學報;2007年11期
9 王燦偉;于治樓;張化祥;;一種適合不平衡數(shù)據(jù)集的新型提升算法[J];計算機工程與應用;2011年28期
10 蔡娜;王俊英;劉惟一;;一種基于小數(shù)據(jù)集的貝葉斯網(wǎng)絡學習方法[J];云南大學學報(自然科學版);2007年04期
相關博士學位論文 前7條
1 嚴遠亭;不完整數(shù)據(jù)集的多視角集成分類研究[D];安徽大學;2016年
2 史熒中;耦合的支持向量學習方法及應用研究[D];江南大學;2016年
3 雒曉卓;基于聯(lián)合稀疏和局部線性的極限學習機及應用[D];西安電子科技大學;2015年
4 孫漢昌;蛋白質組質譜數(shù)據(jù)處理關鍵問題與技術研究[D];國防科學技術大學;2011年
5 張景祥;遷移學習技術及其應用研究[D];江南大學;2015年
6 黃超;若干蛋白質種類鑒別的多標記預測問題研究[D];上海交通大學;2014年
7 李宏;面向應用領域的分類方法研究[D];中南大學;2007年
相關碩士學位論文 前10條
1 袁銘;基于R-SMOTE方法的非平衡數(shù)據(jù)分類研究[D];河北大學;2015年
2 程偉;基于半監(jiān)督SVM的非平衡學習[D];西安電子科技大學;2014年
3 馬蕊;基于觸覺序列的物體分類方法[D];石家莊鐵道大學;2015年
4 閆欣;綜合過采樣和欠采樣的不平衡數(shù)據(jù)集的學習研究[D];東北電力大學;2016年
5 朱政;V-支持向量分類機中若干問題的研究[D];華東師范大學;2016年
6 蔣偉;基于特征的軌跡數(shù)據(jù)集化簡研究[D];蘇州大學;2016年
7 徐麗麗;面向不平衡數(shù)據(jù)集的分類算法研究[D];遼寧師范大學;2016年
8 王聰;基于深度學習的交通標志檢測算法研究[D];北方工業(yè)大學;2017年
9 張貝貝;基于類別失衡數(shù)據(jù)集的改進支持向量機模型的研究[D];安徽理工大學;2017年
10 歐陽源怞;基于混合采樣的非平衡數(shù)據(jù)集分類研究[D];重慶大學;2014年
,本文編號:2112407
本文鏈接:http://www.sikaile.net/kejilunwen/zidonghuakongzhilunwen/2112407.html