用于不平衡數(shù)據(jù)分類的0階TSK型模糊系統(tǒng)
本文關(guān)鍵詞: 不平衡數(shù)據(jù) 分類 馬爾科夫蒙特卡洛 Takagi-Sugeno-Kang型模糊系統(tǒng) 出處:《自動(dòng)化學(xué)報(bào)》2017年10期 論文類型:期刊論文
【摘要】:處理不平衡數(shù)據(jù)分類時(shí),傳統(tǒng)模糊系統(tǒng)對(duì)少數(shù)類樣本識(shí)別率較低.針對(duì)這一問題,首先,在前件參數(shù)學(xué)習(xí)上,提出了競(jìng)爭(zhēng)貝葉斯模糊聚類(Bayesian fuzzy clustering based on competitive learning,BFCCL)算法,BFCCL算法考慮不同類別樣本聚類中心間的排斥作用,采用交替迭代的執(zhí)行方式并通過馬爾科夫蒙特卡洛方法獲得模型參數(shù)最優(yōu)解.其次,在后件參數(shù)學(xué)習(xí)上,基于大間隔的策略并通過參數(shù)調(diào)節(jié)使得少數(shù)類到分類面的距離大于多數(shù)類到分類面的距離,該方法能有效糾正分類面的偏移.基于上述思想以0階TSK型模糊系統(tǒng)為具體研究對(duì)象構(gòu)造了適用于不平衡數(shù)據(jù)分類問題的0階TSK型模糊系統(tǒng)(0-TSK-IDC).人工和真實(shí)醫(yī)學(xué)數(shù)據(jù)集實(shí)驗(yàn)結(jié)果表明,0-TSK-IDC在不平衡數(shù)據(jù)分類問題中對(duì)少數(shù)類和多數(shù)類均具有較高的識(shí)別率,且具有良好的魯棒性和可解釋性.
[Abstract]:When dealing with unbalanced data classification, the traditional fuzzy system has a low recognition rate for a few samples. In order to solve this problem, first of all, in the former part parameter learning, In this paper, the Bayesian fuzzy clustering based on competitive learning BFCCL (Bayesian fuzzy clustering based on competitive learning) algorithm is proposed, which takes into account the repulsive effect between different clustering centers. The optimal solution of model parameters is obtained by means of alternating iteration and Markov Monte Carlo method. Secondly, in the latter part parameter learning, Based on the large interval strategy and parameter adjustment, the distance between a few classes and the classification surface is larger than that between the majority class and the classification surface. This method can effectively correct the deviation of classification surface. Based on the above idea, a 0-order TSK fuzzy system for unbalanced data classification is constructed based on the above idea. The artificial and real medical numbers are obtained. According to the set experiment results, it is shown that the 0-TSK-IDC has a high recognition rate for a few classes and a large number of classes in the problem of unbalanced data classification. And it has good robustness and interpretability.
【作者單位】: 江南大學(xué)數(shù)字媒體學(xué)院;常州大學(xué)信息科學(xué)與工程學(xué)院;
【基金】:國(guó)家自然科學(xué)基金(61502058,61572085,61572236) 江蘇省自然科學(xué)基金資助(BK20160187) 中央高;究蒲袠I(yè)務(wù)費(fèi)專項(xiàng)資金資助項(xiàng)目(JUSRP51614A)資助~~
【分類號(hào)】:TP311.13
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 徐堅(jiān)鋼;介紹一種數(shù)據(jù)分類快錄法[J];計(jì)算機(jī)系統(tǒng)應(yīng)用;1995年03期
2 張黎黎;劉麗華;金水高;尹嶺;徐勇勇;;臨床醫(yī)學(xué)科學(xué)數(shù)據(jù)分類的探討[J];中國(guó)衛(wèi)生質(zhì)量管理;2005年06期
3 孫笑微;;數(shù)據(jù)分類技術(shù)在高校人才識(shí)別系統(tǒng)中的應(yīng)用[J];沈陽師范大學(xué)學(xué)報(bào)(自然科學(xué)版);2008年02期
4 陳湘來;顧玉萍;韓之俊;;馬田系統(tǒng)在數(shù)據(jù)分類中的應(yīng)用[J];數(shù)學(xué)的實(shí)踐與認(rèn)識(shí);2010年08期
5 廖志芳;樊曉平;陳宇宙;廖志寧;瞿志華;;大腸癌診斷數(shù)據(jù)分類新算法研究[J];計(jì)算機(jī)工程與應(yīng)用;2008年20期
6 蔣盛益;謝照青;余雯;;基于代價(jià)敏感的樸素貝葉斯不平衡數(shù)據(jù)分類研究[J];計(jì)算機(jī)研究與發(fā)展;2011年S1期
7 黃洪;劉增良;余達(dá)太;周紹華;;一種具有免疫特征的智能數(shù)據(jù)分類分級(jí)模型[J];兵工學(xué)報(bào);2010年12期
8 楊盛苑;蔡照鵬;;數(shù)據(jù)分類在營(yíng)銷策略中的應(yīng)用研究[J];科技廣場(chǎng);2013年05期
9 王熙章,吳薇,姚發(fā)芬;沙漠化災(zāi)害監(jiān)測(cè)評(píng)價(jià)信息系統(tǒng)空間數(shù)據(jù)分類編碼研究[J];中國(guó)沙漠;1994年01期
10 盧致杰;;引入行為特征概念的海量圖像數(shù)據(jù)分類法研究[J];計(jì)算機(jī)仿真;2014年06期
相關(guān)會(huì)議論文 前1條
1 蔣盛益;謝照青;余雯;;基于代價(jià)敏感的樸素貝葉斯不平衡數(shù)據(jù)分類研究[A];2010年第16屆全國(guó)信息存儲(chǔ)技術(shù)大會(huì)(IST2010)論文集[C];2010年
相關(guān)重要報(bào)紙文章 前2條
1 EMC公司大中華區(qū)應(yīng)用方案及咨詢部 李剛;數(shù)據(jù)分類促進(jìn)存儲(chǔ)信息安全[N];通信產(chǎn)業(yè)報(bào);2006年
2 ;數(shù)據(jù)分類:只是看起來簡(jiǎn)單[N];網(wǎng)絡(luò)世界;2010年
相關(guān)博士學(xué)位論文 前1條
1 李俊林;可適應(yīng)不良數(shù)據(jù)的數(shù)據(jù)分類若干方法研究[D];電子科技大學(xué);2012年
相關(guān)碩士學(xué)位論文 前2條
1 楊康;基于多類別數(shù)據(jù)分類的演化超網(wǎng)絡(luò)研究[D];重慶郵電大學(xué);2016年
2 馮丹;一種新的模糊規(guī)則權(quán)重方法的數(shù)據(jù)分類的研究[D];大連海事大學(xué);2010年
,本文編號(hào):1501979
本文鏈接:http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/1501979.html