一種處理部分標(biāo)記數(shù)據(jù)的粗糙集屬性約簡算法
本文選題:粗糙集 切入點(diǎn):增量式屬性約簡 出處:《計(jì)算機(jī)科學(xué)》2017年01期
【摘要】:屬性約簡是粗糙集理論中重要的研究內(nèi)容之一,是數(shù)據(jù)挖掘中知識(shí)獲取的關(guān)鍵步驟。Pawlak粗糙集約簡的對象一般是有標(biāo)記的決策表或者是無標(biāo)記的信息表。而在很多現(xiàn)實(shí)問題中有標(biāo)記數(shù)據(jù)很有限,更多的是無標(biāo)記數(shù)據(jù),即半監(jiān)督數(shù)據(jù)。為此,結(jié)合半監(jiān)督協(xié)同學(xué)習(xí)理論,提出了處理半監(jiān)督數(shù)據(jù)的屬性約簡算法。該算法首先在有標(biāo)記數(shù)據(jù)上構(gòu)造兩個(gè)差異性較大的約簡來構(gòu)造基分類器;然后在無標(biāo)記數(shù)據(jù)上交互協(xié)同學(xué)習(xí),擴(kuò)大有標(biāo)記數(shù)據(jù)集,獲得質(zhì)量更好的約簡,構(gòu)造性能更好的分類器,該過程迭代進(jìn)行,從而實(shí)現(xiàn)利用無標(biāo)記數(shù)據(jù)提高有標(biāo)記數(shù)據(jù)的約簡質(zhì)量,最終獲得質(zhì)量較好的屬性約簡。UCI數(shù)據(jù)集上的實(shí)驗(yàn)分析表明,該算法是有效且可行的。
[Abstract]:Attribute reduction is one of the important research contents in rough set theory, the object is a key step of knowledge acquisition in the.Pawlak data mining rough set reduction decision table is generally marked or unmarked information table. But in many practical problems have very limited labeled data, is more unlabeled data, namely half supervision data. Therefore, combining semi supervised cooperative learning theory, put forward the attribute reduction algorithm of semi supervised data. The algorithm firstly in the labeled data to construct the base classifier to construct two different reduction; then in the unlabeled data on the interaction of collaborative learning, expand the labeled data set, obtained reduction quality better, build better classifier, the iterative process, so as to realize the advantage of unlabeled data to improve the quality of a reduction of labeled data, and eventually obtain a better quality attribute reduction.UCI The experimental analysis on the data set shows that the algorithm is effective and feasible.
【作者單位】: 同濟(jì)大學(xué)電子與信息工程學(xué)院計(jì)算機(jī)科學(xué)與技術(shù)系;上海電力學(xué)院計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院;同濟(jì)大學(xué)嵌入式系統(tǒng)與服務(wù)計(jì)算教育部重點(diǎn)實(shí)驗(yàn)室;深圳大學(xué)計(jì)算機(jī)與軟件學(xué)院;香港理工大學(xué)應(yīng)用科學(xué)與紡織學(xué)院;
【基金】:國家自然科學(xué)基金項(xiàng)目(61273304) 2013年度高等學(xué)校博士學(xué)科點(diǎn)專項(xiàng)科研基金(20130072130004)資助
【分類號】:TP18
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 羅進(jìn);周學(xué)君;;半監(jiān)督學(xué)習(xí)中非標(biāo)記數(shù)據(jù)的利用[J];湖北大學(xué)學(xué)報(bào)(自然科學(xué)版);2008年01期
2 郭濤;李貴洋;蘭霞;;基于圖的半監(jiān)督協(xié)同訓(xùn)練算法[J];計(jì)算機(jī)工程;2012年13期
3 李艷娟;郭茂祖;;關(guān)系tri-training:利用無標(biāo)記數(shù)據(jù)學(xué)習(xí)一階規(guī)則[J];計(jì)算機(jī)科學(xué)與探索;2012年05期
4 李昆侖;曹錚;曹麗蘋;張超;劉明;;半監(jiān)督聚類的若干新進(jìn)展[J];模式識(shí)別與人工智能;2009年05期
5 武永成;;無標(biāo)記數(shù)據(jù)學(xué)習(xí)及其在圖像檢索中的應(yīng)用[J];軟件導(dǎo)刊;2013年03期
6 鄧超;郭茂祖;;基于Tri-Training和數(shù)據(jù)剪輯的半監(jiān)督聚類算法[J];軟件學(xué)報(bào);2008年03期
7 李昆侖;張偉;代運(yùn)娜;;基于Tri-training的半監(jiān)督SVM[J];計(jì)算機(jī)工程與應(yīng)用;2009年22期
8 易淼;劉小蘭;;基于相對變換的半監(jiān)督分類算法[J];計(jì)算機(jī)應(yīng)用;2011年10期
9 蘇進(jìn)勝;謝彥峰;張忠林;;基于事務(wù)的概率標(biāo)記數(shù)據(jù)包的IP回溯[J];蘭州交通大學(xué)學(xué)報(bào);2006年04期
10 高云天;;基于不完全信息的半監(jiān)督KMeans算法[J];中國新技術(shù)新產(chǎn)品;2009年03期
相關(guān)會(huì)議論文 前1條
1 劉小平;黎夏;張嘯虎;;一種新的基于多標(biāo)記分解模型的遙感軟分類方法[A];中國地理學(xué)會(huì)百年慶典學(xué)術(shù)論文摘要集[C];2009年
相關(guān)博士學(xué)位論文 前1條
1 覃姜維;遷移學(xué)習(xí)方法研究及其在跨領(lǐng)域數(shù)據(jù)分類中的應(yīng)用[D];華南理工大學(xué);2011年
相關(guān)碩士學(xué)位論文 前7條
1 劉萌;基于特征的歸納式遷移學(xué)習(xí)方法研究[D];哈爾濱工程大學(xué);2012年
2 盧小燕;基于半監(jiān)督和局部降維的多標(biāo)記數(shù)據(jù)分類[D];中南大學(xué);2013年
3 郭躍健;多值屬性和多標(biāo)記數(shù)據(jù)分類[D];中南大學(xué);2010年
4 張順;多標(biāo)記數(shù)據(jù)分類相關(guān)技術(shù)研究[D];山東師范大學(xué);2013年
5 丁濤;半監(jiān)督自訓(xùn)練分類模型的研究與實(shí)現(xiàn)[D];大連理工大學(xué);2009年
6 付華;基于極限學(xué)習(xí)機(jī)的半監(jiān)督分類[D];西安電子科技大學(xué);2013年
7 張金輝;基于少量標(biāo)記數(shù)據(jù)約束聚類算法的入侵檢測技術(shù)研究[D];南京航空航天大學(xué);2009年
,本文編號:1716533
本文鏈接:http://www.sikaile.net/kejilunwen/zidonghuakongzhilunwen/1716533.html