天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于過(guò)采樣的不平衡數(shù)據(jù)集成分類(lèi)算法研究

發(fā)布時(shí)間:2024-04-26 05:36
  不平衡數(shù)據(jù)分類(lèi)問(wèn)題廣泛存在于不同的領(lǐng)域中,而不平衡數(shù)據(jù)分布固有的復(fù)雜性會(huì)顯著降低分類(lèi)器的分類(lèi)性能,因此如何提高分類(lèi)器在不平衡數(shù)據(jù)中的分類(lèi)性能值得我們不斷研究。傳統(tǒng)分類(lèi)算法在處理不平衡數(shù)據(jù)分類(lèi)問(wèn)題時(shí),難以獲得理想的分類(lèi)效果。在數(shù)據(jù)處理層面上,Synthetic Minority Oversampling Technique(SMOTE)是一種優(yōu)秀的重采樣算法,但在某些情況下該算法合成新的樣本是盲目的,并不能根據(jù)樣本的分布情況合成樣本,這會(huì)嚴(yán)重降低分類(lèi)器的分類(lèi)效果。因此本文對(duì)SMOTE過(guò)采樣算法進(jìn)行改進(jìn),提出一種基于聚類(lèi)的過(guò)采樣算法。在分類(lèi)算法層面上,集成分類(lèi)是一種可以有效提升分類(lèi)器分類(lèi)效果的算法;诸(lèi)器的多樣性和集成策略是影響集成分類(lèi)效果的關(guān)鍵因素,因此本文在所提過(guò)采樣算法的基礎(chǔ)上將Adaptive Boosting(AdaBoost)算法和Support Vector Machine(SVM)算法進(jìn)行結(jié)合,分別對(duì)基分類(lèi)器和集成策略進(jìn)行改進(jìn),提出了一種非對(duì)稱(chēng)成本敏感的集成分類(lèi)算法。1.基于聚類(lèi)的過(guò)采樣算法。該算法對(duì)少數(shù)類(lèi)樣本進(jìn)行聚類(lèi)得到不同規(guī)模且不同密度的少數(shù)類(lèi)集群,在稀疏度大的集群中...

【文章頁(yè)數(shù)】:79 頁(yè)

【學(xué)位級(jí)別】:碩士

【部分圖文】:

圖3.3各數(shù)據(jù)集TPR、AUC、F-measure和G-mean值隨著β的變化

圖3.3各數(shù)據(jù)集TPR、AUC、F-measure和G-mean值隨著β的變化

圖3.3各數(shù)據(jù)集TPR、AUC、F-measure和G-mean值隨著β的變化由圖3.3(a)可以看出來(lái),過(guò)采樣模型隨著參數(shù)β的增大,TPR值逐漸變大數(shù)據(jù)集Prima在過(guò)采樣率值為1時(shí),出現(xiàn)輕微的下滑;其它數(shù)據(jù)集在過(guò)采樣率值取1時(shí),TPR值達(dá)....


圖3.5不同數(shù)據(jù)集下各過(guò)采樣算法的G-mean值

圖3.5不同數(shù)據(jù)集下各過(guò)采樣算法的G-mean值

采樣算法在不同數(shù)據(jù)集下與其他算法的G-mean值對(duì)比表3.3各過(guò)采樣算法在不同數(shù)據(jù)集下的G-mean值CarGlassSatVehicleSMOTE92.5569.0872.0872.39-SMOTE92.6372.5575.5574.70DA....


圖4.3不同數(shù)據(jù)集下各分類(lèi)算法的G-mean值

圖4.3不同數(shù)據(jù)集下各分類(lèi)算法的G-mean值

在數(shù)據(jù)集Vehicle、Abalone中得到明顯提高;在不是特別明顯;在數(shù)據(jù)集Sat上的值略低于AdaBoost.M1在數(shù)據(jù)集Segment上的值略低于PCBoost算法,高于其他分類(lèi)算法SDPDBoost在不同數(shù)據(jù)集下與其他分類(lèi)算法上如表4.3所示。表....



本文編號(hào):3964785

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/shengwushengchang/3964785.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶(hù)0bef6***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com