基于非均衡數(shù)據(jù)對(duì)神經(jīng)網(wǎng)絡(luò)激勵(lì)函數(shù)的改進(jìn)研究
【文章頁(yè)數(shù)】:51 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖2-1TomekLinks算法示意圖
圖2-1TomekLinks算法示意圖圖中觀察可見(jiàn),此算法主要剔除了在小樣本類中的大樣本類樣本,使各更加集中。在建立TomekLinks鏈接對(duì)后,對(duì)滿足配對(duì)的大樣本類贗本除,在平衡正負(fù)類數(shù)據(jù)的同時(shí),也減少了模型的復(fù)雜性。有一種欠采樣的方法就是NearMiss算法....
圖2-2Nearmiss算法示意圖
圖2-2Nearmiss算法示意圖圖中觀察,能略微分辨出三種欠采樣方法的區(qū)別,從原理上分析,Near于其工作原理,在多數(shù)類樣本點(diǎn)選擇上,更偏向于集中在少數(shù)類附近法更具有局部性,最后樣本的分布并不是均勻的。NearMiss-3算法則離少數(shù)類近的多數(shù)類樣本,因此兩類樣本的分布....
圖2-3SMOTE及衍生算法示意圖
華中科技大學(xué)碩士學(xué)位論文P加入到新的集合中。(3)最后針對(duì)在新合成集合中的每個(gè)樣本點(diǎn)再次使用SMOTE算法生成新對(duì)于Borderline-SMOTE2[18]的思路與Borderline-SMOTE1的1、2兩步都大是在新集合中不是進(jìn)行簡(jiǎn)單....
圖2-4SMOTE+Tomek算法示意圖
圖2-4SMOTE+Tomek算法示意圖可以觀察出,首先SMOTE是通過(guò)線性插值方法提高少數(shù)類樣本過(guò)采樣補(bǔ)充的數(shù)據(jù)量大,這樣就可以一定程度上在平衡分布的問(wèn)題。而后在數(shù)據(jù)中建立TomekLinks對(duì),尋找類別之間,將這些連接對(duì)直接剔除,而且這里由于一開始擴(kuò)充了樣本容....
本文編號(hào):3891623
本文鏈接:http://www.sikaile.net/guanlilunwen/tongjijuecelunwen/3891623.html