不均衡樣本的分類優(yōu)化方法
發(fā)布時間:2021-11-05 06:57
隨著機器學習、數據挖掘、深度學習等領域的快速發(fā)展,人們致力于不斷優(yōu)化各種模型。分類問題作為數據挖掘的主要任務,備受學者關注,傳統(tǒng)分類策略大都基于代價不敏感的均衡數據,它們往往注重一個模型的整體精度,而這樣的分類器對于非均衡的樣本數據并不適用。因此,如何改進分類策略以優(yōu)化不均衡樣本的分類器性能,是一個值得討論的議題。本文以此為目標展開研究,致力于在保持整體性能的前提下,提升分類器對少數類別的學習能力。當前主要的研究方向主要有兩個,其一從樣本出發(fā),研究如何在盡量不損失原樣本所含信息的前提下平衡類樣本數量,同時還應盡量避免噪聲的產生;其二從算法出發(fā),通過訓練單類樣本分類器、引入代價敏感因子、采用集合策略等方式提升學習器分類性能。本文在提出優(yōu)化策略之前,首先提出一種新型復合評價準則IIBAα,通過理論和實驗證明了其不僅能度量模型整體性能,還能夠側重評估少數類別的分類,同時具有更高的穩(wěn)健性和抗噪聲性等優(yōu)點,可以將其運用于優(yōu)化效果的比較中。之后本文分為樣本和算法策略兩方面介紹非均衡樣本分類的優(yōu)化方式,其中樣本優(yōu)化是核心所在。本文提出了一種基于聚類思想的組合樣本優(yōu)化方法框架,這種樣本優(yōu)化方法可與各種...
【文章來源】:華中科技大學湖北省 211工程院校 985工程院校 教育部直屬院校
【文章頁數】:56 頁
【學位級別】:碩士
【部分圖文】:
平衡后樣本散點圖
本文編號:3477304
【文章來源】:華中科技大學湖北省 211工程院校 985工程院校 教育部直屬院校
【文章頁數】:56 頁
【學位級別】:碩士
【部分圖文】:
平衡后樣本散點圖
本文編號:3477304
本文鏈接:http://www.sikaile.net/guanlilunwen/tongjijuecelunwen/3477304.html
教材專著