SMOTE混合抽樣對非平衡數(shù)據(jù)分類效果的影響分析
發(fā)布時間:2024-05-14 22:36
本文旨在研究對非平衡數(shù)據(jù)建模時,SMOTE過抽樣和隨機欠抽樣的不同比例對模型預測效果產生的影響。首先基于模擬數(shù)據(jù),探究了混合抽樣比例的不同組合下,帶有LASSO變量選擇的邏輯回歸模型對于非平衡程度不同數(shù)據(jù)的分類效果。模擬結果表明,過抽樣和欠抽樣的比例越高,預測效果越好,但是在某些情況下,直接使用原始數(shù)據(jù)進行建模,選取一個合適的臨界值,可以得到更理想的分類模型。通過對某擔保公司的數(shù)據(jù)實證研究發(fā)現(xiàn),前述結論基本成立,且當原始數(shù)據(jù)極不平衡時,采用混合抽樣方法進行數(shù)據(jù)預處理可以有效提高模型的預測效果,這對于非平衡數(shù)據(jù)的建模分析過程有一定的指導意義。
【文章頁數(shù)】:8 頁
本文編號:3973514
【文章頁數(shù)】:8 頁
本文編號:3973514
本文鏈接:http://www.sikaile.net/guanlilunwen/tongjijuecelunwen/3973514.html
最近更新
教材專著