天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于數(shù)據(jù)挖掘算法的信貸逾期行為預測

發(fā)布時間:2021-12-22 05:37
  隨著我國經(jīng)濟的發(fā)展和人民消費觀念的轉(zhuǎn)變,人民對于信貸業(yè)務的需求日益增加,銀行的信貸業(yè)務逐漸發(fā)展起來,并為其帶來了新的利潤增長點。如果不能對客戶的資質(zhì)和還款能力進行有效的審查和評估,將導致銀行承擔較大的金融風險。因此,亟需高效準確的方法,有效識別未來可能發(fā)生逾期行為的客戶,規(guī)避金融風險,并為銀行信用體系建設以及對于客戶的評估提供一些參考。本文主要以某貸款機構的歷史貸款數(shù)據(jù)為例,建立信貸逾期行為的預測模型。首先將所得數(shù)據(jù)清洗和處理,然后通過WOE分箱和IV值選取包含信息量較大的特征,進行相關系數(shù)的計算,確定強相關的變量并去除,以免影響實驗結(jié)果。由于信用行為預測的數(shù)據(jù)往往不平衡,需要進行欠采樣或過采樣來平衡數(shù)據(jù)。而貸款數(shù)據(jù)具有極度不平衡的特點,這將導致單一的分類器完全失效,集成模型得到的分類結(jié)果也不是特別理想。針對這類問題,本文采用隨機欠采樣與SMOTE過采樣相結(jié)合的方法去平衡訓練集,以避免僅僅使用欠采樣造成數(shù)據(jù)過度損失或僅使用過采樣引入太多噪聲。在模型選擇方面,采用Logistic回歸、支持向量機以及基于決策樹的集成算法隨機森林和Light GBM,在平衡過的訓練集上分別建模。最后在原測試... 

【文章來源】:山西大學山西省

【文章頁數(shù)】:70 頁

【學位級別】:碩士

【部分圖文】:

基于數(shù)據(jù)挖掘算法的信貸逾期行為預測


單位階躍函數(shù)和對數(shù)幾率函數(shù)圖像

超平面,支持向量,支持向量機


基于數(shù)據(jù)挖掘算法的信貸逾期行為預測8為計算方便,通過對||||的變換,可以得到,對于正確分類的樣本,應滿足以下關系:1111TiiTiixbyxby,,(2.15)在支持向量機中,間隔應能反映樣本點到超平面的距離以及分類的準確性,因此定義了函數(shù)間隔:"()Tyxb(2.16)根據(jù)函數(shù)間隔,"0則分類正確,否則分類錯誤。但函數(shù)間隔會受到||||的影響,所以又定義了幾何間隔:"()||||||||Tyxb(2.17)支持向量機的目標函數(shù)是最大化幾何間隔,而支持向量機主要關注距離超平面較近的點。其中,通過與超平面距離最近的點且與超平面平行的平面滿足()1Tyxb,所以目標函數(shù)為最大化1||||,等價于最小化21||||2。圖2.2支持向量與分離超平面于是,求解支持向量機轉(zhuǎn)化為求解以下的凸二次優(yōu)化問題:2argmin1||||,b2(2.18)..()11,2,.Tiistyxb,in(2.19)

線性可分,超平面,數(shù)據(jù)集,數(shù)據(jù)


第二章數(shù)據(jù)挖掘方法9該問題可以利用拉格朗日乘子法轉(zhuǎn)化為對偶問題,根據(jù)最優(yōu)化理論求解其對偶問題即可訓練完成支持向量機。針對線性可分數(shù)據(jù)訓練出來的支持向量機稱為線性可分支持向量機。圖2.3近似線性可分數(shù)據(jù)集在實際問題中,數(shù)據(jù)往往不是嚴格的線性可分,即無法找到一個超平面將數(shù)據(jù)嚴格的分開。若數(shù)據(jù)集近似線性可分,即存在部分樣本點位于超平面和邊界之間,不滿足間隔1的條件,如圖2.3所示。針對這一問題,引入松弛變量0,1,2,,iin,使得i1i。同時,目標函數(shù)也應增加正則化項。此時優(yōu)化問題變?yōu)椋?11min||||2niiC(2.20)..()1,1,2,.Tiistyxbin(2.21)01,2,.i,in(2.22)若數(shù)據(jù)集完全不可分,此時無法用分離超平面將數(shù)據(jù)很好地分開,于是考慮用非線性變換,轉(zhuǎn)化為線性問題求解。支持向量機通過采用不同的核函數(shù),將數(shù)據(jù)映射到更高維空間,從而轉(zhuǎn)化為線性可分問題求解。常用的核函數(shù)有:表2.1支持向量機常用核函數(shù)名稱表達式參數(shù)線性核函數(shù)(,)Tijijxxxx多項式核函數(shù)(,)()Tdijijxxxxcd為多項式核函數(shù)的階數(shù)


本文編號:3545854

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/shoufeilunwen/xixikjs/3545854.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶1f018***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com