天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于過(guò)采樣方法的信用卡用戶違約預(yù)測(cè)分析

發(fā)布時(shí)間:2021-08-13 16:37
  隨著信用卡業(yè)務(wù)在全球范圍內(nèi)的迅速普及,信用風(fēng)險(xiǎn)也急劇擴(kuò)張。大量信用卡用戶違約行為的出現(xiàn),給銀行等金融機(jī)構(gòu)帶來(lái)了較大的損失。因此,對(duì)信用卡用戶的信用風(fēng)險(xiǎn)進(jìn)行預(yù)警,提前識(shí)別違約用戶就變得尤為重要。它能夠?yàn)殂y行等金融機(jī)構(gòu)提供決策依據(jù),幫助其制定合理的放貸策略,降低自身風(fēng)險(xiǎn),促進(jìn)自身健康發(fā)展。一般來(lái)說(shuō),信用卡數(shù)據(jù)集中各類別的分布是極度不平衡的,未違約人數(shù)占比較大,違約人數(shù)占比較小,傳統(tǒng)的人工信用風(fēng)險(xiǎn)評(píng)估模型已不適用。本文將利用數(shù)據(jù)挖掘技術(shù)和機(jī)器學(xué)習(xí)方法,從數(shù)據(jù)和模型兩個(gè)方面對(duì)信用卡數(shù)據(jù)集進(jìn)行探索分析。本文使用的數(shù)據(jù)集來(lái)自Kaggle官網(wǎng),為國(guó)外某銀行2015年到2017年兩年間信用卡用戶的歷史消費(fèi)及違約記錄,該樣本集中的類別分布極度不均衡。首先,本文將分別采用SMOTE算法和ADASYN算法對(duì)數(shù)據(jù)集進(jìn)行過(guò)采樣處理,使得處理后數(shù)據(jù)集中的類別相對(duì)平衡,這樣做的優(yōu)點(diǎn)是不會(huì)損失樣本中多數(shù)類的信息。然后基于過(guò)采樣后的數(shù)據(jù),分別建立邏輯回歸、隨機(jī)森林、神經(jīng)網(wǎng)絡(luò)、XGBoost預(yù)測(cè)模型,通過(guò)對(duì)各個(gè)模型的評(píng)價(jià)指標(biāo)的對(duì)比,找到最優(yōu)的預(yù)測(cè)模型,使得其能夠最大限度的識(shí)別違約用戶。最后通過(guò)對(duì)各個(gè)模型結(jié)果的分析,找到影... 

【文章來(lái)源】:東北師范大學(xué)吉林省 211工程院校 教育部直屬院校

【文章頁(yè)數(shù)】:40 頁(yè)

【學(xué)位級(jí)別】:碩士

【部分圖文】:

基于過(guò)采樣方法的信用卡用戶違約預(yù)測(cè)分析


Logistic函數(shù)圖像

直方圖,箱線圖,異常值


(2)異常值處理:對(duì)數(shù)據(jù)集進(jìn)行異常值檢測(cè),這些異常值可能是在實(shí)際調(diào)查過(guò)程中錄入的,表這些異常值的存在會(huì)對(duì)模型結(jié)果造成一定的影響于這些異常值個(gè)數(shù)相對(duì)較少,故直接刪除。(3)數(shù)據(jù)標(biāo)準(zhǔn)化:由表 3 可知,各個(gè)特征的綱也不相同,為了使得模型參數(shù)更具有可比性,行標(biāo)準(zhǔn)化處理從而消除量綱對(duì)模型結(jié)果的影響。3.2 描述性分析在正式建模前,需要對(duì)數(shù)據(jù)集有較深的了解對(duì)各個(gè)特征進(jìn)行簡(jiǎn)單的分析。圖 2 至圖 13 為各個(gè)n2yrs”的箱線圖和直方圖。

箱線圖,中位數(shù),違約率


箱線圖

【參考文獻(xiàn)】:
期刊論文
[1]基于網(wǎng)絡(luò)用戶評(píng)論的評(píng)分預(yù)測(cè)模型研究[J]. 張紅麗,劉濟(jì)郢,楊斯楠,徐健.  數(shù)據(jù)分析與知識(shí)發(fā)現(xiàn). 2017(08)
[2]基于ADASYN與AdaBoostSVM相結(jié)合的不平衡分類算法[J]. 柳培忠,洪銘,黃德天,駱炎民,王守覺(jué).  北京工業(yè)大學(xué)學(xué)報(bào). 2017(03)
[3]面向不均衡數(shù)據(jù)集中少數(shù)類細(xì)分的過(guò)采樣算法[J]. 古平,楊煬.  計(jì)算機(jī)工程. 2017(02)
[4]一種代價(jià)敏感隨機(jī)森林算法[J]. 尹華,胡玉平.  武漢大學(xué)學(xué)報(bào)(工學(xué)版). 2014(05)
[5]不平衡數(shù)據(jù)分類的混合算法[J]. 韓敏,朱新榮.  控制理論與應(yīng)用. 2011(10)
[6]基于數(shù)據(jù)挖掘方法對(duì)商業(yè)銀行信用卡違約預(yù)測(cè)模型的研究[J]. 涂偉華,王索漫.  中國(guó)證券期貨. 2011(09)
[7]信貸信息不對(duì)稱下的信用卡信用風(fēng)險(xiǎn)研究[J]. 方匡南,吳見(jiàn)彬,朱建平,謝邦昌.  經(jīng)濟(jì)研究. 2010(S1)
[8]不平衡分類問(wèn)題研究綜述[J]. 葉志飛,文益民,呂寶糧.  智能系統(tǒng)學(xué)報(bào). 2009(02)
[9]不平衡數(shù)據(jù)分類方法綜述[J]. 楊明,尹軍梅,吉根林.  南京師范大學(xué)學(xué)報(bào)(工程技術(shù)版). 2008(04)
[10]一個(gè)基于神經(jīng)網(wǎng)絡(luò)——Logistic回歸的混合兩階段個(gè)人信用評(píng)分模型研究[J]. 石慶焱.  統(tǒng)計(jì)研究. 2005(05)

博士論文
[1]不均衡數(shù)據(jù)分類方法的研究[D]. 曹鵬.東北大學(xué) 2014

碩士論文
[1]信用卡違約影響因素研究[D]. 馬志昂.山東財(cái)經(jīng)大學(xué) 2017
[2]隨機(jī)森林在P2P網(wǎng)貸借款信用風(fēng)險(xiǎn)評(píng)估中的應(yīng)用[D]. 徐婷婷.山東大學(xué) 2017
[3]銀行信用評(píng)級(jí)中的不平衡分類問(wèn)題研究[D]. 陳力.廣東工業(yè)大學(xué) 2017
[4]基于少數(shù)類樣本重組的不平衡數(shù)據(jù)分類研究[D]. 李軒.湖南大學(xué) 2016
[5]基于優(yōu)化的xgboost-LMT模型的供應(yīng)商信用評(píng)價(jià)研究[D]. 樊鵬.廣東工業(yè)大學(xué) 2016
[6]基于深度學(xué)習(xí)技術(shù)的信用卡交易欺詐偵測(cè)研究[D]. 丁衛(wèi)星.上海交通大學(xué) 2015
[7]基于Logistic回歸模型的P2P網(wǎng)貸平臺(tái)借款人信用風(fēng)險(xiǎn)評(píng)估[D]. 王夢(mèng)佳.北京外國(guó)語(yǔ)大學(xué) 2015
[8]不平衡數(shù)據(jù)集分類算法的研究[D]. 孟軍.南京理工大學(xué) 2014
[9]基于集成學(xué)習(xí)的不平衡數(shù)據(jù)分類[D]. 宋海燕.西安電子科技大學(xué) 2014
[10]不平衡數(shù)據(jù)集分類問(wèn)題研究[D]. 孫曉燕.山東師范大學(xué) 2012



本文編號(hào):3340775

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/guanlilunwen/tongjijuecelunwen/3340775.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶0f266***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com