基于XGBoost的網(wǎng)絡(luò)貸款風(fēng)險(xiǎn)預(yù)測(cè)
發(fā)布時(shí)間:2023-05-17 20:22
隨著銀行和金融機(jī)構(gòu)的貸款業(yè)務(wù)越來越多,壞賬對(duì)互聯(lián)網(wǎng)金融市場(chǎng)的發(fā)展帶來極大的負(fù)面影響。如何制定一個(gè)策略對(duì)客戶是否會(huì)違約做預(yù)測(cè),并使利潤達(dá)到最大化,是所有信貸機(jī)構(gòu)最關(guān)心的問題。因此,就如何減少不良貸款問題建立一個(gè)準(zhǔn)確的信用評(píng)分卡模型對(duì)市場(chǎng)經(jīng)濟(jì)的穩(wěn)定發(fā)展有重要意義。在背景介紹和數(shù)據(jù)準(zhǔn)備部分,首先,介紹了信貸風(fēng)險(xiǎn)的概念和P2P信貸的發(fā)展背景,并對(duì)幾種機(jī)器學(xué)習(xí)模型理論和信用評(píng)分卡理論做了闡述。其次,針對(duì)某互聯(lián)網(wǎng)金融平臺(tái)的個(gè)人信貸數(shù)據(jù)集,通過數(shù)據(jù)探索、數(shù)據(jù)預(yù)處理、特征工程等操作,生成了可用于建模的數(shù)據(jù)。在模型實(shí)證分析部分,首先,建立了基線模型和XGBoost模型,采用評(píng)價(jià)指標(biāo)AUC值和KS值研究了模型對(duì)逾期客戶的判別能力,發(fā)現(xiàn)XGBoost模型優(yōu)于邏輯回歸、決策樹和隨機(jī)森林三種基線模型。其次,針對(duì)數(shù)據(jù)的不平衡性質(zhì),通過引入代價(jià)敏感學(xué)習(xí)策略,提出了改進(jìn)版XGBoost模型。相比原XGBoost模型,改進(jìn)后的XGBoost模型對(duì)逾期風(fēng)險(xiǎn)的預(yù)測(cè)精度得到了一定的提升。最后,針對(duì)XGBoost模型,采用Stacking融合技巧,提出了新的XGBoost模型。相比原XGBoost模型,新模型的AUC值和KS值...
【文章頁數(shù)】:55 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 選題背景和意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 國外研究現(xiàn)狀
1.2.2 國內(nèi)研究現(xiàn)狀
1.3 研究內(nèi)容
第二章 機(jī)器學(xué)習(xí)模型理論
2.1 邏輯回歸模型
2.1.1 邏輯回歸算法原理
2.1.2 邏輯回歸參數(shù)求解
2.2 決策樹與隨機(jī)森林
2.2.1 決策樹
2.2.2 分類與回歸樹
2.2.3 隨機(jī)森林
2.3 XGBoost
2.3.1 Boosting算法思想
2.3.2 XGBoost的算法原理
第三章 信用評(píng)分卡理論
3.1 信用評(píng)分卡基本概念
3.2 評(píng)分卡建模流程
3.2.1 問題定義
3.2.2 樣本選取
3.2.3 特征工程
3.2.4 評(píng)分卡建模
3.2.5 模型評(píng)估
第四章 用戶貸款數(shù)據(jù)處理
4.1 數(shù)據(jù)簡介
4.2 描述性統(tǒng)計(jì)分析
4.2.1 性別與違約的關(guān)系
4.2.2 學(xué)歷與違約的關(guān)系
4.2.3 會(huì)員級(jí)別與違約的關(guān)系
4.2.4 收入與違約的關(guān)系
4.2.5 信用評(píng)分與違約的關(guān)系
4.3 數(shù)據(jù)預(yù)處理
4.3.1 數(shù)據(jù)集成
4.3.2 數(shù)據(jù)清洗
4.4 特征工程
4.5 數(shù)據(jù)集的劃分
第五章 貸款風(fēng)險(xiǎn)預(yù)測(cè)實(shí)證分析
5.1 模型評(píng)價(jià)指標(biāo)
5.1.1 KS統(tǒng)計(jì)量
5.1.2 ROC曲線和AUC
5.2 基線模型對(duì)貸款逾期預(yù)測(cè)的結(jié)果和效果
5.2.1 邏輯回歸模型
5.2.2 決策樹與隨機(jī)森林
5.3 XGBoost模型對(duì)貸款逾期預(yù)測(cè)的結(jié)果和效果
5.3.1 XGBoost及其調(diào)優(yōu)
5.3.2 基于代價(jià)敏感學(xué)習(xí)的XGBoost
5.3.3 基于XGBoost的Stacking融合
總結(jié)與展望
參考文獻(xiàn)
致謝
本文編號(hào):3817939
【文章頁數(shù)】:55 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 選題背景和意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 國外研究現(xiàn)狀
1.2.2 國內(nèi)研究現(xiàn)狀
1.3 研究內(nèi)容
第二章 機(jī)器學(xué)習(xí)模型理論
2.1 邏輯回歸模型
2.1.1 邏輯回歸算法原理
2.1.2 邏輯回歸參數(shù)求解
2.2 決策樹與隨機(jī)森林
2.2.1 決策樹
2.2.2 分類與回歸樹
2.2.3 隨機(jī)森林
2.3 XGBoost
2.3.1 Boosting算法思想
2.3.2 XGBoost的算法原理
第三章 信用評(píng)分卡理論
3.1 信用評(píng)分卡基本概念
3.2 評(píng)分卡建模流程
3.2.1 問題定義
3.2.2 樣本選取
3.2.3 特征工程
3.2.4 評(píng)分卡建模
3.2.5 模型評(píng)估
第四章 用戶貸款數(shù)據(jù)處理
4.1 數(shù)據(jù)簡介
4.2 描述性統(tǒng)計(jì)分析
4.2.1 性別與違約的關(guān)系
4.2.2 學(xué)歷與違約的關(guān)系
4.2.3 會(huì)員級(jí)別與違約的關(guān)系
4.2.4 收入與違約的關(guān)系
4.2.5 信用評(píng)分與違約的關(guān)系
4.3 數(shù)據(jù)預(yù)處理
4.3.1 數(shù)據(jù)集成
4.3.2 數(shù)據(jù)清洗
4.4 特征工程
4.5 數(shù)據(jù)集的劃分
第五章 貸款風(fēng)險(xiǎn)預(yù)測(cè)實(shí)證分析
5.1 模型評(píng)價(jià)指標(biāo)
5.1.1 KS統(tǒng)計(jì)量
5.1.2 ROC曲線和AUC
5.2 基線模型對(duì)貸款逾期預(yù)測(cè)的結(jié)果和效果
5.2.1 邏輯回歸模型
5.2.2 決策樹與隨機(jī)森林
5.3 XGBoost模型對(duì)貸款逾期預(yù)測(cè)的結(jié)果和效果
5.3.1 XGBoost及其調(diào)優(yōu)
5.3.2 基于代價(jià)敏感學(xué)習(xí)的XGBoost
5.3.3 基于XGBoost的Stacking融合
總結(jié)與展望
參考文獻(xiàn)
致謝
本文編號(hào):3817939
本文鏈接:http://www.sikaile.net/kejilunwen/shengwushengchang/3817939.html
最近更新
教材專著