變量篩選后的個(gè)人信貸評(píng)分模型與統(tǒng)計(jì)學(xué)習(xí)
發(fā)布時(shí)間:2022-01-17 15:00
如何通過(guò)構(gòu)建可靠的信用評(píng)分模型來(lái)評(píng)估貸款申請(qǐng)人的信用風(fēng)險(xiǎn)在信貸風(fēng)險(xiǎn)管理行業(yè)中發(fā)揮著重要的作用,這也成為學(xué)術(shù)界和商業(yè)界的一項(xiàng)重要研究課題。本文通過(guò)先篩選數(shù)據(jù)變量,然后再建立模型的方法,探討了3種不同連接函數(shù)下廣義線性模型的分類(lèi)問(wèn)題,并且當(dāng)連接函數(shù)為logit (對(duì)應(yīng)logistic回歸模型)時(shí),加入了自變量的交互項(xiàng)以?xún)?yōu)化模型。以德國(guó)UCI數(shù)據(jù)集為例,采用AUC和KS指標(biāo)作為評(píng)價(jià)指標(biāo),與隨機(jī)森林、支持向量機(jī)和XGBoost模型等目前信貸評(píng)分中最常用的統(tǒng)計(jì)學(xué)習(xí)模型進(jìn)行了分析對(duì)比,結(jié)果表明:廣義線性模型中l(wèi)ogistic回歸模型和SVM預(yù)測(cè)效果尚佳;對(duì)于連接函數(shù)為logit的廣義線性模型,加入交互項(xiàng)后AUC和KS有所提高,表明交互項(xiàng)的加入優(yōu)化了模型。
【文章來(lái)源】:數(shù)理統(tǒng)計(jì)與管理. 2020,39(02)北大核心CSSCI
【文章頁(yè)數(shù)】:13 頁(yè)
【文章目錄】:
0 引言
0.1背景介紹
0.2研究現(xiàn)狀
1 特征處理與變量篩選指標(biāo)
1.1 虛擬變量設(shè)置
1.2 卡方距離
1.3 MV指數(shù)
2 模型與評(píng)價(jià)指標(biāo)
2.1 Logistic回歸(Logistic regression,簡(jiǎn)寫(xiě)LR)
2.2 隨機(jī)森林(Random forest,簡(jiǎn)寫(xiě)RF)
2.3 SVM
2.4 XGBoost
2.5 GLM
2.6 評(píng)價(jià)指標(biāo)
2.6.1 AUC
2.6.2 KS值
3 實(shí)證分析與比較
3.1 變量掃描與篩選
3.2 模型預(yù)測(cè)結(jié)果分析
3.2.1 RF預(yù)測(cè)結(jié)果分析
3.2.2 SVM預(yù)測(cè)結(jié)果分析
3.2.3 XGBoost預(yù)測(cè)結(jié)果分析
3.2.4 GLM預(yù)測(cè)結(jié)果分析
3.3 模型預(yù)測(cè)結(jié)果穩(wěn)定性分析
4 結(jié)論與展望
【參考文獻(xiàn)】:
期刊論文
[1]回歸模型中啞變量的相對(duì)重要性指數(shù)[J]. 李海超,王開(kāi)軍,胡淼,陳黎飛. 計(jì)算機(jī)應(yīng)用. 2017(11)
[2]基于Ext-GBDT集成的類(lèi)別不平衡信用評(píng)分模型[J]. 陳啟偉,王偉,馬迪,毛偉. 計(jì)算機(jī)應(yīng)用研究. 2018(02)
[3]關(guān)于促進(jìn)互聯(lián)網(wǎng)金融健康發(fā)展的指導(dǎo)意見(jiàn)[J]. 信息技術(shù)與信息化. 2015(06)
[4]基于隨機(jī)森林的個(gè)人信用評(píng)估模型研究及實(shí)證分析[J]. 蕭超武,蔡文學(xué),黃曉宇,陳康. 管理現(xiàn)代化. 2014(06)
[5]信用評(píng)分模型應(yīng)用比較研究——基于個(gè)體工商戶(hù)數(shù)據(jù)的檢驗(yàn)[J]. 晏艷陽(yáng),蔣恒波. 統(tǒng)計(jì)與信息論壇. 2010(05)
[6]信用評(píng)分主要模型方法比較研究[J]. 楊力,汪克亮,王建民. 經(jīng)濟(jì)管理. 2008(06)
[7]基于KMOD核函數(shù)的SVM方法在信用評(píng)分中的應(yīng)用[J]. 陳為民,馬超群,馮廣波. 經(jīng)濟(jì)數(shù)學(xué). 2008(01)
[8]我國(guó)商業(yè)銀行個(gè)人信用評(píng)分指標(biāo)體系分析[J]. 張麗娜,趙敏. 市場(chǎng)周刊(理論研究). 2007(08)
[9]多種個(gè)人信用評(píng)分模型在中國(guó)應(yīng)用的比較研究[J]. 石慶焱,靳云匯. 統(tǒng)計(jì)研究. 2004(06)
本文編號(hào):3594938
【文章來(lái)源】:數(shù)理統(tǒng)計(jì)與管理. 2020,39(02)北大核心CSSCI
【文章頁(yè)數(shù)】:13 頁(yè)
【文章目錄】:
0 引言
0.1背景介紹
0.2研究現(xiàn)狀
1 特征處理與變量篩選指標(biāo)
1.1 虛擬變量設(shè)置
1.2 卡方距離
1.3 MV指數(shù)
2 模型與評(píng)價(jià)指標(biāo)
2.1 Logistic回歸(Logistic regression,簡(jiǎn)寫(xiě)LR)
2.2 隨機(jī)森林(Random forest,簡(jiǎn)寫(xiě)RF)
2.3 SVM
2.4 XGBoost
2.5 GLM
2.6 評(píng)價(jià)指標(biāo)
2.6.1 AUC
2.6.2 KS值
3 實(shí)證分析與比較
3.1 變量掃描與篩選
3.2 模型預(yù)測(cè)結(jié)果分析
3.2.1 RF預(yù)測(cè)結(jié)果分析
3.2.2 SVM預(yù)測(cè)結(jié)果分析
3.2.3 XGBoost預(yù)測(cè)結(jié)果分析
3.2.4 GLM預(yù)測(cè)結(jié)果分析
3.3 模型預(yù)測(cè)結(jié)果穩(wěn)定性分析
4 結(jié)論與展望
【參考文獻(xiàn)】:
期刊論文
[1]回歸模型中啞變量的相對(duì)重要性指數(shù)[J]. 李海超,王開(kāi)軍,胡淼,陳黎飛. 計(jì)算機(jī)應(yīng)用. 2017(11)
[2]基于Ext-GBDT集成的類(lèi)別不平衡信用評(píng)分模型[J]. 陳啟偉,王偉,馬迪,毛偉. 計(jì)算機(jī)應(yīng)用研究. 2018(02)
[3]關(guān)于促進(jìn)互聯(lián)網(wǎng)金融健康發(fā)展的指導(dǎo)意見(jiàn)[J]. 信息技術(shù)與信息化. 2015(06)
[4]基于隨機(jī)森林的個(gè)人信用評(píng)估模型研究及實(shí)證分析[J]. 蕭超武,蔡文學(xué),黃曉宇,陳康. 管理現(xiàn)代化. 2014(06)
[5]信用評(píng)分模型應(yīng)用比較研究——基于個(gè)體工商戶(hù)數(shù)據(jù)的檢驗(yàn)[J]. 晏艷陽(yáng),蔣恒波. 統(tǒng)計(jì)與信息論壇. 2010(05)
[6]信用評(píng)分主要模型方法比較研究[J]. 楊力,汪克亮,王建民. 經(jīng)濟(jì)管理. 2008(06)
[7]基于KMOD核函數(shù)的SVM方法在信用評(píng)分中的應(yīng)用[J]. 陳為民,馬超群,馮廣波. 經(jīng)濟(jì)數(shù)學(xué). 2008(01)
[8]我國(guó)商業(yè)銀行個(gè)人信用評(píng)分指標(biāo)體系分析[J]. 張麗娜,趙敏. 市場(chǎng)周刊(理論研究). 2007(08)
[9]多種個(gè)人信用評(píng)分模型在中國(guó)應(yīng)用的比較研究[J]. 石慶焱,靳云匯. 統(tǒng)計(jì)研究. 2004(06)
本文編號(hào):3594938
本文鏈接:http://www.sikaile.net/jingjilunwen/jingjiguanlilunwen/3594938.html
最近更新
教材專(zhuān)著