面向高維數(shù)據(jù)的個人信貸風(fēng)險評估方法
發(fā)布時間:2020-10-09 00:54
隨著電商平臺分期付款方式和P2P信貸平臺的不斷推廣,如何從海量的用戶信貸數(shù)據(jù)中挖掘出潛在的用戶模型并對未知用戶進行信貸風(fēng)險評估,以降低信貸業(yè)務(wù)的風(fēng)險,已經(jīng)成為研究的主流。針對現(xiàn)有方法無法高效處理高維度信貸數(shù)據(jù)的問題,使用一系列的數(shù)據(jù)預(yù)處理方法和基于Embedded思想的特征選擇方法 XGBFS(XGBoost Feature Selection),以降低用戶信貸數(shù)據(jù)維度并訓(xùn)練出XGBoost評估模型,最終實現(xiàn)用戶信貸風(fēng)險評估。實驗表明,與現(xiàn)有的方法相比,該方法能夠從高維的數(shù)據(jù)中選擇出重要屬性,并且分類器在精確率、召回率等方面具有較為突出的性能。
【部分圖文】:
面向高維數(shù)據(jù)的個人信貸風(fēng)險評估方法主要包括以下過程:首先將訓(xùn)練數(shù)據(jù)集進行數(shù)據(jù)清洗、缺失值處理和數(shù)據(jù)歸一化等預(yù)處理;再基于XGBFS對數(shù)據(jù)進行降維:最后通過XGBoost對降維后的數(shù)據(jù)進行用戶信貸評估建模。具體流程如圖1所示。3.1 數(shù)據(jù)預(yù)處理
現(xiàn)代信貸用戶信息中除了屬性高維外,還會存在多種類別的屬性,如離散型、連續(xù)型、文本型等。如何對各種類別的屬性進行科學(xué)的預(yù)處理是信貸風(fēng)險評估的首要前提。針對不同類型的數(shù)據(jù)應(yīng)當(dāng)采取不同的處理方法:對于連續(xù)型屬性,直接進行歸一化處理。對于類別型屬性,先進行類別編碼,再進行歸一化處理。對于離散型屬性,先進行分段處理再進行歸一化處理。對于文本型屬性,先進行TF-IDF(Term Frequency-Inverse Document Frequency)提取特征,再通過LSA(Latent Semantic Analysis)[17]進行語義分析,將分析結(jié)果進行歸一化處理。數(shù)據(jù)預(yù)處理的流程如圖2所示。3.1.1 類別型屬性
目前典型的LSA空間的構(gòu)造方法是基于奇異值分解(Singular Value Decomposition,SVD)的空間構(gòu)造方法。如圖3所示,通過對文檔集的單詞-文檔矩陣的奇異值分解,可以提取出H個最大的奇異值和對應(yīng)的左右奇異矩陣,并還原出和原來相似的單詞-文檔矩陣。3.1.4 缺失值處理
本文編號:2832994
【部分圖文】:
面向高維數(shù)據(jù)的個人信貸風(fēng)險評估方法主要包括以下過程:首先將訓(xùn)練數(shù)據(jù)集進行數(shù)據(jù)清洗、缺失值處理和數(shù)據(jù)歸一化等預(yù)處理;再基于XGBFS對數(shù)據(jù)進行降維:最后通過XGBoost對降維后的數(shù)據(jù)進行用戶信貸評估建模。具體流程如圖1所示。3.1 數(shù)據(jù)預(yù)處理
現(xiàn)代信貸用戶信息中除了屬性高維外,還會存在多種類別的屬性,如離散型、連續(xù)型、文本型等。如何對各種類別的屬性進行科學(xué)的預(yù)處理是信貸風(fēng)險評估的首要前提。針對不同類型的數(shù)據(jù)應(yīng)當(dāng)采取不同的處理方法:對于連續(xù)型屬性,直接進行歸一化處理。對于類別型屬性,先進行類別編碼,再進行歸一化處理。對于離散型屬性,先進行分段處理再進行歸一化處理。對于文本型屬性,先進行TF-IDF(Term Frequency-Inverse Document Frequency)提取特征,再通過LSA(Latent Semantic Analysis)[17]進行語義分析,將分析結(jié)果進行歸一化處理。數(shù)據(jù)預(yù)處理的流程如圖2所示。3.1.1 類別型屬性
目前典型的LSA空間的構(gòu)造方法是基于奇異值分解(Singular Value Decomposition,SVD)的空間構(gòu)造方法。如圖3所示,通過對文檔集的單詞-文檔矩陣的奇異值分解,可以提取出H個最大的奇異值和對應(yīng)的左右奇異矩陣,并還原出和原來相似的單詞-文檔矩陣。3.1.4 缺失值處理
【相似文獻】
相關(guān)期刊論文 前3條
1 佘朝兵;;Logistic回歸在銀行個人信貸風(fēng)險評估上的應(yīng)用研究[J];科技與創(chuàng)新;2018年19期
2 晏艷陽;金鵬;;個人信貸中信用風(fēng)險識別的信號博弈分析[J];湖南大學(xué)學(xué)報(社會科學(xué)版);2010年06期
3 楊志群;;多目標決策方法在個人信用評估中的應(yīng)用[J];長沙民政職業(yè)技術(shù)學(xué)院學(xué)報;2009年01期
相關(guān)碩士學(xué)位論文 前2條
1 張崗崗;稀疏組Lasso方法在個人信貸風(fēng)險評估中的應(yīng)用[D];山東大學(xué);2018年
2 董姝嫻;商業(yè)銀行個人信用評價研究[D];華中科技大學(xué);2007年
本文編號:2832994
本文鏈接:http://www.sikaile.net/jingjilunwen/jingjiguanlilunwen/2832994.html
最近更新
教材專著