面向缺值數(shù)據(jù)的信用評估貝葉斯網(wǎng)絡模型研究
發(fā)布時間:2020-03-19 09:41
【摘要】:P2P網(wǎng)絡借貸模式自誕生以來備受金融界的歡迎,在近年更是發(fā)展得如火如荼。由于其門檻低、利率高、方便快捷等特點,給借貸雙方都帶來一定好處,尤其是對那些不滿足傳統(tǒng)金融機構借貸條件的人與中小企業(yè)來說,解決了以往融資難的問題。對我國普惠金融政策的實施與金融市場的完善也起了一定的推動作用。然而,隨著P2P網(wǎng)貸的發(fā)展,一些弊端也逐漸顯露出來。一方面,正因P2P平臺門檻低,利率高,極易增加借款人的違約風險;另一方面,很多需要借款人填報的信用指標形同虛設,致使平臺借款人信用數(shù)據(jù)包含大量缺值,這對后期的信用評估造成了影響,致使對借款人信用評估的準確率降低。由此,面向缺值數(shù)據(jù),建立穩(wěn)定而有效的P2P信用評估模型尤其重要,也是P2P網(wǎng)貸平臺正常運轉的基本前提。近年來,許多學者對P2P信用評估模型進行了大量研究,并取得了一定成效。然而,在已有工作中,對于缺值情況下信用評估模型的研究相對較少。因此,面向缺值數(shù)據(jù),本文利用可以將先驗知識與數(shù)據(jù)信息相結合、在消除不確定性方面具有獨特優(yōu)勢的貝葉斯網(wǎng)絡對P2P網(wǎng)絡借貸的信用評估模型進行研究。所做工作具體包括以下三方面:1.提出面向缺值數(shù)據(jù)的貝葉斯網(wǎng)絡結構學習的PQISEM算法(Structure Learning of Bayesian network based on partial qualitative influences and StructureExpectation Maximization algorithm)。將具有良好可信度和魯棒性且容易得到的定性影響知識引入貝葉斯網(wǎng)絡結構學習算法過程中,對在缺值情況下的參數(shù)及結構進行約束,使貝葉斯網(wǎng)絡參數(shù)與結構更靠近真實網(wǎng)絡。該算法在BIC評分、KL散度、運行時間等方面比其他算法更佳。2.數(shù)據(jù)預處理和基于PQISEM算法的P2P信用評估貝葉斯網(wǎng)絡CEBN(Credit Evaluation Bayesian network)模型構建。首先,對P2P平臺借款人數(shù)據(jù)做預處理,其中包括將連續(xù)變量利用ChiMerge算法進行合理離散化。然后將處理完的數(shù)據(jù)利用PQISEM算法進行P2P平臺CEBN模型的結構與參數(shù)的學習,不僅提高了數(shù)據(jù)的使用率,也提高了模型的精度。3.基于P2P平臺的CEBN模型進行推理預測。利用貝葉斯網(wǎng)絡推理的原理,對借款人的還款狀態(tài)進行推斷預測,得出信用評估結果。實驗表明其評估結果不僅在準確率上高于其他貝葉斯網(wǎng)絡結構學習算法,而且在準確率、精度、F值等評估指標上也高于樸素貝葉斯、C4.5、SVM、Adaboost等其他分類算法。從而驗證該CEBN模型的良好性能。
【圖文】:
斯網(wǎng)絡概述網(wǎng)絡是概率論與圖論相結合的產物,可形式化表示成 BN= ( )表示其結構,是一個有向無環(huán)圖(Directed Acyclic Graphica示網(wǎng)絡節(jié)點變量的集合,每個節(jié)點都表示一個隨機變量; 表示合,反映連邊節(jié)點變量間的相互依賴關系。而 表示節(jié)點變量各表的集合,反映父子節(jié)點變量間的依賴程度。助 R 語言 bnlearn 包中的 Cancer 網(wǎng)絡圖來進行說明介紹。如圖絡有 5 個節(jié)點,4 條邊。即 = , = , 為圖 2.2 中的五個參數(shù)分點及其父節(jié)點間的條件概率分布。比如從該網(wǎng)絡的參數(shù)表中可得前提下,感到呼吸困難的概率即P( = = )為 0.9。
源:本圖來源于 R 語言中處理貝葉斯網(wǎng)絡的 bnlearn 包圖 2.3 貝葉斯網(wǎng)絡數(shù)據(jù)處理圖習解決的是在已知網(wǎng)絡結構的前提下,如何確定參數(shù)學習又稱參數(shù)估計,包括最大似然估計與貝葉參數(shù)學習則通常采用近似算法,包括 EM 算法、ussian 逼近等。的目標是尋求先驗知識與數(shù)據(jù)擬合最佳的網(wǎng)絡結定網(wǎng)絡參數(shù),,即包含參數(shù)學習,是貝葉斯網(wǎng)絡學和缺值數(shù)據(jù)集兩種情況。況下的結構學習算法,包括基于評分搜索的方法兩種方法進行結合的混合學習方法三種。
【學位授予單位】:山西財經大學
【學位級別】:碩士
【學位授予年份】:2019
【分類號】:F224;F832.4;F724.6
【圖文】:
斯網(wǎng)絡概述網(wǎng)絡是概率論與圖論相結合的產物,可形式化表示成 BN= ( )表示其結構,是一個有向無環(huán)圖(Directed Acyclic Graphica示網(wǎng)絡節(jié)點變量的集合,每個節(jié)點都表示一個隨機變量; 表示合,反映連邊節(jié)點變量間的相互依賴關系。而 表示節(jié)點變量各表的集合,反映父子節(jié)點變量間的依賴程度。助 R 語言 bnlearn 包中的 Cancer 網(wǎng)絡圖來進行說明介紹。如圖絡有 5 個節(jié)點,4 條邊。即 = , = , 為圖 2.2 中的五個參數(shù)分點及其父節(jié)點間的條件概率分布。比如從該網(wǎng)絡的參數(shù)表中可得前提下,感到呼吸困難的概率即P( = = )為 0.9。
源:本圖來源于 R 語言中處理貝葉斯網(wǎng)絡的 bnlearn 包圖 2.3 貝葉斯網(wǎng)絡數(shù)據(jù)處理圖習解決的是在已知網(wǎng)絡結構的前提下,如何確定參數(shù)學習又稱參數(shù)估計,包括最大似然估計與貝葉參數(shù)學習則通常采用近似算法,包括 EM 算法、ussian 逼近等。的目標是尋求先驗知識與數(shù)據(jù)擬合最佳的網(wǎng)絡結定網(wǎng)絡參數(shù),,即包含參數(shù)學習,是貝葉斯網(wǎng)絡學和缺值數(shù)據(jù)集兩種情況。況下的結構學習算法,包括基于評分搜索的方法兩種方法進行結合的混合學習方法三種。
【學位授予單位】:山西財經大學
【學位級別】:碩士
【學位授予年份】:2019
【分類號】:F224;F832.4;F724.6
【相似文獻】
相關期刊論文 前10條
1 袁璨;朱麗軍;;征信及信用評估中的道德問題研究[J];金融理論探索;2016年06期
2 陳羿擎;沈霄瑜;;新型信用評估系統(tǒng)假設及其與現(xiàn)有信用評估系統(tǒng)比較分析[J];中國管理信息化;2016年03期
3 賈璐;王晨;;大數(shù)據(jù)打響小微金融“攻堅戰(zhàn)”[J];金融世界;2017年08期
4 李俊麗;;基于層次分析法的農戶信用評估[J];商業(yè)研究;2009年10期
5 勞洛克;張世明;劉亞叢;;信用評估機構的規(guī)制與責任[J];經濟法論叢;2009年01期
6 杜云峰;王璐;;對于構建政府采購信用評估體系的初步探索[J];中國政府采購;2008年09期
7 王剛;陳玲;;完善納稅信用評估:我國稅收征管走向主動的現(xiàn)實選擇[J];福建農林大學學報(哲學社會科學版);2007年03期
8 付源;;信用評估風險的組成要素研究[J];中國管理信息化(綜合版);2005年07期
9 鞠榮華,任者春;信用評估機構的基本經營戰(zhàn)略:規(guī)模經濟與范圍經濟[J];山東大學學報(哲學社會科學版);2005年03期
10 馮s
本文編號:2590055
本文鏈接:http://www.sikaile.net/jingjilunwen/jingjiguanlilunwen/2590055.html
最近更新
教材專著