天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 經(jīng)濟(jì)論文 > 投融資論文 >

基于數(shù)據(jù)挖掘的個(gè)人網(wǎng)絡(luò)信貸違約預(yù)警研究

發(fā)布時(shí)間:2020-09-15 11:43
   P2P網(wǎng)絡(luò)借貸作為一種新型的普惠金融模式起源于歐美,在發(fā)展初期,由于實(shí)際數(shù)據(jù)的匱乏,學(xué)者們的將研究集中于金融服務(wù)、平臺(tái)運(yùn)營模式的介紹,直到美國P2P平臺(tái)Prosper對(duì)外公開平臺(tái)交易數(shù)據(jù),學(xué)術(shù)界才有了豐富的研究資源,開始把目光放在P2P面對(duì)的最主要的風(fēng)險(xiǎn)問題--信貸違約問題。我國P2P行業(yè)起步較晚,仍需借鑒歐美國家的發(fā)展經(jīng)驗(yàn),目前國內(nèi)P2P網(wǎng)絡(luò)借貸的研究還停留在較淺層面,主要集中在P2P平臺(tái)運(yùn)營模式,行業(yè)監(jiān)管和信貸違約的影響因素等等,鮮有通過數(shù)據(jù)挖掘方法建立個(gè)人信貸違約預(yù)警模型的研究。本文選擇使用已經(jīng)進(jìn)入穩(wěn)定發(fā)展期的美國P2P市場的網(wǎng)站數(shù)據(jù)進(jìn)行實(shí)證研究,以期為投資者和P2P平臺(tái)在如何有效規(guī)避信貸違約問題上提供一定的參考。本研究的主要目的是預(yù)測一筆貸款是否會(huì)違約,將個(gè)人信貸違約問題看作了一個(gè)二分類問題,選取了集成學(xué)習(xí)中以bagging算法為基礎(chǔ)的隨機(jī)森林算法建立預(yù)警模型,并以CART算法作為基學(xué)習(xí)器。使用的數(shù)據(jù)來源于美國P2P網(wǎng)站Prosper提供的2005-2014年的真實(shí)交易數(shù)據(jù),共含有113,937個(gè)實(shí)例,81個(gè)屬性。由于本研究關(guān)注的是已完成的貸款和違約貸款的區(qū)別,因此刪除了數(shù)據(jù)集中貸款狀態(tài)為進(jìn)行中、銷賬和取消的數(shù)據(jù),最終使用的數(shù)據(jù)集中違約貸款的比例約為10.8%。在分析了個(gè)人信貸違約形成的原因之后,從借款者基本信息、借款者經(jīng)濟(jì)信息、借款者信用歷史和借款信息四個(gè)方面結(jié)合Prosper的實(shí)證數(shù)據(jù)分析個(gè)人信貸違約的影響因素,結(jié)果表明借款者的地理位置、工作類型、月收入和負(fù)債收入比,借款的原因和利率都對(duì)借款者是否會(huì)違約影響,特別的,借款者的拖欠賬目數(shù)對(duì)違約的影響很大。在此基礎(chǔ)上,通過特征選擇方法,刪除了識(shí)別能力差、和違約無因果關(guān)系的、重要性較低的變量,最終選取了24個(gè)指標(biāo)組成個(gè)人信貸違約評(píng)價(jià)體系。以此評(píng)價(jià)體系在Prosper真實(shí)數(shù)據(jù)集上的實(shí)證結(jié)果表明,隨機(jī)森林分類器與CART,LDA和LR分類器相比,獲得了最高的查全率,說明隨機(jī)森林的優(yōu)勢在于能夠正確預(yù)測樣本中的違約用戶,更適合于個(gè)人信貸違約預(yù)警問題。此外,在個(gè)人信貸違約問題中,存在著嚴(yán)重的數(shù)據(jù)不均衡問題,從Prosper公布的數(shù)據(jù)來看,其貸款違約率保持在10%左右的較低水平,為了解決這個(gè)問題,使用加權(quán)隨機(jī)森林(WRF)算法給予少數(shù)類更大的權(quán)重,增加其分類錯(cuò)誤的代價(jià)。結(jié)果表明WRF算法將查全率提高到了62%,并且獲得了最高的AUC分?jǐn)?shù)和袋外分?jǐn)?shù),證明該模型不僅能正確預(yù)測違約用戶,還有很高的泛化能力,可以在一定程度上幫助投資者進(jìn)行投資決策,保護(hù)投資者的根本利益,使P2P網(wǎng)絡(luò)借貸市場健康、穩(wěn)定發(fā)展。
【學(xué)位單位】:吉林大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位年份】:2018
【中圖分類】:F832.4
【部分圖文】:

還款能力,違約風(fēng)險(xiǎn),違約率,數(shù)據(jù)集中


對(duì)于經(jīng)濟(jì)發(fā)展水平較發(fā)達(dá)的東部地區(qū)來說,借款者對(duì)資金的運(yùn)轉(zhuǎn)和利用能力一般較高,相對(duì)的,其還款能力較強(qiáng),該地區(qū)發(fā)生違約風(fēng)險(xiǎn)也就更小。圖 3.1 給出了Prosper 數(shù)據(jù)集中不同地區(qū)的違約分布。可以看出,SC 州的違約率只有 3.9%。而 RI 州是其 4 倍,達(dá)到了 16.1%。

違約率,經(jīng)濟(jì)信息,收入水平,工作狀況


2. 借款者經(jīng)濟(jì)信息①工作狀況。包括工作類型和工作時(shí)長等因素。它們可以側(cè)面反映出借款者的收入穩(wěn)定性和收入水平。從圖 3.2 來看,工作類型和工作時(shí)長與違約的相關(guān)性似乎比較低,這一點(diǎn)將在 3.3 節(jié)中進(jìn)一步檢驗(yàn)。有趣的是,工作類型為其他(other)的借款者,其違約率比沒有工作(not employed)的人還要高。

支付能力,債務(wù),比率,因素


圖3.3月收入和負(fù)債收入比對(duì)違約的影響

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 趙烏吉斯古楞;;數(shù)據(jù)挖掘的研究熱點(diǎn)和發(fā)展趨勢的淺談[J];電腦知識(shí)與技術(shù);2019年08期

2 王彬;;數(shù)據(jù)挖掘構(gòu)成要素的偵查視角分析[J];河南警察學(xué)院學(xué)報(bào);2019年02期

3 程志;張玉彤;賈彪;;遠(yuǎn)距離光纖通信傳輸故障數(shù)據(jù)挖掘方法[J];激光雜志;2019年04期

4 邵興江;;數(shù)據(jù)挖掘在教育信息化中的應(yīng)用空間分析[J];浙江現(xiàn)代教育技術(shù);2004年03期

5 于春香;;數(shù)據(jù)挖掘技術(shù)簡介[J];福建信息技術(shù)教育;2005年01期

6 周致丞;;大數(shù)據(jù)下一種規(guī)則的快速挖掘技術(shù)研究[J];河南科技;2018年25期

7 蔡萌萌;張巍巍;王泓霖;;大數(shù)據(jù)時(shí)代的數(shù)據(jù)挖掘綜述[J];價(jià)值工程;2019年05期

8 張澤;呂新;侯彤瑜;;數(shù)據(jù)挖掘在農(nóng)業(yè)信息化中的應(yīng)用進(jìn)展探析[J];信息記錄材料;2019年01期

9 張俊杰;;恰當(dāng)?shù)乃畡?wù)大數(shù)據(jù)才符合數(shù)據(jù)挖掘的需求[J];城鄉(xiāng)建設(shè);2019年02期

10 周洋;;數(shù)據(jù)挖掘在電力調(diào)度自動(dòng)化系統(tǒng)中的應(yīng)用解析[J];科技創(chuàng)新與應(yīng)用;2017年35期

相關(guān)會(huì)議論文 前10條

1 馬鈺超;;淺析大數(shù)據(jù)和數(shù)據(jù)挖掘及其在煙草行業(yè)中的應(yīng)用[A];中國煙草學(xué)會(huì)2015年度優(yōu)秀論文匯編[C];2015年

2 唐杰;梅俏竹;;數(shù)據(jù)挖掘?qū)W科發(fā)展研究[A];2012-2013控制科學(xué)與工程學(xué)科發(fā)展報(bào)告[C];2014年

3 王時(shí)光;;大數(shù)據(jù)時(shí)代規(guī)劃數(shù)據(jù)挖掘的創(chuàng)新思考[A];新常態(tài):傳承與變革——2015中國城市規(guī)劃年會(huì)論文集(04城市規(guī)劃新技術(shù)應(yīng)用)[C];2015年

4 史東輝;蔡慶生;張春陽;;一種新的數(shù)據(jù)挖掘多策略方法研究[A];第十七屆全國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2000年

5 謝中;邱玉輝;;面向商務(wù)網(wǎng)站有效性的數(shù)據(jù)挖掘方法[A];第十八屆全國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2001年

6 許珂;姜山;;數(shù)據(jù)挖掘方法在科技產(chǎn)出分布可視化研究中的運(yùn)用[A];第二屆中國科技哲學(xué)及交叉學(xué)科研究生論壇論文集(碩士卷)[C];2008年

7 雷宇;;論行業(yè)信息資源的數(shù)據(jù)挖掘[A];中國煙草行業(yè)信息化研討會(huì)論文集[C];2004年

8 吳以凡;吳鐵軍;歐陽樹生;;面向生產(chǎn)過程質(zhì)量控制的動(dòng)態(tài)數(shù)據(jù)挖掘方法[A];05'中國自動(dòng)化產(chǎn)業(yè)高峰會(huì)議暨中國企業(yè)自動(dòng)化和信息化建設(shè)論壇論文集[C];2005年

9 彭怡;;從數(shù)據(jù)挖掘文章聚類分析看其發(fā)展趨勢[A];現(xiàn)代工業(yè)工程與管理研討會(huì)會(huì)議論文集[C];2006年

10 張建錦;劉小霞;;密度偏差抽樣及其在海量數(shù)據(jù)挖掘中的應(yīng)用[A];2006北京地區(qū)高校研究生學(xué)術(shù)交流會(huì)——通信與信息技術(shù)會(huì)議論文集(下)[C];2006年

相關(guān)重要報(bào)紙文章 前10條

1 陸天歌 王兆亮;數(shù)據(jù)挖掘:幫你讀懂未來戰(zhàn)爭[N];解放軍報(bào);2018年

2 本報(bào)記者 戴麗昕;在人才工作中展現(xiàn)數(shù)據(jù)挖掘力量[N];上海科技報(bào);2019年

3 本報(bào)記者 張佳星;把扎克伯格拉下水,大數(shù)據(jù)挖掘犯錯(cuò)了嗎[N];科技日?qǐng)?bào);2018年

4 本報(bào)記者 張佳星;數(shù)據(jù)挖掘大戰(zhàn) 機(jī)器怎么做到“見信如面”[N];科技日?qǐng)?bào);2018年

5 記者 張瀟;打造數(shù)據(jù)挖掘領(lǐng)域的“響尾蛇模式”[N];西安日?qǐng)?bào);2018年

6 上海市浦東衛(wèi)生發(fā)展研究院 孫雪松 王曉麗;數(shù)據(jù)挖掘在醫(yī)學(xué)大數(shù)據(jù)研究中的應(yīng)用[N];中國信息化周報(bào);2018年

7 本報(bào)記者 葉曜坤;全國人大代表鄧曉輝:推翻阻礙數(shù)據(jù)挖掘的“三座大山”[N];人民郵電;2017年

8 本報(bào)記者 牛福蓮;貴州爭奪“大數(shù)據(jù)挖掘”制高點(diǎn)[N];中國經(jīng)濟(jì)時(shí)報(bào);2017年

9 中國聯(lián)合商報(bào)記者 劉末;大數(shù)據(jù)挖掘 讓金融業(yè)未來更加多彩[N];中國聯(lián)合商報(bào);2017年

10 南方日?qǐng)?bào)記者 彭穎;日化巨頭借力大數(shù)據(jù)挖掘線下市場[N];南方日?qǐng)?bào);2017年

相關(guān)博士學(xué)位論文 前10條

1 姜彥;正則化方法在數(shù)據(jù)挖掘中的應(yīng)用與研究[D];湖南大學(xué);2015年

2 馬昱欣;結(jié)合可視化與數(shù)據(jù)挖掘的數(shù)據(jù)分析方法探究[D];浙江大學(xué);2017年

3 李雄;單核苷酸多態(tài)性數(shù)據(jù)挖掘方法及其應(yīng)用研究[D];湖南大學(xué);2015年

4 董瑤;基于統(tǒng)計(jì)分析與數(shù)據(jù)挖掘的智能優(yōu)化預(yù)測研究及應(yīng)用[D];蘭州大學(xué);2015年

5 王達(dá);時(shí)間序列數(shù)據(jù)挖掘研究與應(yīng)用[D];浙江大學(xué);2004年

6 馬昕;粗糙集理論在數(shù)據(jù)挖掘領(lǐng)域中的應(yīng)用[D];浙江大學(xué);2003年

7 王立宏;信息系統(tǒng)的約簡與粒度分析及其在數(shù)據(jù)挖掘中的應(yīng)用[D];上海大學(xué);2004年

8 楊虎;序列數(shù)據(jù)挖掘的模型和算法研究[D];重慶大學(xué);2003年

9 李秋丹;數(shù)據(jù)挖掘相關(guān)算法的研究與平臺(tái)實(shí)現(xiàn)[D];大連理工大學(xué);2004年

10 李力;數(shù)據(jù)挖掘方法研究及其在中藥復(fù)方配伍分析中的應(yīng)用[D];西南交通大學(xué);2003年

相關(guān)碩士學(xué)位論文 前10條

1 蔡楚華;基于數(shù)據(jù)挖掘的心臟疾病診斷研究[D];福州大學(xué);2017年

2 高鵬;基于JBPM的大數(shù)據(jù)挖掘服務(wù)流程引擎的研究與實(shí)現(xiàn)[D];福州大學(xué);2017年

3 顧海霞;數(shù)據(jù)挖掘在精準(zhǔn)幫扶數(shù)據(jù)分析中的應(yīng)用研究[D];貴州大學(xué);2018年

4 鄭張;數(shù)據(jù)挖掘在CDMA網(wǎng)絡(luò)分析中的應(yīng)用[D];福州大學(xué);2017年

5 林志群;基于Spark MLlib統(tǒng)一數(shù)據(jù)挖掘服務(wù)平臺(tái)的研究與實(shí)現(xiàn)[D];福州大學(xué);2017年

6 朱小舟;數(shù)據(jù)挖掘方法在股票選擇中的應(yīng)用研究[D];對(duì)外經(jīng)濟(jì)貿(mào)易大學(xué);2018年

7 張楠;基于數(shù)據(jù)挖掘的實(shí)時(shí)短文本處理技術(shù)的研究[D];中國電子科技集團(tuán)公司電子科學(xué)研究院;2018年

8 李華;基于數(shù)據(jù)挖掘的消防電子生產(chǎn)企業(yè)客戶關(guān)系管理研究[D];燕山大學(xué);2018年

9 鞏陽光;基于數(shù)據(jù)挖掘技術(shù)的金融數(shù)據(jù)分析系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[D];湖北工業(yè)大學(xué);2018年

10 余曉婧;基于數(shù)據(jù)挖掘的高速公路防逃費(fèi)系統(tǒng)的設(shè)計(jì)與應(yīng)用[D];湖北工業(yè)大學(xué);2018年



本文編號(hào):2818923

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/jingjilunwen/touziyanjiulunwen/2818923.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶ebe28***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com