天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

缺失數(shù)據(jù)下的P2P借貸違約風(fēng)險評價方法研究

發(fā)布時間:2020-06-07 21:16
【摘要】:P2P借貸的虛擬性和信息的不對稱性使其面臨著比傳統(tǒng)金融模式更嚴(yán)峻的違約風(fēng)險,有效的風(fēng)險管控是P2P平臺穩(wěn)健發(fā)展的基本保障。然而,P2P借貸數(shù)據(jù)的廣泛性和多樣性使其面臨著更嚴(yán)重的缺失問題。如何利用P2P平臺的不完全數(shù)據(jù),完成有效的違約風(fēng)險建模是本文需要解決的問題。本文將P2P借貸中常見數(shù)據(jù)缺失問題細(xì)分為數(shù)據(jù)屬性值的缺失和類別標(biāo)簽的缺失,并探索如何利用缺失數(shù)據(jù)提高模型的違約風(fēng)險預(yù)測性能。針對數(shù)據(jù)屬性值缺失的問題,傳統(tǒng)分類算法需要首先基于數(shù)據(jù)隨機(jī)缺失的假設(shè)填補(bǔ)缺失數(shù)據(jù),然后訓(xùn)練模型。然而缺失數(shù)據(jù)通常是三種缺失類型混合的,單一的缺失假設(shè)會影響數(shù)據(jù)填補(bǔ)結(jié)果,從而影響模型效果。本文使用對缺失數(shù)據(jù)魯棒性較強(qiáng)的樹模型來建模,并提出基于LightGBM分類算法構(gòu)建違約風(fēng)險評價模型,不僅不需要對缺失數(shù)據(jù)進(jìn)行預(yù)填補(bǔ),而且具有較高的效率。最后,基于人人貸平臺的數(shù)據(jù)進(jìn)行實(shí)證分析,驗(yàn)證了直接基于LightGBM建模優(yōu)于傳統(tǒng)填補(bǔ)方法后模型效果。針對類別標(biāo)簽缺失的問題,傳統(tǒng)違約風(fēng)險評價僅使用有標(biāo)簽樣本建模。然而模型的應(yīng)用對象是全樣本,由此帶來的樣本選擇偏差問題會影響模型泛化能力,需要對無標(biāo)簽樣本進(jìn)行拒絕推斷來校正樣本選擇偏差。本文使用半監(jiān)督方法構(gòu)建違約風(fēng)險模型,并提出基于樣本和特征雙重差異的協(xié)同訓(xùn)練模型TRICMV。該模型采用了基于“多視圖學(xué)習(xí)”的模型投票機(jī)制和基于“噪音學(xué)習(xí)理論”的自適應(yīng)的模型迭代機(jī)制,可以控制加入模型中的噪音。最后,實(shí)證分析結(jié)果驗(yàn)證了TRICMV模型的有效性。
【圖文】:

流程圖,平臺,流程,違約風(fēng)險


此外,拒絕樣本(無標(biāo)簽樣本)中存在著大量的標(biāo)的信息和違的違約風(fēng)險判別能力。如何利用無標(biāo)簽樣本(即拒絕樣本)校提高模型的違約風(fēng)險評價能力是本文需要解決的問題。 P2P 平臺的屬性值缺失和類別標(biāo)簽缺失這兩種缺失情況的數(shù)據(jù)接刪除的方法案進(jìn)行處理。以特征值缺失的情況為例,肖志文[5]常具有一定的機(jī)會主義傾向,在提交個人資料的時候,會匿去,從而導(dǎo)致數(shù)據(jù)缺失。以類別標(biāo)簽缺失的情況為例,違約風(fēng)險概率也就越大,即樣本標(biāo)簽缺失的概率越大。P2P 平臺的兩種數(shù)非隨機(jī)性,,直接刪除會改變數(shù)據(jù)樣本的分布,導(dǎo)致樣本選擇偏樣本不是來自總體的簡單隨機(jī)樣本。利用有偏樣本訓(xùn)練違約風(fēng)加模型的泛化誤差,從而降低模型的違約風(fēng)險評價性能。此外能具有一定的違約風(fēng)險判別能力。如何有效地利用不完全數(shù)據(jù)數(shù)據(jù)來提高違約風(fēng)險評價性能是對 P2P 平臺的借款人進(jìn)行有效關(guān)鍵。

生長策略


機(jī)制將在 3.2 節(jié)中作詳細(xì)介紹。復(fù)雜和耗時和問題,LightGBM 模的 one-side 采樣、互斥特征綁定方作詳細(xì)介紹。層次結(jié)構(gòu)是需要解決的問題。我們做一個平衡,以防止模型的過擬合 生長策略,如圖 3.1 所示。因?yàn)閷σ獙ζ溥M(jìn)行分裂和搜索。Level-w同一層的所有葉節(jié)點(diǎn),會影響模策略:Leaf-wise 生長策略,如圖,每次從當(dāng)前所有葉節(jié)點(diǎn)中,尋找。因此,與 Level-wise 相比,L時獲得更好的精度。Leaf-wise 的合。因此,LightGBM 在 Leaf-wisMax Depth),以防止模型過擬合
【學(xué)位授予單位】:合肥工業(yè)大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2019
【分類號】:F832.4;F724.6

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 康春花;孫金玲;孫小堅;曾平飛;;缺失數(shù)據(jù)比率和處理方法對非隨機(jī)缺失數(shù)據(jù)能力參數(shù)估計準(zhǔn)確性的影響[J];江西師范大學(xué)學(xué)報(自然科學(xué)版);2017年03期

2 董學(xué)思;林麗娟;趙楊;魏永越;戴俊程;陳峰;;多組學(xué)聯(lián)合缺失數(shù)據(jù)填補(bǔ)方法的評價[J];中國衛(wèi)生統(tǒng)計;2017年04期

3 楊金英;崔朝杰;;圖模型方法用于二值變量相關(guān)性分析中缺失數(shù)據(jù)的估計[J];中國衛(wèi)生統(tǒng)計;2012年05期

4 許凱;何道江;;有缺失數(shù)據(jù)的條件獨(dú)立正態(tài)母體中參數(shù)的最優(yōu)同變估計[J];數(shù)學(xué)學(xué)報(中文版);2016年06期

5 王軍;李建勛;韓山;王興;;一種效能評估中缺失數(shù)據(jù)的填充方法[J];上海交通大學(xué)學(xué)報;2017年02期

6 吳潔瓊;呂小納;黨志軍;;網(wǎng)絡(luò)高并發(fā)信息的缺失數(shù)據(jù)修復(fù)方法仿真[J];信息通信;2017年11期

7 喻成林;黃強(qiáng);李鋼;;觀測站缺失數(shù)據(jù)修復(fù)的神經(jīng)網(wǎng)絡(luò)模型研究[J];礦山測量;2014年01期

8 帥平;李曉松;周曉華;劉玉萍;;缺失數(shù)據(jù)統(tǒng)計處理方法的研究進(jìn)展[J];中國衛(wèi)生統(tǒng)計;2013年01期

9 張偉;馮萍;趙永紅;袁佳英;李梅;;加權(quán)估計方程用于缺失數(shù)據(jù)的處理[J];中國衛(wèi)生統(tǒng)計;2013年03期

10 詹棠森;;缺失數(shù)據(jù)調(diào)整修正優(yōu)化磨光法研究及陶瓷中的應(yīng)用[J];中國陶瓷;2012年06期

相關(guān)會議論文 前10條

1 印明輝;秦婷婷;伏振;嚴(yán)明明;尹平;;貝葉斯累加回歸樹模型處理缺失數(shù)據(jù)研究[A];2017年中國衛(wèi)生統(tǒng)計學(xué)學(xué)術(shù)年會論文集[C];2017年

2 耿直;葛丹丹;;縱向研究非隨機(jī)缺失數(shù)據(jù)分析[A];中國現(xiàn)場統(tǒng)計研究會第12屆學(xué)術(shù)年會論文集[C];2005年

3 劉紅云;;追蹤研究中非隨機(jī)缺失數(shù)據(jù)的處理:基于模型的方法及其應(yīng)用[A];第十五屆全國心理學(xué)學(xué)術(shù)會議論文摘要集[C];2012年

4 管河山;姜青山;Steven X.Wei;;一種處理缺失數(shù)據(jù)的新方法[A];第二十一屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(技術(shù)報告篇)[C];2004年

5 肖悅;劉紅云;;密集型追蹤數(shù)據(jù)中數(shù)據(jù)的缺失機(jī)制及缺失比例對時變效應(yīng)模型估計精度的影響[A];第二十屆全國心理學(xué)學(xué)術(shù)會議--心理學(xué)與國民心理健康摘要集[C];2017年

6 孫金玲;;混合測驗(yàn)中非隨機(jī)缺失數(shù)據(jù)的缺失比率與處理方法對IRT參數(shù)估計的影響[A];第十八屆全國心理學(xué)學(xué)術(shù)會議摘要集——心理學(xué)與社會發(fā)展[C];2015年

7 李曉煦;侯杰泰;;結(jié)構(gòu)方程中缺失數(shù)據(jù)的處理:FIML,EM與MI[A];全國教育與心理統(tǒng)計測量學(xué)術(shù)年會論文摘要集[C];2006年

8 周曉東;湯銀才;費(fèi)鶴良;;定數(shù)轉(zhuǎn)換步加試驗(yàn)缺失數(shù)據(jù)場合下的參數(shù)估計[A];中國現(xiàn)場統(tǒng)計研究會第十三屆學(xué)術(shù)年會論文集[C];2007年

9 葉素靜;唐文清;張敏強(qiáng);;追蹤研究中缺失數(shù)據(jù)的處理方法述評[A];心理學(xué)與創(chuàng)新能力提升——第十六屆全國心理學(xué)學(xué)術(shù)會議論文集[C];2013年

10 雷蕾;吳乃君;劉鵬;劉蘭娟;;靈敏度分析:分類器中的缺失數(shù)據(jù)[A];第11屆海峽兩岸信息管理發(fā)展策略研討會論文集[C];2005年

相關(guān)重要報紙文章 前1條

1 劉若帆邋宋林;詩邦金A6+1:憑借其質(zhì)提高其量[N];農(nóng)資導(dǎo)報;2008年

相關(guān)博士學(xué)位論文 前10條

1 丁先文;缺失數(shù)據(jù)模型的估計與變量選擇[D];云南大學(xué);2018年

2 高航;面向缺失數(shù)據(jù)的機(jī)器學(xué)習(xí)算法研究[D];國防科學(xué)技術(shù)大學(xué);2016年

3 唐琳;帶有不可忽略缺失數(shù)據(jù)的廣義半?yún)?shù)非線性模型的統(tǒng)計推斷[D];云南大學(xué);2017年

4 龔奇源;面向數(shù)據(jù)發(fā)布的數(shù)據(jù)匿名技術(shù)研究[D];東南大學(xué);2016年

5 陸福忠;數(shù)據(jù)缺失下的分布函數(shù)估計問題[D];復(fù)旦大學(xué);2007年

6 駱汝九;多指標(biāo)綜合評價的非參數(shù)方法和缺失數(shù)據(jù)的聚類方法研究[D];揚(yáng)州大學(xué);2011年

7 郭東林;缺失數(shù)據(jù)下幾類回歸模型的估計方法與理論[D];北京工業(yè)大學(xué);2017年

8 馬友;基于QoS缺失數(shù)據(jù)預(yù)測的個性化Web服務(wù)推薦方法研究[D];北京郵電大學(xué);2015年

9 羅顯貴;帶缺失數(shù)據(jù)列聯(lián)表與半?yún)?shù)非線性動態(tài)因子模型的統(tǒng)計推斷[D];云南大學(xué);2015年

10 祝麗萍;幾種缺失數(shù)據(jù)和高維數(shù)據(jù)模型的統(tǒng)計分析[D];山東大學(xué);2012年

相關(guān)碩士學(xué)位論文 前10條

1 許天歌;缺失數(shù)據(jù)下的P2P借貸違約風(fēng)險評價方法研究[D];合肥工業(yè)大學(xué);2019年

2 宋雅婷;缺失數(shù)據(jù)處理方法及其在臨床試驗(yàn)中的應(yīng)用[D];華中科技大學(xué);2019年

3 石章波;缺失數(shù)據(jù)下眾數(shù)線性模型的統(tǒng)計診斷[D];云南大學(xué);2018年

4 陳婉嬌;缺失數(shù)據(jù)插補(bǔ)方法及其在醫(yī)學(xué)領(lǐng)域的應(yīng)用研究[D];華南理工大學(xué);2019年

5 王玉梅;缺失數(shù)據(jù)下基于眾數(shù)回歸兩類半?yún)?shù)模型估計與變量選擇[D];蘭州理工大學(xué);2019年

6 仝倩;帶缺失數(shù)據(jù)的半?yún)?shù)非線性模型基于經(jīng)驗(yàn)似然的統(tǒng)計診斷[D];南京理工大學(xué);2018年

7 張文佳;缺失數(shù)據(jù)下變系數(shù)部分非線性模型的參數(shù)估計[D];南京理工大學(xué);2018年

8 李佳妮;缺失數(shù)據(jù)統(tǒng)計方法及其敏感性的研究[D];哈爾濱工業(yè)大學(xué);2018年

9 杜麗媛;含有缺失和不可適用數(shù)據(jù)的古生物譜系樹構(gòu)建方法研究[D];西北大學(xué);2018年

10 陳琨;邊坡自動化監(jiān)測數(shù)據(jù)缺失填補(bǔ)算法研究[D];重慶交通大學(xué);2018年



本文編號:2702013

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/jingjilunwen/guojimaoyilunwen/2702013.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶03729***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com