缺失數(shù)據(jù)下的P2P借貸違約風(fēng)險評價方法研究
【圖文】:
此外,拒絕樣本(無標(biāo)簽樣本)中存在著大量的標(biāo)的信息和違的違約風(fēng)險判別能力。如何利用無標(biāo)簽樣本(即拒絕樣本)校提高模型的違約風(fēng)險評價能力是本文需要解決的問題。 P2P 平臺的屬性值缺失和類別標(biāo)簽缺失這兩種缺失情況的數(shù)據(jù)接刪除的方法案進(jìn)行處理。以特征值缺失的情況為例,肖志文[5]常具有一定的機(jī)會主義傾向,在提交個人資料的時候,會匿去,從而導(dǎo)致數(shù)據(jù)缺失。以類別標(biāo)簽缺失的情況為例,違約風(fēng)險概率也就越大,即樣本標(biāo)簽缺失的概率越大。P2P 平臺的兩種數(shù)非隨機(jī)性,,直接刪除會改變數(shù)據(jù)樣本的分布,導(dǎo)致樣本選擇偏樣本不是來自總體的簡單隨機(jī)樣本。利用有偏樣本訓(xùn)練違約風(fēng)加模型的泛化誤差,從而降低模型的違約風(fēng)險評價性能。此外能具有一定的違約風(fēng)險判別能力。如何有效地利用不完全數(shù)據(jù)數(shù)據(jù)來提高違約風(fēng)險評價性能是對 P2P 平臺的借款人進(jìn)行有效關(guān)鍵。
機(jī)制將在 3.2 節(jié)中作詳細(xì)介紹。復(fù)雜和耗時和問題,LightGBM 模的 one-side 采樣、互斥特征綁定方作詳細(xì)介紹。層次結(jié)構(gòu)是需要解決的問題。我們做一個平衡,以防止模型的過擬合 生長策略,如圖 3.1 所示。因?yàn)閷σ獙ζ溥M(jìn)行分裂和搜索。Level-w同一層的所有葉節(jié)點(diǎn),會影響模策略:Leaf-wise 生長策略,如圖,每次從當(dāng)前所有葉節(jié)點(diǎn)中,尋找。因此,與 Level-wise 相比,L時獲得更好的精度。Leaf-wise 的合。因此,LightGBM 在 Leaf-wisMax Depth),以防止模型過擬合
【學(xué)位授予單位】:合肥工業(yè)大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2019
【分類號】:F832.4;F724.6
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 康春花;孫金玲;孫小堅;曾平飛;;缺失數(shù)據(jù)比率和處理方法對非隨機(jī)缺失數(shù)據(jù)能力參數(shù)估計準(zhǔn)確性的影響[J];江西師范大學(xué)學(xué)報(自然科學(xué)版);2017年03期
2 董學(xué)思;林麗娟;趙楊;魏永越;戴俊程;陳峰;;多組學(xué)聯(lián)合缺失數(shù)據(jù)填補(bǔ)方法的評價[J];中國衛(wèi)生統(tǒng)計;2017年04期
3 楊金英;崔朝杰;;圖模型方法用于二值變量相關(guān)性分析中缺失數(shù)據(jù)的估計[J];中國衛(wèi)生統(tǒng)計;2012年05期
4 許凱;何道江;;有缺失數(shù)據(jù)的條件獨(dú)立正態(tài)母體中參數(shù)的最優(yōu)同變估計[J];數(shù)學(xué)學(xué)報(中文版);2016年06期
5 王軍;李建勛;韓山;王興;;一種效能評估中缺失數(shù)據(jù)的填充方法[J];上海交通大學(xué)學(xué)報;2017年02期
6 吳潔瓊;呂小納;黨志軍;;網(wǎng)絡(luò)高并發(fā)信息的缺失數(shù)據(jù)修復(fù)方法仿真[J];信息通信;2017年11期
7 喻成林;黃強(qiáng);李鋼;;觀測站缺失數(shù)據(jù)修復(fù)的神經(jīng)網(wǎng)絡(luò)模型研究[J];礦山測量;2014年01期
8 帥平;李曉松;周曉華;劉玉萍;;缺失數(shù)據(jù)統(tǒng)計處理方法的研究進(jìn)展[J];中國衛(wèi)生統(tǒng)計;2013年01期
9 張偉;馮萍;趙永紅;袁佳英;李梅;;加權(quán)估計方程用于缺失數(shù)據(jù)的處理[J];中國衛(wèi)生統(tǒng)計;2013年03期
10 詹棠森;;缺失數(shù)據(jù)調(diào)整修正優(yōu)化磨光法研究及陶瓷中的應(yīng)用[J];中國陶瓷;2012年06期
相關(guān)會議論文 前10條
1 印明輝;秦婷婷;伏振;嚴(yán)明明;尹平;;貝葉斯累加回歸樹模型處理缺失數(shù)據(jù)研究[A];2017年中國衛(wèi)生統(tǒng)計學(xué)學(xué)術(shù)年會論文集[C];2017年
2 耿直;葛丹丹;;縱向研究非隨機(jī)缺失數(shù)據(jù)分析[A];中國現(xiàn)場統(tǒng)計研究會第12屆學(xué)術(shù)年會論文集[C];2005年
3 劉紅云;;追蹤研究中非隨機(jī)缺失數(shù)據(jù)的處理:基于模型的方法及其應(yīng)用[A];第十五屆全國心理學(xué)學(xué)術(shù)會議論文摘要集[C];2012年
4 管河山;姜青山;Steven X.Wei;;一種處理缺失數(shù)據(jù)的新方法[A];第二十一屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(技術(shù)報告篇)[C];2004年
5 肖悅;劉紅云;;密集型追蹤數(shù)據(jù)中數(shù)據(jù)的缺失機(jī)制及缺失比例對時變效應(yīng)模型估計精度的影響[A];第二十屆全國心理學(xué)學(xué)術(shù)會議--心理學(xué)與國民心理健康摘要集[C];2017年
6 孫金玲;;混合測驗(yàn)中非隨機(jī)缺失數(shù)據(jù)的缺失比率與處理方法對IRT參數(shù)估計的影響[A];第十八屆全國心理學(xué)學(xué)術(shù)會議摘要集——心理學(xué)與社會發(fā)展[C];2015年
7 李曉煦;侯杰泰;;結(jié)構(gòu)方程中缺失數(shù)據(jù)的處理:FIML,EM與MI[A];全國教育與心理統(tǒng)計測量學(xué)術(shù)年會論文摘要集[C];2006年
8 周曉東;湯銀才;費(fèi)鶴良;;定數(shù)轉(zhuǎn)換步加試驗(yàn)缺失數(shù)據(jù)場合下的參數(shù)估計[A];中國現(xiàn)場統(tǒng)計研究會第十三屆學(xué)術(shù)年會論文集[C];2007年
9 葉素靜;唐文清;張敏強(qiáng);;追蹤研究中缺失數(shù)據(jù)的處理方法述評[A];心理學(xué)與創(chuàng)新能力提升——第十六屆全國心理學(xué)學(xué)術(shù)會議論文集[C];2013年
10 雷蕾;吳乃君;劉鵬;劉蘭娟;;靈敏度分析:分類器中的缺失數(shù)據(jù)[A];第11屆海峽兩岸信息管理發(fā)展策略研討會論文集[C];2005年
相關(guān)重要報紙文章 前1條
1 劉若帆邋宋林;詩邦金A6+1:憑借其質(zhì)提高其量[N];農(nóng)資導(dǎo)報;2008年
相關(guān)博士學(xué)位論文 前10條
1 丁先文;缺失數(shù)據(jù)模型的估計與變量選擇[D];云南大學(xué);2018年
2 高航;面向缺失數(shù)據(jù)的機(jī)器學(xué)習(xí)算法研究[D];國防科學(xué)技術(shù)大學(xué);2016年
3 唐琳;帶有不可忽略缺失數(shù)據(jù)的廣義半?yún)?shù)非線性模型的統(tǒng)計推斷[D];云南大學(xué);2017年
4 龔奇源;面向數(shù)據(jù)發(fā)布的數(shù)據(jù)匿名技術(shù)研究[D];東南大學(xué);2016年
5 陸福忠;數(shù)據(jù)缺失下的分布函數(shù)估計問題[D];復(fù)旦大學(xué);2007年
6 駱汝九;多指標(biāo)綜合評價的非參數(shù)方法和缺失數(shù)據(jù)的聚類方法研究[D];揚(yáng)州大學(xué);2011年
7 郭東林;缺失數(shù)據(jù)下幾類回歸模型的估計方法與理論[D];北京工業(yè)大學(xué);2017年
8 馬友;基于QoS缺失數(shù)據(jù)預(yù)測的個性化Web服務(wù)推薦方法研究[D];北京郵電大學(xué);2015年
9 羅顯貴;帶缺失數(shù)據(jù)列聯(lián)表與半?yún)?shù)非線性動態(tài)因子模型的統(tǒng)計推斷[D];云南大學(xué);2015年
10 祝麗萍;幾種缺失數(shù)據(jù)和高維數(shù)據(jù)模型的統(tǒng)計分析[D];山東大學(xué);2012年
相關(guān)碩士學(xué)位論文 前10條
1 許天歌;缺失數(shù)據(jù)下的P2P借貸違約風(fēng)險評價方法研究[D];合肥工業(yè)大學(xué);2019年
2 宋雅婷;缺失數(shù)據(jù)處理方法及其在臨床試驗(yàn)中的應(yīng)用[D];華中科技大學(xué);2019年
3 石章波;缺失數(shù)據(jù)下眾數(shù)線性模型的統(tǒng)計診斷[D];云南大學(xué);2018年
4 陳婉嬌;缺失數(shù)據(jù)插補(bǔ)方法及其在醫(yī)學(xué)領(lǐng)域的應(yīng)用研究[D];華南理工大學(xué);2019年
5 王玉梅;缺失數(shù)據(jù)下基于眾數(shù)回歸兩類半?yún)?shù)模型估計與變量選擇[D];蘭州理工大學(xué);2019年
6 仝倩;帶缺失數(shù)據(jù)的半?yún)?shù)非線性模型基于經(jīng)驗(yàn)似然的統(tǒng)計診斷[D];南京理工大學(xué);2018年
7 張文佳;缺失數(shù)據(jù)下變系數(shù)部分非線性模型的參數(shù)估計[D];南京理工大學(xué);2018年
8 李佳妮;缺失數(shù)據(jù)統(tǒng)計方法及其敏感性的研究[D];哈爾濱工業(yè)大學(xué);2018年
9 杜麗媛;含有缺失和不可適用數(shù)據(jù)的古生物譜系樹構(gòu)建方法研究[D];西北大學(xué);2018年
10 陳琨;邊坡自動化監(jiān)測數(shù)據(jù)缺失填補(bǔ)算法研究[D];重慶交通大學(xué);2018年
本文編號:2702013
本文鏈接:http://www.sikaile.net/jingjilunwen/guojimaoyilunwen/2702013.html