天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 管理論文 > 貨幣論文 >

類別不平衡數(shù)據(jù)的個(gè)人信用風(fēng)險(xiǎn)評(píng)估算法研究

發(fā)布時(shí)間:2023-03-30 01:27
  互聯(lián)網(wǎng)技術(shù)催生了一大批新興產(chǎn)業(yè),促使互聯(lián)網(wǎng)金融業(yè)蓬勃發(fā)展,不論是京東白條、螞蟻花唄還是P2P網(wǎng)貸,越來越多的信用消費(fèi)產(chǎn)品走入人們的生活。眾多互聯(lián)網(wǎng)信貸產(chǎn)品在為用戶提供便捷可靠的服務(wù)之前,需要先依據(jù)用戶的基本信息、歷史交易數(shù)據(jù)來構(gòu)建個(gè)人信用風(fēng)險(xiǎn)評(píng)估模型以預(yù)測(cè)可能發(fā)生的違約風(fēng)險(xiǎn)。使用機(jī)器學(xué)習(xí)算法構(gòu)建個(gè)人信用風(fēng)險(xiǎn)評(píng)估模型是解決這一實(shí)際問題的常用方法。信貸數(shù)據(jù)通常是類別不平衡的,傳統(tǒng)的機(jī)器學(xué)習(xí)算法在面向不平衡數(shù)據(jù)的分類問題時(shí),通常易將少數(shù)類樣本誤分為多數(shù)類,導(dǎo)致預(yù)測(cè)結(jié)果不理想。然而在現(xiàn)實(shí)問題中,對(duì)少數(shù)類樣本進(jìn)行準(zhǔn)確地識(shí)別往往是更為重要的。面對(duì)不平衡數(shù)據(jù),如何有效的對(duì)其進(jìn)行分類有著重要的研究價(jià)值。與此同時(shí),信貸數(shù)據(jù)還具有維度高、冗余特征較多的特點(diǎn),如何對(duì)數(shù)據(jù)進(jìn)行有效的特征選擇,使得選出的特征子集在包含最多數(shù)據(jù)信息量、最少噪聲特征的同時(shí),可以最大程度提升模型泛化能力、節(jié)省模型訓(xùn)練時(shí)間;诖吮尘,本文以提高不平衡的信貸數(shù)據(jù)中少數(shù)類樣本的識(shí)別率為研究目標(biāo),提出了一種改進(jìn)的數(shù)據(jù)過采樣方法和一種改進(jìn)的特征選擇方法,用于處理高維不平衡的信貸數(shù)據(jù),通過改進(jìn)的深度森林算法建立個(gè)人信用風(fēng)險(xiǎn)評(píng)估模型,具體研究內(nèi)容...

【文章頁數(shù)】:63 頁

【學(xué)位級(jí)別】:碩士

【文章目錄】:
摘要
abstract
第一章 緒論
    1.1 研究背景及意義
    1.2 國內(nèi)外研究現(xiàn)狀
        1.2.1 數(shù)據(jù)層面方法
        1.2.2 算法層面方法
    1.3 研究內(nèi)容及主要工作
    1.4 章節(jié)安排
第二章 相關(guān)知識(shí)與理論
    2.1 不平衡數(shù)據(jù)分析
        2.1.1 數(shù)據(jù)重采樣算法
        2.1.2 面向分類型數(shù)據(jù)的過采樣方法
    2.2 特征選擇
        2.2.1 mRMR算法
        2.2.2 Relief算法
        2.2.3 FAST算法
    2.3 常用的集成分類算法
        2.3.1 決策樹與隨機(jī)森林
        2.3.2 XGBoost
        2.3.3 CatBoost
    2.4 模型的評(píng)估與校驗(yàn)
    2.5 本章小結(jié)
第三章 不平衡數(shù)據(jù)預(yù)處理
    3.1 數(shù)據(jù)清洗
    3.2 數(shù)據(jù)重采樣
        3.2.1 面向分類型數(shù)據(jù)的過采樣方法
        3.2.2 異構(gòu)值差度量HVDM
        3.2.3 改進(jìn)的ADASYN數(shù)據(jù)重采樣方法
    3.3 特征選擇
        3.3.1 ROC與AUC評(píng)價(jià)標(biāo)準(zhǔn)
        3.3.2 Kendell相關(guān)等級(jí)
        3.3.3 一種新的特征選擇方法
    3.4 實(shí)驗(yàn)
        3.4.1 實(shí)驗(yàn)環(huán)境與數(shù)據(jù)
        3.4.2 評(píng)價(jià)指標(biāo)
        3.4.3 實(shí)驗(yàn)與分析
    3.5 本章小結(jié)
第四章 基于集成學(xué)習(xí)的個(gè)人信用風(fēng)險(xiǎn)預(yù)測(cè)模型
    4.1 深度森林
    4.2 基于改進(jìn)深度森林的個(gè)人信用風(fēng)險(xiǎn)預(yù)測(cè)模型
        4.2.1 模型參數(shù)設(shè)置
        4.2.2 實(shí)驗(yàn)及結(jié)果分析
    4.3 基于集成學(xué)習(xí)算法的個(gè)人信用風(fēng)險(xiǎn)預(yù)測(cè)模型
        4.3.1 模型參數(shù)設(shè)置
        4.3.2 實(shí)驗(yàn)及結(jié)果分析
    4.4 本章小結(jié)
第五章 總結(jié)與展望
    5.1 總結(jié)
    5.2 展望
參考文獻(xiàn)
致謝



本文編號(hào):3774898

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/guanlilunwen/huobilw/3774898.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶2129e***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com