基于社交數據的個人信用評價研究
發(fā)布時間:2021-12-17 03:35
個人信用評價是互聯(lián)網金融的重要組成部分,是交易雙方正常往來的前提保證。隨著大數據、人工智能、云計算、區(qū)塊鏈等技術的發(fā)展,有關個人信用評價的研究也逐漸往新的方向發(fā)展并出現新的特征。傳統(tǒng)的信用評價業(yè)務范圍較小,在借貸歷史、交易記錄等金融數據缺失或不對稱的情況下很難直接判斷出一個人的真實信用,但利用大數據環(huán)境下的電商數據、社交數據以及網絡上不經意的各種行為數據評估出的用戶信用可以有效補充用戶的信用信息。近幾年,各大互聯(lián)網公司、線上借貸平臺以及信用依托產業(yè)如摩拜單車等都借助網絡業(yè)務中的信息創(chuàng)建了個人信用評價模型來評定用戶的信用,以此限制低信用用戶的交易從而降低風險。諸如此類的互聯(lián)網企業(yè)擁有海量的用戶數據,在大數據征信的環(huán)境下占了優(yōu)勢地位,各自構建了適用自身業(yè)務的信用評價體系。然而一些大數據征信業(yè)務同樣只從一個層面如線上交易數據評定用戶的信用,為了避免傳統(tǒng)信用評價過程中出現信用信息不足的情況,本文將從另一個角度來評估用戶補充用戶的信用情況,即通過社交數據進行個人信用評價;谏缃粩祿u價用戶個人信用的研究過程中,以下三個問題有重大的研究意義:(1)由用戶社交數據評估所得的社交信用只代表了用戶信用...
【文章來源】:浙江財經大學浙江省
【文章頁數】:64 頁
【學位級別】:碩士
【部分圖文】:
技術路線圖
第二節(jié) 行為模型及假設建立通過文獻回顧,在以往學者研究的基礎上可知社交數據在一定程度上可以評判一個人的信用,然而多數研究均是基于獲取了用戶在 P2P 平臺或其他金融平臺上的信用,將社交數據作為進一步評價用戶信用或探究信用影響因素的輔助數據。本章節(jié)的主要目的便是區(qū)別于前人研究,通過實證方法從正面探討社交因素是否會影響用戶的信用。若是影響,則影響過程如何表現,最后證實社交數據可以用來評價用戶的信用且信用評價結果與真實信用成正比。我們基于 ELM 理論框架構建行為模型并提出假設,找出信用評價過程的影響因素并驗證其結果可行性。本文的行為模型框架如圖 3-1 所示。中央路徑主要通過用戶社交關系來說明微博用戶的可信度,而周邊路徑則通過社交身份質量體現用戶的社交信用。這兩個指標在涉及社交數據的文獻中普遍存在。
N 表示用戶總數。陽光信用的分類標準中,信用分在[300,600]區(qū)間的歸類為信用差的用戶,在[601,900]區(qū)間的歸類為信用好的用戶。參考芝麻信用官方的評價標準,我們將用戶的芝麻信用分在區(qū)間[350,650]內的定義為信用差的用戶,芝麻信用分大于 650 分的為信用好的用戶。本文通過建立多個分類模型來驗證陽光信用分預測用戶信用的準確性,PCC 值越高,則模型的分類結果越好。我們將數據集分成 8:2 的比例,即 80%的數據用作訓練集,20%的數據用作測試集。我們選擇了 5 個分類模型來驗證陽光信用分的分類準確率,包括 CART 決策樹模型、支持向量機、神經網絡、K 最近鄰和貝葉斯模型。連城(2016)在其研究中指出,由于信用評價模型背后的構建理論與機理不同,對于同一組數據,不同的分類模型可以有不一樣的表現效果。通過比較分類模型,不僅可以看到分類模型結果的差異,還可以直觀地看到陽光信用分的分類率。本節(jié)中的結果均由 R 軟件運行獲得,PCC 的結果如下(參見圖 3-2)。
本文編號:3539336
【文章來源】:浙江財經大學浙江省
【文章頁數】:64 頁
【學位級別】:碩士
【部分圖文】:
技術路線圖
第二節(jié) 行為模型及假設建立通過文獻回顧,在以往學者研究的基礎上可知社交數據在一定程度上可以評判一個人的信用,然而多數研究均是基于獲取了用戶在 P2P 平臺或其他金融平臺上的信用,將社交數據作為進一步評價用戶信用或探究信用影響因素的輔助數據。本章節(jié)的主要目的便是區(qū)別于前人研究,通過實證方法從正面探討社交因素是否會影響用戶的信用。若是影響,則影響過程如何表現,最后證實社交數據可以用來評價用戶的信用且信用評價結果與真實信用成正比。我們基于 ELM 理論框架構建行為模型并提出假設,找出信用評價過程的影響因素并驗證其結果可行性。本文的行為模型框架如圖 3-1 所示。中央路徑主要通過用戶社交關系來說明微博用戶的可信度,而周邊路徑則通過社交身份質量體現用戶的社交信用。這兩個指標在涉及社交數據的文獻中普遍存在。
N 表示用戶總數。陽光信用的分類標準中,信用分在[300,600]區(qū)間的歸類為信用差的用戶,在[601,900]區(qū)間的歸類為信用好的用戶。參考芝麻信用官方的評價標準,我們將用戶的芝麻信用分在區(qū)間[350,650]內的定義為信用差的用戶,芝麻信用分大于 650 分的為信用好的用戶。本文通過建立多個分類模型來驗證陽光信用分預測用戶信用的準確性,PCC 值越高,則模型的分類結果越好。我們將數據集分成 8:2 的比例,即 80%的數據用作訓練集,20%的數據用作測試集。我們選擇了 5 個分類模型來驗證陽光信用分的分類準確率,包括 CART 決策樹模型、支持向量機、神經網絡、K 最近鄰和貝葉斯模型。連城(2016)在其研究中指出,由于信用評價模型背后的構建理論與機理不同,對于同一組數據,不同的分類模型可以有不一樣的表現效果。通過比較分類模型,不僅可以看到分類模型結果的差異,還可以直觀地看到陽光信用分的分類率。本節(jié)中的結果均由 R 軟件運行獲得,PCC 的結果如下(參見圖 3-2)。
本文編號:3539336
本文鏈接:http://www.sikaile.net/falvlunwen/jinrfa/3539336.html