基于數(shù)據(jù)挖掘的商戶套用欺詐檢測研究與應(yīng)用
發(fā)布時間:2017-10-28 18:17
本文關(guān)鍵詞:基于數(shù)據(jù)挖掘的商戶套用欺詐檢測研究與應(yīng)用
更多相關(guān)文章: 數(shù)據(jù)挖掘 欺詐檢測 商戶類別碼 邏輯回歸 Hadoop
【摘要】:隨著電子商務(wù)不斷發(fā)展,人們出門不再攜帶大額現(xiàn)金,更多的是刷卡消費(fèi),這帶動了越來越多商戶辦理了POS機(jī)。收費(fèi)機(jī)構(gòu)在不同行業(yè)的POS機(jī)上所提取的費(fèi)率也不一樣。第三方支付機(jī)構(gòu)根據(jù)商戶所經(jīng)營的行業(yè)主要營業(yè)收入為商戶擬制一個類別碼--商戶類別碼(Merchant Category Code),中國銀聯(lián)就是根據(jù)商戶類別碼收取不同手續(xù)費(fèi)。因此衍生出了套用商戶類別碼的違法行為!吧虘纛悇e碼套用”是指第三方支付機(jī)構(gòu)套用商戶類別碼享受低手續(xù)費(fèi)率的行為。欺詐檢測作為目前國內(nèi)外研究熱點(diǎn),是金融領(lǐng)域的一個重要課題。為此本文主要做了以下工作:1)基于商戶類別碼的標(biāo)準(zhǔn)行為模式庫建立本文將不同的行業(yè)有不同的營業(yè)時間區(qū)間、營業(yè)高峰或者低谷等的現(xiàn)象稱為該行業(yè)的“行為模式”。不同商戶類別碼的行為模式不同,本文采用機(jī)器學(xué)習(xí)的層次聚類算法,得到同一個商戶類別碼下具有代表性的N個行為模式。2)商戶套用欺詐檢測模型的建立。本文利用商戶的交易行為與商戶信息提取特征。在分類器選擇上面,本文采用概率分類器—邏輯斯蒂回歸解決該類問題。通過實(shí)驗(yàn)結(jié)果也表明了利用本文的檢測方法,準(zhǔn)確率,召回率均在80%以上,同時,即使訓(xùn)練樣本數(shù)據(jù)量較少的情況下,該分類器準(zhǔn)確率,召回率也沒有很大的降低。3)欺詐檢測模型的分布式實(shí)現(xiàn)。面對爆炸式增長的數(shù)據(jù)需求,分布式計算是未來大數(shù)據(jù)發(fā)展的重要方向。因此,基于這方面的要求,本文設(shè)計了商戶類別碼欺詐模型的分布式版本,即利用Hadoop平臺,通過HDFS分布式文件系統(tǒng)存儲海量數(shù)據(jù)文件,并使用Map Reduce計算模型并行計算提高檢測效率,包括如何上傳數(shù)據(jù)到HDFS,然后如何利用三個Job對原始數(shù)據(jù)進(jìn)行預(yù)處理,以及最后如何設(shè)計分類器,本文都進(jìn)行了詳細(xì)介紹。綜上所述,本文所提出的商戶類別碼欺詐檢測模型,不但具有優(yōu)秀的準(zhǔn)確率,也具有良好的時間效率。本文的研究不但解決了實(shí)際問題,也為其他金融領(lǐng)域的大數(shù)據(jù)問題提供了很好的借鑒意義。
【關(guān)鍵詞】:數(shù)據(jù)挖掘 欺詐檢測 商戶類別碼 邏輯回歸 Hadoop
【學(xué)位授予單位】:電子科技大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:F832.2;TP311.13
【目錄】:
- 摘要5-6
- ABSTRACT6-9
- 第一章 緒論9-15
- 1.1 研究背景9-11
- 1.1.1 商戶類別碼套用欺詐來源9-10
- 1.1.2 商戶類別碼欺詐的特點(diǎn)及危害10-11
- 1.2 課題研究背景11-12
- 1.3 本文的研究內(nèi)容與創(chuàng)新12-14
- 1.4 本論文的結(jié)構(gòu)安排14-15
- 第二章 相關(guān)理論與研究15-24
- 2.1 數(shù)據(jù)挖掘基本理論15-16
- 2.1.1 數(shù)據(jù)挖掘概念15
- 2.1.2 數(shù)據(jù)挖掘步驟15-16
- 2.2 數(shù)據(jù)挖掘主要研究內(nèi)容16-19
- 2.2.1 分類任務(wù)16-17
- 2.2.2 聚類任務(wù)17-18
- 2.2.3 關(guān)聯(lián)分析18
- 2.2.4 回歸分析18-19
- 2.3 HADOOP理論19-23
- 2.3.1 HADOOP架構(gòu)19-20
- 2.3.2 HDFS簡介20-23
- 2.3.3 MapReduce簡介23
- 2.4 本章小結(jié)23-24
- 第三章 商戶套用欺詐檢測模型設(shè)計24-45
- 3.1 商戶套用欺詐檢測模型介紹24
- 3.2 商戶套用欺詐檢測模型構(gòu)建24-44
- 3.2.1 數(shù)據(jù)預(yù)處理26-33
- 3.2.2 獲取標(biāo)準(zhǔn)行為模式模塊33-38
- 3.2.3 分類器訓(xùn)練模塊38-44
- 3.2.4 分類器分類模塊44
- 3.3 本章小結(jié)44-45
- 第四章 商戶類別碼欺詐檢測模型分布式實(shí)現(xiàn)45-59
- 4.1 商戶套用欺詐檢測模型分布式設(shè)計45-46
- 4.2 單機(jī)訓(xùn)練標(biāo)準(zhǔn)行為模式庫46-50
- 4.3 單機(jī)訓(xùn)練分類器50-51
- 4.4 上傳數(shù)據(jù)到HDFS51-53
- 4.5 數(shù)據(jù)預(yù)處理分布式化53-57
- 4.6 分類器分類分布式化57-58
- 4.7 本章小結(jié)58-59
- 第五章 實(shí)驗(yàn)結(jié)果與分析59-69
- 5.1 實(shí)驗(yàn)環(huán)境59
- 5.2 實(shí)驗(yàn)數(shù)據(jù)59-60
- 5.3 實(shí)驗(yàn)結(jié)果60-68
- 5.3.1 模型評價指標(biāo)60-62
- 5.3.2 模型的檢測結(jié)果與分析62-68
- 5.3.2.1 算法優(yōu)越性分析62-66
- 5.3.2.2 時間優(yōu)越性分析66-68
- 5.4 本章小結(jié)68-69
- 第六章 總結(jié)與展望69-71
- 6.1 本文的主要貢獻(xiàn)69-70
- 6.2 工作展望70-71
- 致謝71-72
- 參考文獻(xiàn)72-75
- 攻讀碩士學(xué)位期間取得的成果75-76
【參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前9條
1 徐U,
本文編號:1109396
本文鏈接:http://www.sikaile.net/guanlilunwen/bankxd/1109396.html
最近更新
教材專著