天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 管理論文 > 信貸論文 >

基于數(shù)據(jù)挖掘的商戶套用欺詐檢測研究與應(yīng)用

發(fā)布時間:2017-10-28 18:17

  本文關(guān)鍵詞:基于數(shù)據(jù)挖掘的商戶套用欺詐檢測研究與應(yīng)用


  更多相關(guān)文章: 數(shù)據(jù)挖掘 欺詐檢測 商戶類別碼 邏輯回歸 Hadoop


【摘要】:隨著電子商務(wù)不斷發(fā)展,人們出門不再攜帶大額現(xiàn)金,更多的是刷卡消費(fèi),這帶動了越來越多商戶辦理了POS機(jī)。收費(fèi)機(jī)構(gòu)在不同行業(yè)的POS機(jī)上所提取的費(fèi)率也不一樣。第三方支付機(jī)構(gòu)根據(jù)商戶所經(jīng)營的行業(yè)主要營業(yè)收入為商戶擬制一個類別碼--商戶類別碼(Merchant Category Code),中國銀聯(lián)就是根據(jù)商戶類別碼收取不同手續(xù)費(fèi)。因此衍生出了套用商戶類別碼的違法行為!吧虘纛悇e碼套用”是指第三方支付機(jī)構(gòu)套用商戶類別碼享受低手續(xù)費(fèi)率的行為。欺詐檢測作為目前國內(nèi)外研究熱點(diǎn),是金融領(lǐng)域的一個重要課題。為此本文主要做了以下工作:1)基于商戶類別碼的標(biāo)準(zhǔn)行為模式庫建立本文將不同的行業(yè)有不同的營業(yè)時間區(qū)間、營業(yè)高峰或者低谷等的現(xiàn)象稱為該行業(yè)的“行為模式”。不同商戶類別碼的行為模式不同,本文采用機(jī)器學(xué)習(xí)的層次聚類算法,得到同一個商戶類別碼下具有代表性的N個行為模式。2)商戶套用欺詐檢測模型的建立。本文利用商戶的交易行為與商戶信息提取特征。在分類器選擇上面,本文采用概率分類器—邏輯斯蒂回歸解決該類問題。通過實(shí)驗(yàn)結(jié)果也表明了利用本文的檢測方法,準(zhǔn)確率,召回率均在80%以上,同時,即使訓(xùn)練樣本數(shù)據(jù)量較少的情況下,該分類器準(zhǔn)確率,召回率也沒有很大的降低。3)欺詐檢測模型的分布式實(shí)現(xiàn)。面對爆炸式增長的數(shù)據(jù)需求,分布式計算是未來大數(shù)據(jù)發(fā)展的重要方向。因此,基于這方面的要求,本文設(shè)計了商戶類別碼欺詐模型的分布式版本,即利用Hadoop平臺,通過HDFS分布式文件系統(tǒng)存儲海量數(shù)據(jù)文件,并使用Map Reduce計算模型并行計算提高檢測效率,包括如何上傳數(shù)據(jù)到HDFS,然后如何利用三個Job對原始數(shù)據(jù)進(jìn)行預(yù)處理,以及最后如何設(shè)計分類器,本文都進(jìn)行了詳細(xì)介紹。綜上所述,本文所提出的商戶類別碼欺詐檢測模型,不但具有優(yōu)秀的準(zhǔn)確率,也具有良好的時間效率。本文的研究不但解決了實(shí)際問題,也為其他金融領(lǐng)域的大數(shù)據(jù)問題提供了很好的借鑒意義。
【關(guān)鍵詞】:數(shù)據(jù)挖掘 欺詐檢測 商戶類別碼 邏輯回歸 Hadoop
【學(xué)位授予單位】:電子科技大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:F832.2;TP311.13
【目錄】:
  • 摘要5-6
  • ABSTRACT6-9
  • 第一章 緒論9-15
  • 1.1 研究背景9-11
  • 1.1.1 商戶類別碼套用欺詐來源9-10
  • 1.1.2 商戶類別碼欺詐的特點(diǎn)及危害10-11
  • 1.2 課題研究背景11-12
  • 1.3 本文的研究內(nèi)容與創(chuàng)新12-14
  • 1.4 本論文的結(jié)構(gòu)安排14-15
  • 第二章 相關(guān)理論與研究15-24
  • 2.1 數(shù)據(jù)挖掘基本理論15-16
  • 2.1.1 數(shù)據(jù)挖掘概念15
  • 2.1.2 數(shù)據(jù)挖掘步驟15-16
  • 2.2 數(shù)據(jù)挖掘主要研究內(nèi)容16-19
  • 2.2.1 分類任務(wù)16-17
  • 2.2.2 聚類任務(wù)17-18
  • 2.2.3 關(guān)聯(lián)分析18
  • 2.2.4 回歸分析18-19
  • 2.3 HADOOP理論19-23
  • 2.3.1 HADOOP架構(gòu)19-20
  • 2.3.2 HDFS簡介20-23
  • 2.3.3 MapReduce簡介23
  • 2.4 本章小結(jié)23-24
  • 第三章 商戶套用欺詐檢測模型設(shè)計24-45
  • 3.1 商戶套用欺詐檢測模型介紹24
  • 3.2 商戶套用欺詐檢測模型構(gòu)建24-44
  • 3.2.1 數(shù)據(jù)預(yù)處理26-33
  • 3.2.2 獲取標(biāo)準(zhǔn)行為模式模塊33-38
  • 3.2.3 分類器訓(xùn)練模塊38-44
  • 3.2.4 分類器分類模塊44
  • 3.3 本章小結(jié)44-45
  • 第四章 商戶類別碼欺詐檢測模型分布式實(shí)現(xiàn)45-59
  • 4.1 商戶套用欺詐檢測模型分布式設(shè)計45-46
  • 4.2 單機(jī)訓(xùn)練標(biāo)準(zhǔn)行為模式庫46-50
  • 4.3 單機(jī)訓(xùn)練分類器50-51
  • 4.4 上傳數(shù)據(jù)到HDFS51-53
  • 4.5 數(shù)據(jù)預(yù)處理分布式化53-57
  • 4.6 分類器分類分布式化57-58
  • 4.7 本章小結(jié)58-59
  • 第五章 實(shí)驗(yàn)結(jié)果與分析59-69
  • 5.1 實(shí)驗(yàn)環(huán)境59
  • 5.2 實(shí)驗(yàn)數(shù)據(jù)59-60
  • 5.3 實(shí)驗(yàn)結(jié)果60-68
  • 5.3.1 模型評價指標(biāo)60-62
  • 5.3.2 模型的檢測結(jié)果與分析62-68
  • 5.3.2.1 算法優(yōu)越性分析62-66
  • 5.3.2.2 時間優(yōu)越性分析66-68
  • 5.4 本章小結(jié)68-69
  • 第六章 總結(jié)與展望69-71
  • 6.1 本文的主要貢獻(xiàn)69-70
  • 6.2 工作展望70-71
  • 致謝71-72
  • 參考文獻(xiàn)72-75
  • 攻讀碩士學(xué)位期間取得的成果75-76

【參考文獻(xiàn)】

中國期刊全文數(shù)據(jù)庫 前9條

1 徐U,

本文編號:1109396


資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/guanlilunwen/bankxd/1109396.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶cf83e***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com