離群檢測模型在反洗錢中的應(yīng)用研究
[Abstract]:The financial transaction network is a very complex graph network, it is necessary to mine the small pattern which is different from other data objects from the massive, complex, noisy data set in the transaction network. That is, the identification of suspected accounts in financial transaction networks and anti-money laundering studies, which can be translated into outlier detection in data mining. The traditional outlier detection method based on clustering has two great shortcomings. On the one hand, there is no good model to analyze the difference of data objects in the class; on the other hand, the relationship between the classes is analyzed. There is no suitable method of discovery. In view of the above problems, we can combine clustering, local outlier detection and link discovery, and give a complete outlier detection model. For each transaction account, according to the number of transactions and the amount of transactions, the original data is suitable for outlier mining. When setting up the data set, we should pay attention to the elimination of some invalid data. The structured data set is more effective and complete. The improved two-step clustering algorithm is used to cluster the regular data sets, and the accounts with similar transaction characteristics are divided into a class. The clustering algorithm has a good clustering effect, and some abnormal data objects can also be found. The data set after clustering makes the analysis of model discovery more specific. Then the anomaly detection model based on clustering is established for each cluster. The local outlier detection algorithm based on Markov distance is used to calculate the outlier index and present it in ascending order. The link discovery technology based on graph entropy is used to reduce the transaction network after clustering. The key transaction nodes in the trading network are given. The clustering accuracy of the improved two-step clustering algorithm and the accuracy of the density outlier detection algorithm based on Markov distance are verified by two sets of comparative experiments. Combined with the project financial transaction analysis system, according to the previous research, a outlier detection model module is implemented to verify the validity of the real case data.
【學(xué)位授予單位】:華中科技大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:TP311.13;D924.3
【相似文獻(xiàn)】
相關(guān)期刊論文 前1條
1 盧正鼎,王瓊;基于相似度的離群模式發(fā)現(xiàn)模型[J];華中科技大學(xué)學(xué)報(bào)(自然科學(xué)版);2005年01期
相關(guān)會(huì)議論文 前9條
1 張鋒;常會(huì)友;;茫然第三方支持的隱私保持離群點(diǎn)探測協(xié)議[A];第二十四屆中國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2007年
2 連鳳娜;吳錦林;薛永生;;一種改進(jìn)的基于距離的離群挖掘算法[A];第二十四屆中國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2007年
3 梁雪琴;劉紅生;代秀梅;周亞芬;;聚類離群點(diǎn)挖掘技術(shù)在內(nèi)部審計(jì)信息化中的應(yīng)用——一個(gè)來自商業(yè)銀行信用卡審計(jì)的實(shí)例[A];全國內(nèi)部審計(jì)理論研討優(yōu)秀論文集(2013)[C];2014年
4 于浩;王斌;肖剛;楊曉春;;基于距離的不確定離群點(diǎn)檢測[A];第26屆中國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(A輯)[C];2009年
5 許龍飛;熊君麗;段敏;;基于粗糙集的高維空間離群點(diǎn)發(fā)現(xiàn)算法研究[A];第二十屆全國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2003年
6 劉文遠(yuǎn);李振平;王寶文;裴繼輝;;一種多維數(shù)據(jù)的離群點(diǎn)檢測算法[A];2007年全國第十一屆企業(yè)信息化與工業(yè)工程學(xué)術(shù)會(huì)議論文集[C];2007年
7 魏藜;錢衛(wèi)寧;周傲英;;HOT:尋找高維空間中的離群點(diǎn)[A];第十八屆全國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2001年
8 周紅福;錢衛(wèi)寧;魏藜;周傲英;;EDOLOIS:高效準(zhǔn)確的子空間局部離群點(diǎn)發(fā)現(xiàn)[A];第二十屆全國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2003年
9 魏藜;錢衛(wèi)寧;周傲英;;SLOT:基于估計(jì)的高效子空間局部離群點(diǎn)發(fā)現(xiàn)[A];第十九屆全國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2002年
相關(guān)博士學(xué)位論文 前10條
1 劉莘;基于時(shí)空分析的CCS泄漏預(yù)警關(guān)鍵技術(shù)研究[D];中國礦業(yè)大學(xué);2016年
2 劉露;異質(zhì)信息網(wǎng)絡(luò)中離群點(diǎn)檢測方法研究[D];吉林大學(xué);2017年
3 楊鵬;離群檢測及其優(yōu)化算法研究[D];重慶大學(xué);2010年
4 林海;離群檢測及離群釋義空間查找算法研究[D];重慶大學(xué);2012年
5 薛安榮;空間離群點(diǎn)挖掘技術(shù)的研究[D];江蘇大學(xué);2008年
6 楊茂林;離群檢測算法研究[D];華中科技大學(xué);2012年
7 金義富;高維稀疏離群數(shù)據(jù)集延伸知識(shí)發(fā)現(xiàn)研究[D];重慶大學(xué);2007年
8 雷大江;離群檢測與離群釋義算法研究[D];重慶大學(xué);2012年
9 萬家強(qiáng);基于連通性的離群檢測與聚類研究[D];重慶大學(xué);2014年
10 唐向紅;數(shù)據(jù)流離群點(diǎn)檢測研究[D];華中科技大學(xué);2010年
相關(guān)碩士學(xué)位論文 前10條
1 韓紅霞;基于距離離群點(diǎn)的分析與研究[D];江蘇大學(xué);2007年
2 黃馨玉;基于鄰域重心變化的離群點(diǎn)檢測算法研究[D];遼寧大學(xué);2015年
3 程百球;基于EP模式的離群點(diǎn)發(fā)現(xiàn)[D];安慶師范學(xué)院;2015年
4 歐陽根平;Hadoop云平臺(tái)下基于離群點(diǎn)挖掘的入侵檢測技術(shù)研究[D];電子科技大學(xué);2015年
5 鄧璇;數(shù)據(jù)流挖掘關(guān)鍵技術(shù)研究與實(shí)現(xiàn)[D];電子科技大學(xué);2015年
6 周瑩瑩;利用離群點(diǎn)檢測改進(jìn)協(xié)同過濾推薦算法[D];南京郵電大學(xué);2015年
7 陳娟;基于離群特征提取和能量計(jì)算的SVM股市預(yù)測研究[D];合肥工業(yè)大學(xué);2014年
8 張友強(qiáng);基于選擇性集成學(xué)習(xí)的離群點(diǎn)檢測研究[D];青島科技大學(xué);2016年
9 王美晶;基于PSO算法的離群點(diǎn)檢測方法研究[D];福州大學(xué);2013年
10 關(guān)皓文;基于離群點(diǎn)檢測方法的醫(yī)保異常發(fā)現(xiàn)[D];山東大學(xué);2016年
,本文編號(hào):2202023
本文鏈接:http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/2202023.html