天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 管理論文 > 證券論文 >

異常點挖掘及證券行業(yè)應用實例研究

發(fā)布時間:2020-06-12 06:15
【摘要】:在數(shù)據(jù)挖掘研究領域,異常點挖掘一直是學者和研究人員關注的熱點問題,從一開始作為聚類分析的副產(chǎn)品,發(fā)展到各類挖掘算法層出不窮,已經(jīng)成為數(shù)據(jù)挖掘領域的一個獨立且重要的命題。隨著金融、保險和電信行業(yè)對風險管理的要求加大,異常點挖掘在風險監(jiān)測方面的優(yōu)勢得到了極大的發(fā)揮。另一方面,,隨著網(wǎng)絡技術的發(fā)展、計算機計算能力的提高,異常點挖掘和其他數(shù)據(jù)挖掘技術一樣得到了充分的發(fā)展。 以往對異常點挖掘的研究都是以挖掘算法作為對象,以數(shù)理統(tǒng)計、集合論、離散數(shù)學和計算機科學等手段進行研究,往往忽略了如何運用異常點挖掘,并與實際問題結(jié)合這一問題。隨著異常點挖掘不斷用于風險探測,如何把異常點挖掘的理論和實際的行業(yè)背景結(jié)合,成為了一個重要的課題。 本文首先簡單回顧已有的數(shù)據(jù)挖掘生命周期模型以及異常點基本概念和挖掘算法。對國內(nèi)外的研究現(xiàn)狀作了說明,并解釋了一些相關概念和專業(yè)術語。 然后將關注點放在異常點挖掘生命周期上,從七個方面描述了整個挖掘過程,在討論中配以一個算例作為輔助說明。 其次本文實現(xiàn)了異常點挖掘最常用的兩類基于距離的算法:DKP最近鄰算法和基于LOF密度的算法。為課題研究提供了工具和算法實現(xiàn)上的準備。 最后,全文以一個實際課題為例,把前文研究內(nèi)容貫穿于案例中,詳細說明了異常點挖掘和證券行業(yè)結(jié)合解決客戶交易異常偵測的全過程,并對挖掘結(jié)果進行了分析,提出相應的建議對策。從而使論文提出的觀點兼具一定的理論意義和實踐價值。
【圖文】:

異常點,全局,數(shù)據(jù)集中,對象


計算時變量(維)的選擇很難把握,往往需要反復計算、取舍、比較來得到滿意的變量(維)組合;根據(jù)數(shù)據(jù)范圍不同,可以識別全局異常點和局部異常點,如圖2.5所示,如果說ol是一個全局異常點,o2可以看作是一個局部異常點,兩者在挖掘方法上有所不同;根據(jù)數(shù)據(jù)類型不同,又可以分為分類型和數(shù)值型(離散型和連續(xù)型)異常點。盡管以上分類不很完備,但側(cè)面反映了數(shù)據(jù)集中異常點類型的多樣性,因此,有效發(fā)現(xiàn)數(shù)據(jù)集中的異常點并不是一件容易的工作,需要采用有效的策略和算法。

正態(tài)分布,異常點,正態(tài)分布,數(shù)據(jù)源


且應該適當?shù)陌裬的值設的大一些。上述結(jié)論從M.B~i夢8]等人在研究LoF算法時所做的實驗中也得到了驗證。圖3.1表示了一個500個點組成的樣本數(shù)據(jù),該樣本符合高斯分布(正態(tài)分布),對其進行基于LOF密度計算,得到的LOF值和k(圖3,1右圖中的MinPts)取值的關系圖。從圖3.1的右圖中可以看到,當k(MinPts)<6時,LOF的最大值偏離其均值很多,導致LOF的波動很大
【學位授予單位】:同濟大學
【學位級別】:碩士
【學位授予年份】:2006
【分類號】:F830.91;F224

【引證文獻】

相關碩士學位論文 前2條

1 孔淑慧;流數(shù)據(jù)時序模式依賴挖掘在股市行情分析中的應用[D];北京交通大學;2008年

2 林翠香;基于數(shù)據(jù)挖掘的葡萄酒質(zhì)量識別[D];中南大學;2010年



本文編號:2709114

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/guanlilunwen/zhqtouz/2709114.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶df331***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com