參數(shù)空間下的流式大數(shù)據在線異常檢測算法研究
發(fā)布時間:2021-12-19 02:09
近年來,社交網絡、基于位置的在線服務、移動支付、交通監(jiān)控以及各種手機應用中產生了海量的高速實時數(shù)據流,從這些高速數(shù)據流中快速高效地檢測出復雜異常狀況已被許多領域認為是至關重要的。在很多復雜應用環(huán)境下,由于不同需求,不同參數(shù)設定的異常狀況往往需要同時被實時監(jiān)控,這對快速的檢測查詢響應帶來了較大挑戰(zhàn)。因此,本文針對移動社交網絡中用戶異常簽到,以及參數(shù)空間下的流式多異常檢測問題,做出了如下工作:針對移動社交網絡中用戶異常簽到位置檢測問題,提出了一類基于用戶移動行為特征的異常簽到在線檢測方法。首先,在基于距離的異常模型基礎上,提出了基于歷史位置(H-Outlier)和基于好友圈(F-Outlier)兩種異常簽到模型;然后,針對H-Outlier,提出了一種優(yōu)化的檢測算法H-Opt,利用所提的簽到狀態(tài)模型與優(yōu)化的鄰居搜索機制降低檢測時間;針對F-Outlier,提出了一種基于觸發(fā)的優(yōu)化檢測算法F-Opt,將連續(xù)的在線異常檢測轉化成了基于觸發(fā)的異常檢測方式。最后,在真實的移動社交網絡用戶簽到數(shù)據集上,驗證了所提算法的有效性。實驗結果顯示,F-Opt顯著降低了H-Opt的異常檢測錯誤率;同時,相比于...
【文章來源】:煙臺大學山東省
【文章頁數(shù)】:62 頁
【學位級別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 研究意義
1.2 研究思路與創(chuàng)新點
1.3 研究內容與組織結構
2 異常檢測算法綜述
2.1 在靜態(tài)數(shù)據中基于距離的異常檢測
2.2 在數(shù)據流中基于距離的異常檢測
2.3 多查詢的異常檢測
3 移動社交網絡異常簽到在線檢測算法
3.1 引言
3.2 問題定義
3.3 基于歷史位置的異常簽到檢測算法
3.3.1 優(yōu)化策略
3.3.2 H-Outlier在線檢測算法
3.3.3 基于好友圈的異常簽到檢測算法
3.4 實驗與結果
3.4.1 實驗數(shù)據與測試方法
3.4.2 有效性評估
3.4.3 效率評估
3.5 小結
4 參數(shù)空間下的流式大數(shù)據在線異常檢測框架
4.1 引言
4.2 問題定義
4.3 異常檢測框架
4.3.1 在參數(shù)空間R×K中的異常檢測
4.3.2 在參數(shù)空間R×K×W中的異常檢測
4.3.3 在參數(shù)空間R×K×S中的異常檢測
4.3.4 針對異常檢測的PSOD框架
4.4 實驗數(shù)據與實驗方法
4.4.1 不同參數(shù)空間的性能
4.4.2 不同參數(shù)規(guī)模的性能
4.5 小結
5 實際應用分析討論
5.1 引言
5.2 信用卡欺詐檢測
5.3 出租車欺詐檢測
5.4 異常簽到檢測
6 總結與展望
參考文獻
致謝
攻讀碩士期間發(fā)表的論文
附錄一 表目錄
附錄二 圖目錄
【參考文獻】:
期刊論文
[1]《大數(shù)據產業(yè)發(fā)展規(guī)劃(2016—2020年)》發(fā)布[J]. 阮健. 工程建設標準化. 2017(03)
[2]在線社交網絡中異常帳號檢測方法研究[J]. 張玉清,呂少卿,范丹. 計算機學報. 2015(10)
[3]基于群體特征的社交僵尸網絡檢測方法[J]. 倪平,張玉清,聞觀行,劉奇旭,范丹. 中國科學院大學學報. 2014(05)
[4]基于軌跡點局部異常度的異常點檢測算法[J]. 劉良旭,樂嘉錦,喬少杰,宋加濤. 計算機學報. 2011(10)
[5]基于R-Tree的高效異常軌跡檢測算法[J]. 劉良旭,喬少杰,劉賓,樂嘉錦,唐常杰. 軟件學報. 2009(09)
本文編號:3543577
【文章來源】:煙臺大學山東省
【文章頁數(shù)】:62 頁
【學位級別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 研究意義
1.2 研究思路與創(chuàng)新點
1.3 研究內容與組織結構
2 異常檢測算法綜述
2.1 在靜態(tài)數(shù)據中基于距離的異常檢測
2.2 在數(shù)據流中基于距離的異常檢測
2.3 多查詢的異常檢測
3 移動社交網絡異常簽到在線檢測算法
3.1 引言
3.2 問題定義
3.3 基于歷史位置的異常簽到檢測算法
3.3.1 優(yōu)化策略
3.3.2 H-Outlier在線檢測算法
3.3.3 基于好友圈的異常簽到檢測算法
3.4 實驗與結果
3.4.1 實驗數(shù)據與測試方法
3.4.2 有效性評估
3.4.3 效率評估
3.5 小結
4 參數(shù)空間下的流式大數(shù)據在線異常檢測框架
4.1 引言
4.2 問題定義
4.3 異常檢測框架
4.3.1 在參數(shù)空間R×K中的異常檢測
4.3.2 在參數(shù)空間R×K×W中的異常檢測
4.3.3 在參數(shù)空間R×K×S中的異常檢測
4.3.4 針對異常檢測的PSOD框架
4.4 實驗數(shù)據與實驗方法
4.4.1 不同參數(shù)空間的性能
4.4.2 不同參數(shù)規(guī)模的性能
4.5 小結
5 實際應用分析討論
5.1 引言
5.2 信用卡欺詐檢測
5.3 出租車欺詐檢測
5.4 異常簽到檢測
6 總結與展望
參考文獻
致謝
攻讀碩士期間發(fā)表的論文
附錄一 表目錄
附錄二 圖目錄
【參考文獻】:
期刊論文
[1]《大數(shù)據產業(yè)發(fā)展規(guī)劃(2016—2020年)》發(fā)布[J]. 阮健. 工程建設標準化. 2017(03)
[2]在線社交網絡中異常帳號檢測方法研究[J]. 張玉清,呂少卿,范丹. 計算機學報. 2015(10)
[3]基于群體特征的社交僵尸網絡檢測方法[J]. 倪平,張玉清,聞觀行,劉奇旭,范丹. 中國科學院大學學報. 2014(05)
[4]基于軌跡點局部異常度的異常點檢測算法[J]. 劉良旭,樂嘉錦,喬少杰,宋加濤. 計算機學報. 2011(10)
[5]基于R-Tree的高效異常軌跡檢測算法[J]. 劉良旭,喬少杰,劉賓,樂嘉錦,唐常杰. 軟件學報. 2009(09)
本文編號:3543577
本文鏈接:http://www.sikaile.net/kejilunwen/sousuoyinqinglunwen/3543577.html
教材專著