天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 軟件論文 >

基于密度和距離的離群點檢測方法研究與應用

發(fā)布時間:2022-01-19 17:08
  離群點檢測是數(shù)據(jù)挖掘中一個重要的研究領域,它的主要任務是找出那些與大部分對象產生機制不相同的對象。目前,離群點檢測方法已經得到了深入的研究,但是使用單一離群因子的離群點檢測方法已經難以提升算法的精度。因此,使用多條件混合參數(shù)組成離群因子的離群點檢測方法已經成為離群點檢測分析領域的一個重要的研究方向。本論文詳細的介紹了離群點檢測的概念,主要包括:離群點的形成機理,定義以及分類。在分析了已有的離群點檢測方法的優(yōu)缺點之后,本文提出了兩種新的離群點檢測算法。(1)提出了一種基于密度和距離雙參數(shù)的離群點檢測算法——DDPOS算法。通過分析發(fā)現(xiàn)使用單一的密度離群因子或單一的距離離群因子的離群點檢測算法很難再提升檢測的精度,并且難以消除邊界點的干擾。因此,DDPOS通過計算對象的局部密度來觀察對象之間的關聯(lián)度;再根據(jù)局部密度來計算對象之間的全局距離,進而評估對象的平均偏離程度,同時消除邊界點的干擾;最后將二者組合成新的離群因子來判斷離群點。DDPOS綜合了近鄰算法框架完成離群點檢測。理論分析與實驗結果表明,DDPOS算法可以有效地進行離群點檢測。(2)提出了一種基于劃分候選集的離群點檢測算法——CP... 

【文章來源】:西安理工大學陜西省

【文章頁數(shù)】:72 頁

【學位級別】:碩士

【部分圖文】:

基于密度和距離的離群點檢測方法研究與應用


離群點示意圖

標準正態(tài)分布,標準正態(tài)分布


圖 2-2 標準正態(tài)分布Fig.2-2 Standard Normal Distribution圖 2-2 所示,標準正態(tài)分布是以均值為 0,標準差為 1 的正態(tài)分布,記為態(tài)分布又稱為高斯正態(tài)分布。這種分布當數(shù)據(jù)量很大時,估計效果很好,從兩端的值的概率將遠遠的小于中間的部分的值。從統(tǒng)計學中的大數(shù)定律可情況下使用正態(tài)分布可以得到很好的擬合。于統(tǒng)計學習方法的離群點檢測使用起來非常的方便,只需要找對符合數(shù)據(jù)集型就能夠得到想要的結果。但是,這種方法存在著以下幾個問題: 對于數(shù)據(jù)集的知識背景的了解有很高的要求,雖然存在許多類型的數(shù)據(jù)集較常見的高斯模型,二項分布,卡方統(tǒng)計量等來描述[9][20][50]。但是在具體的著非標準的數(shù)據(jù)集,基于統(tǒng)計模型的方法通常是根據(jù)數(shù)據(jù)集的分布情況來選具體的真實數(shù)據(jù)集中很難做到,目前使用未知情況的真實數(shù)據(jù)集才是發(fā)展時也更加符合實際生活中的情況。所以模型的選擇能夠直接影響最終的檢的數(shù)據(jù)集并不能適應于所選擇的模型,反而會降低檢測的精度。 對于數(shù)據(jù)的格式要求比較嚴苛,基于模型的方法都是使用一元屬性的數(shù)據(jù)

分布情況,離群點,分布情況,標準數(shù)據(jù)集


西安理工大學工程碩士專業(yè)學位論文計與結果境和實驗數(shù)據(jù)集進行的實驗采用的設備是聯(lián)想 ThinkPad PC 機,Intel i5 3210M器,8G 內存,操作系統(tǒng)是 Windows 7 旗艦版 64 位系統(tǒng),算用 Eclipse IDE 編寫。用人造合成數(shù)據(jù)集和真實數(shù)據(jù)集來測試。人造合成數(shù)據(jù)集中的真實數(shù)據(jù)集均來自 UCI 標準數(shù)據(jù)集或者按照一定規(guī)則經過數(shù)數(shù)據(jù)集數(shù)據(jù)集中包含兩個高斯簇,它們的簇中心分別位于(0.5,0.6)和含了 100 個數(shù)據(jù)點,其中含有 4 個離群點。在圖 3-1 中,我們布情況。

【參考文獻】:
期刊論文
[1]基于高斯核函數(shù)改進的電力用戶用電數(shù)據(jù)離群點檢測方法[J]. 孫毅,李世豪,崔燦,李彬,陳宋宋,崔高穎.  電網技術. 2018(05)
[2]一種基于多標記的局部離群點檢測算法[J]. 錢景輝,梁棟.  微電子學與計算機. 2017(10)
[3]基于高斯過程模型的異常檢測算法[J]. 于冰潔,夏戰(zhàn)國,王久龍.  計算機工程與設計. 2016(04)
[4]NLOF:一種新的基于密度的局部離群點檢測算法[J]. 王敬華,趙新想,張國燕,劉建銀.  計算機科學. 2013(08)



本文編號:3597244

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/3597244.html


Copyright(c)文論論文網All Rights Reserved | 網站地圖 |

版權申明:資料由用戶2a06d***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com