天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

時間序列流數(shù)據(jù)的建模預測和異常檢測方法研究

發(fā)布時間:2020-12-11 19:33
  時間序列是按照時間順序采集到的某觀測變量的數(shù)據(jù)集合,廣泛地存在于金融、電力負荷和過程控制等領域中。時間序列在流數(shù)據(jù)環(huán)境下呈現(xiàn)出海量無限、單遍掃描、實時到達和伴有噪聲的特點。通過實時建模的方式挖掘出時間序列流數(shù)據(jù)的運行規(guī)律,并在建模預測的基礎上分析出隱藏于數(shù)據(jù)中的異常模式,可以對實際的生產、生活產生更加積極的影響。針對現(xiàn)有大多數(shù)靜態(tài)、離線的時間序列建模預測算法不能在流數(shù)據(jù)環(huán)境下進行實時分析的問題,本文就時間序列流數(shù)據(jù)的建模預測中如何選擇訓練樣本,滿足實時性要求的同時提高模型的預測準確性等問題,設計了一種基于GEP算法,并加入雙重滑動窗口、群體爬山算法和數(shù)據(jù)融合方法來實現(xiàn)對時間序列流數(shù)據(jù)進行實時建模預測的算法。以4組加入不同程度高斯噪聲的數(shù)據(jù)集作為測試數(shù)據(jù)集,將本文算法和HTM算法在同等數(shù)據(jù)傳輸間隔的實時性要求下對測試數(shù)據(jù)集的預測結果進行實驗對比。用平均相對百分比誤差(MAPE)值作為評判算法預測準確性的指標。實驗結果顯示本文算法在4組數(shù)據(jù)集上的整體MAPE值均低于HTM算法,表明了本文算法比HTM算法擁有更高的預測準確性。鑒于現(xiàn)有的大多數(shù)時間序列異常檢測算法用于批量處理數(shù)據(jù),不能直接應用... 

【文章來源】:西安理工大學陜西省

【文章頁數(shù)】:63 頁

【學位級別】:碩士

【部分圖文】:

時間序列流數(shù)據(jù)的建模預測和異常檢測方法研究


某患者心電圖數(shù)據(jù)[16]

基因,表達式,長度,尾部


隨機生成,尾部是由終結集中的字符隨機生成,頭部長度由所求解的問題根據(jù)經驗而定,而尾部的長度則由式(2-1)決定,設頭部長度為,尾部長度為,則=(1)+1(2-1)其中代表符號集的符號所需的最大參數(shù)個數(shù),即=2。如果給定頭部長度=7,則此基因的尾部長度=7(21)+1=8,則此基因個體的總長度為15,有以下基因編碼:+2122212(2-2)其中S代表函數(shù)符號,此基因個體的有效部分長度為6,其前六位所對應的表達式為=2sin(x)+x,其余部分為根據(jù)編碼規(guī)則隨機填充的冗余部分,這部分不體現(xiàn)在基因的表達中。此基因個體對應的表達式樹如圖2-2:圖2-2此基因個體對應的表達式樹Fig.2-2Theexpressiontreecorrespondingtothisgeneindividual

示意圖,滑動窗口,示意圖,數(shù)據(jù)


第3章時間序列流數(shù)據(jù)的建模預測和異常檢測方法21的數(shù)據(jù)能反映流數(shù)據(jù)當前的最新規(guī)律。={1,2,3…}(3-1)式(3-1)中,為一個時間序列流,為時刻收集到的數(shù)據(jù)點,是一個維向量,∈,當=1,此為單變量時間序列流。設此滑動窗口的寬度為,則此滑動窗口在時間序列流上劃分樣本數(shù)據(jù)的方式如圖3-1所示。圖3-1滑動窗口示意圖Fig.3-1Schematicdiagramofslidingwindow圖3-1中,虛線框內的數(shù)據(jù)為1時刻滑動窗口中的從到1的個數(shù)據(jù),實線框內的數(shù)據(jù)為當前時刻滑動窗口包含的從+1到的個數(shù)據(jù)。當前在對時間序列流數(shù)據(jù)的分析中,通用的實時處理時間序列流數(shù)據(jù)的方法主要都是基于最新的時間窗口內數(shù)據(jù)構建一個模型,然后對這個模型進行實時更新;瑒哟翱诘膶挾仁撬惴ㄖ惺潜容^重要的參數(shù),一般情況下,的值在算法運行過程中為預先設置的值并保持固定不變。我們也可以通過一些先驗知識估計值,但上述方法過于含糊,而且在很多場景中,我們并不可能預先知道流數(shù)據(jù)的分布變化規(guī)律,并以此為作為根據(jù)來設置最優(yōu)的值。流數(shù)據(jù)的分布動態(tài)變化的特性使得最優(yōu)值也變得不固定。因此在具體應用中,我們應設置的動態(tài)值。文獻[65,66]分別在滑動窗口的基礎上提出了不同的改進辦法,并且提高了對流數(shù)據(jù)處理的效率,但是這些改進方法都嚴重地占用了終端算法過多的時空資源,從而限制了算法的應用和發(fā)展。文獻[67]設計了一種用兩個固定的滑動時間窗口分別對窗口中的數(shù)據(jù)進行更新和處理的嵌套滑動窗口模型,由于這兩個窗口的相對位置和寬度不能隨著數(shù)據(jù)處理的需要發(fā)生改變,使得其喪失了靈活性。鑒于這種情況,文獻[68]基于歷史數(shù)據(jù)先選擇一個介于比較小的值和一個比較大的值之間的中間值值。再基于在線學習方式,對流數(shù)據(jù)的分布進行在線學習,以


本文編號:2911100

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/shoufeilunwen/xixikjs/2911100.html


Copyright(c)文論論文網All Rights Reserved | 網站地圖 |

版權申明:資料由用戶ae4e2***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com