基于滑動窗口的多元時間序列數(shù)據(jù)動態(tài)關(guān)聯(lián)規(guī)則挖掘
本文選題:多元時間序列 + 動態(tài)關(guān)聯(lián)規(guī)則。 參考:《哈爾濱工業(yè)大學(xué)》2016年碩士論文
【摘要】:隨著經(jīng)濟的快速發(fā)展,在工業(yè)生產(chǎn),金融服務(wù),電子商務(wù),衛(wèi)星遙感,傳感器網(wǎng)絡(luò)等領(lǐng)域中都會產(chǎn)生大量的數(shù)據(jù),這些數(shù)據(jù)往往都帶有時間標(biāo)簽,即時間序列流。挖掘某一個領(lǐng)域多個時間序列流的關(guān)聯(lián)關(guān)系是其中一個重要的研究方向。由于時間序列流具有海量性、實時性和連續(xù)性等特點,其中的數(shù)據(jù)和知識都會隨著時間的推移而發(fā)生變化,傳統(tǒng)的關(guān)聯(lián)規(guī)則挖掘方法難以對其進行有效挖掘。目前已有一些數(shù)據(jù)流關(guān)聯(lián)規(guī)則挖掘的研究,但是很多都是數(shù)據(jù)流已經(jīng)符號化了,或者說數(shù)據(jù)本身已經(jīng)代表了一種模式,不需要預(yù)處理提取模式。針對多元時間序列的關(guān)聯(lián)規(guī)則挖掘的深入研究較少,且很多挖掘都是采用等長的時間長度來提取模式,挖掘出來的規(guī)則的每個元模式含有相同的時間長度,也沒有考慮到新數(shù)據(jù)中的規(guī)則更令人感興趣的情況。本課題使用滑動窗口來對時間序列數(shù)據(jù)進行限制,挖掘其中的動態(tài)關(guān)聯(lián)規(guī)則即規(guī)則隨滑動窗口的移動動態(tài)變化。由于時間序列數(shù)據(jù)是連續(xù)性的,在挖掘前需要對其進行預(yù)處理來提取元模式形成事務(wù)集,預(yù)處理的過程首先對序列進行線性化近似,對線性化后的序列切割使在同一時間段內(nèi)每個序列只有一條線段也即一種變化模式,然后將相似的線段增量地聚類,為每一類分配一個符號,這樣多元時間序列數(shù)據(jù)就被符號化了,將同一時間段內(nèi)的符號組成事務(wù)集就可以對其進行關(guān)聯(lián)規(guī)則挖掘了。本課題關(guān)聯(lián)挖掘的算法同樣是基于滑動窗口的。在滑動窗口維護一個全局的SWIU-tree(Incremental Updating tree based on Sliding Window)來存儲已經(jīng)掃描的事務(wù)集的概要結(jié)構(gòu),通過剪枝策略以去掉SWIU-tree中的不頻繁模式和過期的模式。同時,對滑動窗口中不同的基本窗口采取計數(shù)衰減的策略,減少歷史事務(wù)的影響。在實際熱電廠的數(shù)據(jù)和股票數(shù)據(jù)集上通過將已有算法與本課題SWIU-tree算法對比,顯示了本課題所提算法的有效性,可以快速準(zhǔn)確地挖掘多元時間序列的關(guān)聯(lián)規(guī)則。
[Abstract]:With the rapid development of economy, a lot of data will be produced in the fields of industrial production, financial service, electronic commerce, satellite remote sensing, sensor network and so on. It is an important research direction to mine the association relation of multiple time series flows in a certain field. Because the time series flow has the characteristics of magnanimity, real-time and continuity, the data and knowledge will change with the passage of time, so it is difficult for the traditional association rules mining method to mine them effectively. There have been some researches on data stream association rules mining, but many data streams have been symbolized, or the data itself represents a pattern, which does not need to be preprocessed to extract the schema. There are few in-depth studies on association rules mining for multivariate time series, and many mining methods use equal length of time to extract patterns. Each meta pattern of the extracted rules contains the same length of time. Nor did it take into account the more interesting circumstances of the rules in the new data. In this paper, the sliding window is used to restrict the time series data, and the dynamic association rules are mined, that is, the rules change dynamically with the moving of the sliding window. Because time series data are continuous, it is necessary to preprocess them before mining to extract meta-pattern to form transaction set. The linearized sequence is cut so that there is only one line segment for each sequence in the same time period, that is, a change pattern, and then the similar segments are clustered incrementally to assign a symbol for each class. In this way, the multivariate time series data are symbolized, and the symbols in the same time period constitute the transaction set, which can be mined by association rules. The algorithm of association mining is also based on sliding window. A global SWIU-tree(Incremental Updating tree based on Sliding Window) is maintained in the sliding window to store the outline structure of the scanned transaction set, and the pruning strategy is used to remove the infrequent and expired patterns in the SWIU-tree. At the same time, different basic windows in sliding window are counted and attenuated to reduce the influence of historical transaction. By comparing the existing algorithm with the SWIU-tree algorithm in the data and stock data sets of the actual thermal power plant, the validity of the proposed algorithm is shown, and the association rules of the multivariate time series can be quickly and accurately mined.
【學(xué)位授予單位】:哈爾濱工業(yè)大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:TP311.13
【相似文獻】
相關(guān)期刊論文 前10條
1 鐘穎莉;復(fù)合滑動窗口連接算法[J];哈爾濱商業(yè)大學(xué)學(xué)報(自然科學(xué)版);2004年03期
2 李峰;肖建華;;時間序列相似性分析中滑動窗口寬度的確定[J];計算機科學(xué)與探索;2009年01期
3 閆巧梅;;滑動窗口技術(shù)在電信中的應(yīng)用設(shè)計模型[J];電腦開發(fā)與應(yīng)用;2012年07期
4 王偉平,李建中,張冬冬,郭龍江;數(shù)據(jù)流上周期更新滑動窗口的連接算法[J];哈爾濱工業(yè)大學(xué)學(xué)報;2005年06期
5 裴麗鵲;;一種基于滑動窗口的時間序列異常檢測算法[J];巢湖學(xué)院學(xué)報;2011年03期
6 譚宏強;牛強;;基于滑動窗口及局部特征的時間序列符號化方法[J];計算機應(yīng)用研究;2013年03期
7 陳川,林亞平;滑動窗口協(xié)議分析及其在微機上的模擬實現(xiàn)[J];計算機應(yīng)用;2000年02期
8 李建中,張冬冬;滑動窗口規(guī)模的動態(tài)調(diào)整算法[J];軟件學(xué)報;2004年12期
9 伍紅茹,黃欣陽,劉雙根,藺大正;最佳滑動窗口編碼法及其在快速模冪乘中的應(yīng)用[J];南昌大學(xué)學(xué)報(工科版);2005年02期
10 劉陶剛;趙榮彩;姚遠;瞿進;;分塊存儲的滑動窗口數(shù)據(jù)重用技術(shù)[J];計算機應(yīng)用;2010年05期
相關(guān)會議論文 前10條
1 蘇東;宋寶燕;楊興華;歐征宇;于亞新;于戈;;基于滑動窗口語義的聚集計算方法[A];第二十一屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(研究報告篇)[C];2004年
2 汪罕;趙加奎;陳立軍;;流和滑動窗口模型下的直徑計算(英文)[A];第26屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(B輯)[C];2009年
3 賀冉冉;馬玲;;基于滑動窗口的非參數(shù)趨勢檢驗在氣候序列趨勢和波動分析中的應(yīng)用[A];促進科技經(jīng)濟結(jié)合,,服務(wù)創(chuàng)新驅(qū)動發(fā)展——蚌埠市科協(xié)2012年度學(xué)術(shù)年會論文集[C];2012年
4 楊宜東;孫志揮;周曉云;;滑動窗口中的變化檢測[A];第二十二屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(技術(shù)報告篇)[C];2005年
5 王成江;冉兵;戴迪;吳磊;;基于滑動窗口的動態(tài)手寫簽名局部相關(guān)性研究[A];湖北省機械工程學(xué)會青年分會2006年年會暨第2屆機械學(xué)院院長(系主任)會議論文集(下)[C];2006年
6 王偉平;李建中;張冬冬;郭龍江;;數(shù)據(jù)流上基于時間滑動窗口的連接算法研究[A];第二十屆全國數(shù)據(jù)庫學(xué)術(shù)會議論文集(研究報告篇)[C];2003年
7 王栩;李建中;王偉平;;基于滑動窗口的數(shù)據(jù)流壓縮技術(shù)及連續(xù)查詢處理方法[A];第二十一屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(研究報告篇)[C];2004年
8 閆朝升;李建中;李金寶;;數(shù)據(jù)流上滑動窗口技術(shù)的研究與實現(xiàn)[A];第二十一屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(技術(shù)報告篇)[C];2004年
9 王秋棠;王鵬;周皓峰;汪衛(wèi);;基于滑動窗口的概率數(shù)據(jù)流上的聚集查詢[A];第二十五屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(二)[C];2008年
10 沈偉;鄒建峰;;基于滑動窗口的語音混合算法[A];第二屆和諧人機環(huán)境聯(lián)合學(xué)術(shù)會議(HHME2006)——第15屆中國多媒體學(xué)術(shù)會議(NCMT'06)論文集[C];2006年
相關(guān)碩士學(xué)位論文 前10條
1 鐘陽;基于數(shù)據(jù)統(tǒng)計分析的變槳系統(tǒng)故障預(yù)警方法[D];華北電力大學(xué);2015年
2 熊騰飛;基于滑動窗口的多元時間序列數(shù)據(jù)動態(tài)關(guān)聯(lián)規(guī)則挖掘[D];哈爾濱工業(yè)大學(xué);2016年
3 柴子峰;基于滑動窗口的弱標(biāo)記物體檢測方法研究[D];哈爾濱工業(yè)大學(xué);2016年
4 閆冰;仿真平臺中基于滑動窗口的流數(shù)據(jù)處理策略研究[D];哈爾濱工程大學(xué);2011年
5 王秋棠;基于滑動窗口的概率數(shù)據(jù)流上的聚集查詢[D];復(fù)旦大學(xué);2009年
6 賀春亮;基于數(shù)據(jù)流滑動窗口的降載技術(shù)研究[D];燕山大學(xué);2009年
7 嚴(yán)澄;基于滑動窗口的數(shù)據(jù)流關(guān)聯(lián)規(guī)則挖掘研究[D];浙江大學(xué);2010年
8 閆巧梅;N-δ滑動窗口模型下的優(yōu)化數(shù)據(jù)流聚類算法[D];太原理工大學(xué);2008年
9 李俊;基于滑動窗口的數(shù)據(jù)流頻繁閉合項集挖掘研究[D];暨南大學(xué);2008年
10 龔云;基于滑動窗口的密度聚類算法研究[D];安徽大學(xué);2011年
本文編號:1936748
本文鏈接:http://www.sikaile.net/jingjilunwen/dianzishangwulunwen/1936748.html