天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 軟件論文 >

基于滑動窗口的數(shù)據(jù)流關聯(lián)規(guī)則挖掘算法研究

發(fā)布時間:2018-01-21 04:41

  本文關鍵詞: 數(shù)據(jù)流挖掘 滑動窗口 關聯(lián)規(guī)則 多最小支持度 加權 出處:《天津工業(yè)大學》2017年碩士論文 論文類型:學位論文


【摘要】:隨著數(shù)據(jù)庫技術在政府、企業(yè)以及其它社會組織的生產(chǎn)運營過程中的廣泛應用,越來越多種類的數(shù)據(jù)形式出現(xiàn)在了研究者的視野當中。而其中的流數(shù)據(jù)由于廣泛的出現(xiàn)在商務網(wǎng)絡交易、股市、傳感器網(wǎng)絡等諸多領域,因此引起了研究者的極大研究熱情。與傳統(tǒng)的數(shù)據(jù)形式相比,數(shù)據(jù)流具有數(shù)據(jù)量大、實時性強、順序、數(shù)據(jù)多樣的特點,正是由于這些特點決定了數(shù)據(jù)流不適合于將全部的數(shù)據(jù)存儲在數(shù)據(jù)庫中,因此傳統(tǒng)的數(shù)據(jù)挖掘算法并不適宜數(shù)據(jù)流的挖掘。并且以往的數(shù)據(jù)挖掘算法都是默認各數(shù)據(jù)項具有相同的重要性且各項目均勻分布,然而在實際的應用中,各項目的重要性是不盡相同并且是非均勻分布的;诖,本文引入了多最小支持度和加權的思想。為了研究的便利性,研究者通常會將連續(xù)的數(shù)據(jù)流進行分段,即為時間段,我們通常情況下會將這種時間段稱為數(shù)據(jù)窗口。在實際的研究過程當中,根據(jù)不同的分段方式,時間窗口又被我們分為滑動窗口模型、衰減窗口模型和界標窗口模型,本文采用的是應用較為普遍的滑動窗口模型。關聯(lián)規(guī)則挖掘的目的是為了找到所有的強關聯(lián)規(guī)則,即:超過最小支持度和最小置信度的所有規(guī)則。根據(jù)數(shù)據(jù)挖掘在實際應用中的情況,我們一般將關聯(lián)規(guī)則挖掘分為兩步:第一步,找出目標數(shù)據(jù)集中所有的頻繁模式;第二步,用這些頻繁項集產(chǎn)生符合條件的關聯(lián)規(guī)則。其中第二步是整個關聯(lián)規(guī)則挖掘過程的關鍵。在現(xiàn)實應用中,若支持度設置的過小,則會引發(fā)組合爆炸,導致挖掘過程無法進行;如果支持度的值設置的過大,則得不到稀有項目的關聯(lián)規(guī)則。多最小支持度加權的方法就是針對這兩種現(xiàn)實的情況所提出的一種解決思想。本文研究了基于滑動窗口的多最小支持度加權的數(shù)據(jù)流關聯(lián)規(guī)則挖掘算法SWM-MMSW,以及在top-k頻繁項集挖掘的基礎上引入加權的思想,對該算法進行改進,產(chǎn)生W-TKFM算法。這兩個算法主要采用事務矩陣和二項集矩陣來分別存儲事務數(shù)據(jù)和頻繁2-項集。經(jīng)推導和實驗驗證,SWM-MMSW算法和W-TKFM算法能夠有效的挖掘出頻繁項集并且均具有很好的時空效率。
[Abstract]:With the wide application of database technology in the production and operation of government, enterprises and other social organizations. More and more kinds of data forms appear in the field of view of researchers, and the flow data is widely used in many fields, such as business network trading, stock market, sensor network and so on. Compared with the traditional data form, the data flow has the characteristics of large amount of data, strong real-time, order and variety of data. Because of these characteristics, the data flow is not suitable to store all the data in the database. Therefore, the traditional data mining algorithm is not suitable for data stream mining, and the previous data mining algorithms are the default data items with the same importance and uniform distribution, but in practical applications. The importance of each item is different and non-uniform distribution. Based on this, this paper introduces the idea of multi-minimum support and weighted. In order to study the convenience. Researchers usually segment continuous data streams, that is, time periods, which we usually call data windows. In the actual research process, according to different segmentation methods. Time window is divided into sliding window model, attenuation window model and boundary sign window model. The purpose of mining association rules is to find all strong association rules. According to the actual application of data mining, we generally divide the mining of association rules into two steps: the first step. Identify all frequent patterns in the target dataset; The second step is to use these frequent itemsets to generate eligible association rules. The second step is the key of the whole association rules mining process. In practical applications, if the support degree is too small, it will cause a combination explosion. The mining process can not be carried out; If the value of support is set too large. The method of multi-minimum support weighting is a solution to these two real situations. This paper studies the number of multi-minimum support weighted based on sliding window. According to stream association rules mining algorithm SWM-MMSW. Based on the mining of top-k frequent itemsets, the idea of weighting is introduced to improve the algorithm. W-TKFM algorithm is generated. The two algorithms mainly use transaction matrix and binomial set matrix to store transaction data and frequent 2-item set respectively. SWM-MMSW algorithm and W-TKFM algorithm can effectively mine frequent itemsets and have good space-time efficiency.
【學位授予單位】:天津工業(yè)大學
【學位級別】:碩士
【學位授予年份】:2017
【分類號】:TP311.13

【相似文獻】

相關期刊論文 前10條

1 鐘穎莉;復合滑動窗口連接算法[J];哈爾濱商業(yè)大學學報(自然科學版);2004年03期

2 李峰;肖建華;;時間序列相似性分析中滑動窗口寬度的確定[J];計算機科學與探索;2009年01期

3 閆巧梅;;滑動窗口技術在電信中的應用設計模型[J];電腦開發(fā)與應用;2012年07期

4 王偉平,李建中,張冬冬,郭龍江;數(shù)據(jù)流上周期更新滑動窗口的連接算法[J];哈爾濱工業(yè)大學學報;2005年06期

5 裴麗鵲;;一種基于滑動窗口的時間序列異常檢測算法[J];巢湖學院學報;2011年03期

6 譚宏強;牛強;;基于滑動窗口及局部特征的時間序列符號化方法[J];計算機應用研究;2013年03期

7 陳川,林亞平;滑動窗口協(xié)議分析及其在微機上的模擬實現(xiàn)[J];計算機應用;2000年02期

8 李建中,張冬冬;滑動窗口規(guī)模的動態(tài)調(diào)整算法[J];軟件學報;2004年12期

9 伍紅茹,黃欣陽,劉雙根,藺大正;最佳滑動窗口編碼法及其在快速模冪乘中的應用[J];南昌大學學報(工科版);2005年02期

10 劉陶剛;趙榮彩;姚遠;瞿進;;分塊存儲的滑動窗口數(shù)據(jù)重用技術[J];計算機應用;2010年05期

相關會議論文 前10條

1 蘇東;宋寶燕;楊興華;歐征宇;于亞新;于戈;;基于滑動窗口語義的聚集計算方法[A];第二十一屆中國數(shù)據(jù)庫學術會議論文集(研究報告篇)[C];2004年

2 汪罕;趙加奎;陳立軍;;流和滑動窗口模型下的直徑計算(英文)[A];第26屆中國數(shù)據(jù)庫學術會議論文集(B輯)[C];2009年

3 賀冉冉;馬玲;;基于滑動窗口的非參數(shù)趨勢檢驗在氣候序列趨勢和波動分析中的應用[A];促進科技經(jīng)濟結合,,服務創(chuàng)新驅(qū)動發(fā)展——蚌埠市科協(xié)2012年度學術年會論文集[C];2012年

4 楊宜東;孫志揮;周曉云;;滑動窗口中的變化檢測[A];第二十二屆中國數(shù)據(jù)庫學術會議論文集(技術報告篇)[C];2005年

5 王成江;冉兵;戴迪;吳磊;;基于滑動窗口的動態(tài)手寫簽名局部相關性研究[A];湖北省機械工程學會青年分會2006年年會暨第2屆機械學院院長(系主任)會議論文集(下)[C];2006年

6 王偉平;李建中;張冬冬;郭龍江;;數(shù)據(jù)流上基于時間滑動窗口的連接算法研究[A];第二十屆全國數(shù)據(jù)庫學術會議論文集(研究報告篇)[C];2003年

7 王栩;李建中;王偉平;;基于滑動窗口的數(shù)據(jù)流壓縮技術及連續(xù)查詢處理方法[A];第二十一屆中國數(shù)據(jù)庫學術會議論文集(研究報告篇)[C];2004年

8 閆朝升;李建中;李金寶;;數(shù)據(jù)流上滑動窗口技術的研究與實現(xiàn)[A];第二十一屆中國數(shù)據(jù)庫學術會議論文集(技術報告篇)[C];2004年

9 王秋棠;王鵬;周皓峰;汪衛(wèi);;基于滑動窗口的概率數(shù)據(jù)流上的聚集查詢[A];第二十五屆中國數(shù)據(jù)庫學術會議論文集(二)[C];2008年

10 沈偉;鄒建峰;;基于滑動窗口的語音混合算法[A];第二屆和諧人機環(huán)境聯(lián)合學術會議(HHME2006)——第15屆中國多媒體學術會議(NCMT'06)論文集[C];2006年

相關碩士學位論文 前10條

1 鐘陽;基于數(shù)據(jù)統(tǒng)計分析的變槳系統(tǒng)故障預警方法[D];華北電力大學;2015年

2 熊騰飛;基于滑動窗口的多元時間序列數(shù)據(jù)動態(tài)關聯(lián)規(guī)則挖掘[D];哈爾濱工業(yè)大學;2016年

3 柴子峰;基于滑動窗口的弱標記物體檢測方法研究[D];哈爾濱工業(yè)大學;2016年

4 賈可;基于滑動窗口的指紋中心點定位算法研究[D];西安郵電大學;2016年

5 朱保琨;基于滑動窗口車牌檢測的FPGA架構設計與實現(xiàn)[D];長春理工大學;2016年

6 陳鵬;基于滑動窗口法的比較加密技術及其應用研究[D];西安電子科技大學;2015年

7 李鵬飛;基于滑動窗口的數(shù)據(jù)流關聯(lián)規(guī)則挖掘算法研究[D];天津工業(yè)大學;2017年

8 閆冰;仿真平臺中基于滑動窗口的流數(shù)據(jù)處理策略研究[D];哈爾濱工程大學;2011年

9 王秋棠;基于滑動窗口的概率數(shù)據(jù)流上的聚集查詢[D];復旦大學;2009年

10 賀春亮;基于數(shù)據(jù)流滑動窗口的降載技術研究[D];燕山大學;2009年



本文編號:1450500

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/1450500.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶66898***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com