基于頻繁項集的流式數(shù)據(jù)挖掘算法的研究與實現(xiàn)
發(fā)布時間:2021-11-19 23:46
數(shù)據(jù)流是實時、高速、無限的,數(shù)據(jù)流上的頻繁項集挖掘在多個領(lǐng)域得到了廣泛的應(yīng)用,如衛(wèi)星監(jiān)測數(shù)據(jù)分析、Web點擊流分析、天氣氣象數(shù)據(jù)分析等。挖掘流式數(shù)據(jù)能夠及時得到數(shù)據(jù)流中隱含的價值信息。由于流式數(shù)據(jù)的時變性,數(shù)據(jù)流中隱藏的信息會隨著時間的推移而發(fā)生改變,這給現(xiàn)有的頻繁項集挖掘算法帶來了新的挑戰(zhàn)。另外,最大頻繁項集的項集數(shù)目相對較少并且已經(jīng)包含所有的頻繁項集,所以挖掘流式數(shù)據(jù)上的最大頻繁項集具有很好的時空效率并且對進一步的關(guān)聯(lián)規(guī)則挖掘具有指導(dǎo)意義;谏鲜鲈,本文基于滑動窗口模型和頻繁項集挖掘算法前綴樹實現(xiàn),研究更加適應(yīng)數(shù)據(jù)流時變特征的、高效的流式數(shù)據(jù)頻繁項集挖掘算法,主要研究工作如下:首先,論文基于動態(tài)滑動窗口模型提出了一種嵌套窗口模型,用于快速挖掘數(shù)據(jù)流上的主要頻繁項集,以滿足數(shù)據(jù)流中發(fā)生的概念變化。并在此基礎(chǔ)上提出了基于嵌套窗口模型的數(shù)據(jù)流頻繁項集挖掘算法NWFI,該算法首先給定一個外嵌滑動窗口的大小,當(dāng)數(shù)據(jù)流到來時將所有數(shù)據(jù)項映射到時間軸上,并使用時間衰減模型降低歷史事務(wù)的權(quán)重,并由此來區(qū)分近期事務(wù)數(shù)據(jù)與歷史事務(wù)數(shù)據(jù)。然后考慮每一個數(shù)據(jù)項的期望窗口值,來動態(tài)調(diào)整內(nèi)嵌的挖掘窗口大小...
【文章來源】:重慶郵電大學(xué)重慶市
【文章頁數(shù)】:58 頁
【學(xué)位級別】:碩士
【部分圖文】:
界標(biāo)窗口模型
圖 2.3 滑動窗口模型據(jù)具有大量、快速、無限等特點,不能將所有的事務(wù)數(shù)據(jù)都用于動窗口模型成為廣泛使用的數(shù)據(jù)處理模型,它在滑動窗口上發(fā)繁項集。在這個窗口模型中,新的事務(wù)數(shù)據(jù)到來,舊的事務(wù)數(shù)
FP-tree的結(jié)構(gòu)
【參考文獻】:
期刊論文
[1]改進的Eclat算法研究與應(yīng)用[J]. 崔馨月,孫靜宇. 計算機工程與設(shè)計. 2018(04)
[2]基于B-list的最大頻繁項集挖掘算法[J]. 張昌,文凱,鄭云俊. 計算機應(yīng)用研究. 2019(02)
[3]高效的數(shù)據(jù)流完全頻繁項集挖掘算法[J]. 茹蓓,賀新征. 計算機工程與設(shè)計. 2017(10)
[4]挖掘完全頻繁項集的蟻群算法[J]. 黃紅星. 微電子學(xué)與計算機. 2014(12)
[5]一種基于時間衰減模型的數(shù)據(jù)流閉合模式挖掘方法[J]. 韓萌,王志海,原繼東. 計算機學(xué)報. 2015(07)
[6]滑動窗口中數(shù)據(jù)流最大頻繁項集挖掘算法研究[J]. 尹紹宏,單坤玉,范桂丹. 計算機工程與應(yīng)用. 2015(22)
[7]基于概念格的數(shù)據(jù)流頻繁項集挖掘[J]. 張長勝,阮婧,黃海隆,勵龍昌,楊炳儒. 科學(xué)技術(shù)與工程. 2013(23)
[8]一種基于滑動窗口的數(shù)據(jù)流頻繁項集挖掘算法[J]. 寇香霞,任永功,宋奎勇. 計算機應(yīng)用與軟件. 2013(01)
[9]基于向量的數(shù)據(jù)流滑動窗口中最大頻繁項集挖掘[J]. 徐嘉莉,陳佳,胡慶,黃波,郭紅霞. 計算機應(yīng)用研究. 2012(03)
[10]基于時間衰減模型的數(shù)據(jù)流頻繁模式挖掘[J]. 吳楓,仲妍,吳泉源. 自動化學(xué)報. 2010(05)
碩士論文
[1]基于頻繁項集的數(shù)據(jù)流挖掘算法研究[D]. 黎海青.重慶郵電大學(xué) 2017
[2]基于傾斜時間窗口的頻繁項集挖掘算法研究[D]. 徐艷紅.哈爾濱工程大學(xué) 2010
[3]數(shù)據(jù)流頻繁模式挖掘算法研究與設(shè)計[D]. 曹國棟.燕山大學(xué) 2007
本文編號:3506126
【文章來源】:重慶郵電大學(xué)重慶市
【文章頁數(shù)】:58 頁
【學(xué)位級別】:碩士
【部分圖文】:
界標(biāo)窗口模型
圖 2.3 滑動窗口模型據(jù)具有大量、快速、無限等特點,不能將所有的事務(wù)數(shù)據(jù)都用于動窗口模型成為廣泛使用的數(shù)據(jù)處理模型,它在滑動窗口上發(fā)繁項集。在這個窗口模型中,新的事務(wù)數(shù)據(jù)到來,舊的事務(wù)數(shù)
FP-tree的結(jié)構(gòu)
【參考文獻】:
期刊論文
[1]改進的Eclat算法研究與應(yīng)用[J]. 崔馨月,孫靜宇. 計算機工程與設(shè)計. 2018(04)
[2]基于B-list的最大頻繁項集挖掘算法[J]. 張昌,文凱,鄭云俊. 計算機應(yīng)用研究. 2019(02)
[3]高效的數(shù)據(jù)流完全頻繁項集挖掘算法[J]. 茹蓓,賀新征. 計算機工程與設(shè)計. 2017(10)
[4]挖掘完全頻繁項集的蟻群算法[J]. 黃紅星. 微電子學(xué)與計算機. 2014(12)
[5]一種基于時間衰減模型的數(shù)據(jù)流閉合模式挖掘方法[J]. 韓萌,王志海,原繼東. 計算機學(xué)報. 2015(07)
[6]滑動窗口中數(shù)據(jù)流最大頻繁項集挖掘算法研究[J]. 尹紹宏,單坤玉,范桂丹. 計算機工程與應(yīng)用. 2015(22)
[7]基于概念格的數(shù)據(jù)流頻繁項集挖掘[J]. 張長勝,阮婧,黃海隆,勵龍昌,楊炳儒. 科學(xué)技術(shù)與工程. 2013(23)
[8]一種基于滑動窗口的數(shù)據(jù)流頻繁項集挖掘算法[J]. 寇香霞,任永功,宋奎勇. 計算機應(yīng)用與軟件. 2013(01)
[9]基于向量的數(shù)據(jù)流滑動窗口中最大頻繁項集挖掘[J]. 徐嘉莉,陳佳,胡慶,黃波,郭紅霞. 計算機應(yīng)用研究. 2012(03)
[10]基于時間衰減模型的數(shù)據(jù)流頻繁模式挖掘[J]. 吳楓,仲妍,吳泉源. 自動化學(xué)報. 2010(05)
碩士論文
[1]基于頻繁項集的數(shù)據(jù)流挖掘算法研究[D]. 黎海青.重慶郵電大學(xué) 2017
[2]基于傾斜時間窗口的頻繁項集挖掘算法研究[D]. 徐艷紅.哈爾濱工程大學(xué) 2010
[3]數(shù)據(jù)流頻繁模式挖掘算法研究與設(shè)計[D]. 曹國棟.燕山大學(xué) 2007
本文編號:3506126
本文鏈接:http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/3506126.html
最近更新
教材專著