基于數(shù)據(jù)流的頻繁項集挖掘算法研究
發(fā)布時間:2022-08-08 15:19
隨著5G、人工智能、云計算等信息技術(shù)的高速發(fā)展,與之相匹配的數(shù)據(jù)流挖掘算法已無法滿足當前需求,在數(shù)據(jù)流中進行數(shù)據(jù)挖掘越來越受到研究者的關(guān)注。但是數(shù)據(jù)流中的數(shù)據(jù)挖掘存在諸多限制,其內(nèi)存有限,對挖掘算法的要求更高,使得數(shù)據(jù)流中的數(shù)據(jù)挖掘存在更大的挑戰(zhàn)。關(guān)聯(lián)規(guī)則挖掘是數(shù)據(jù)挖掘的一個重要組成部分,它挖掘不同事務(wù)、不同屬性之間的潛在聯(lián)系。本文基于數(shù)據(jù)流重點進行關(guān)聯(lián)規(guī)則中的頻繁項集和最大頻繁項集挖掘,在挖掘時采用高效的數(shù)據(jù)壓縮結(jié)構(gòu)壓縮數(shù)據(jù),采用超集檢測策略降低數(shù)據(jù)量,采用高效方法計算支持度計數(shù),從多方位、多角度對數(shù)據(jù)流頻繁項集挖掘進行了深入研究與分析。主要內(nèi)容如下:論文首先研究改進經(jīng)典數(shù)據(jù)流頻繁項集挖掘FIUT-Stream算法,提出了一種高效的數(shù)據(jù)流頻繁項集挖掘算法。改進算法采用常用滑動窗口處理數(shù)據(jù)流,并采用高效位表進行數(shù)據(jù)壓縮,在支持度計算時直接操作位表,通過求與運算計算支持度,實現(xiàn)了支持度的快速計算。該算法挖掘頻繁項集,只需對項集所有項在位表中所在的列求與,即可得到該項集支持度計數(shù),從而進行頻繁項集的判斷,同時在頻繁項集挖掘過程中進行超集檢測策略降低挖掘數(shù)據(jù)量。實驗結(jié)果表明,該改進算法在保證...
【文章頁數(shù)】:73 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
abstract
注釋表
第1章 緒論
1.1 研究背景及意義
1.2 國內(nèi)外研究現(xiàn)狀
1.3 本文主要工作
1.4 本文組織結(jié)構(gòu)
1.5 本章小結(jié)
第2章 相關(guān)理論基礎(chǔ)
2.1 數(shù)據(jù)挖掘
2.1.1 數(shù)據(jù)挖掘介紹
2.1.2 數(shù)據(jù)挖掘任務(wù)
2.2 數(shù)據(jù)流的概念及應(yīng)用
2.2.1 數(shù)據(jù)流的定義與特性
2.2.2 數(shù)據(jù)流的應(yīng)用
2.3 數(shù)據(jù)流挖掘的窗口模式
2.3.1 界標窗口模型
2.3.2 衰減窗口模型
2.3.3 滑動窗口模型
2.4 數(shù)據(jù)流頻繁項集挖掘
2.4.1 關(guān)聯(lián)規(guī)則介紹
2.4.2 數(shù)據(jù)流頻繁項集挖掘的主要問題
2.4.3 數(shù)據(jù)流頻繁項集挖掘內(nèi)容
2.4.4 數(shù)據(jù)流頻繁項集挖掘經(jīng)典算法
2.5 本章小結(jié)
第3章 基于BTA算法的數(shù)據(jù)流頻繁項集挖掘算法
3.1 FIUT-Stream算法分析
3.1.1 相關(guān)定義與性質(zhì)
3.1.2 頻繁項集挖掘
3.1.3 算法優(yōu)缺點分析
3.2 基于BTA的改進FIUT-Stream算法
3.2.1 算法改進思路
3.2.2 改進算法描述
3.3 實驗結(jié)果分析
3.3.1 實驗環(huán)境
3.3.2 運行時間
3.3.3 內(nèi)存占用
3.3.4 可伸縮性
3.4 本章小結(jié)
第4章 數(shù)據(jù)流中的最大頻繁項集挖掘算法
4.1 改進算法分析
4.1.1 相關(guān)定義及性質(zhì)
4.1.2 算法改進思路
4.1.3 改進算法詳細描述
4.2 改進數(shù)據(jù)流最大頻繁項集挖掘算法
4.2.1 窗口初始階段
4.2.2 窗口滑動階段
4.2.3 最大頻繁項集挖掘
4.3 實驗結(jié)果與分析
4.3.1 實驗環(huán)境
4.3.2 運行時間
4.3.3 內(nèi)存占用
4.3.4 可伸縮性
4.4 本章小結(jié)
第5章 總結(jié)與展望
5.1 工作總結(jié)
5.2 工作展望
參考文獻
致謝
攻讀碩士學(xué)位期間從事的科研工作及取得的成果
本文編號:3671749
【文章頁數(shù)】:73 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
abstract
注釋表
第1章 緒論
1.1 研究背景及意義
1.2 國內(nèi)外研究現(xiàn)狀
1.3 本文主要工作
1.4 本文組織結(jié)構(gòu)
1.5 本章小結(jié)
第2章 相關(guān)理論基礎(chǔ)
2.1 數(shù)據(jù)挖掘
2.1.1 數(shù)據(jù)挖掘介紹
2.1.2 數(shù)據(jù)挖掘任務(wù)
2.2 數(shù)據(jù)流的概念及應(yīng)用
2.2.1 數(shù)據(jù)流的定義與特性
2.2.2 數(shù)據(jù)流的應(yīng)用
2.3 數(shù)據(jù)流挖掘的窗口模式
2.3.1 界標窗口模型
2.3.2 衰減窗口模型
2.3.3 滑動窗口模型
2.4 數(shù)據(jù)流頻繁項集挖掘
2.4.1 關(guān)聯(lián)規(guī)則介紹
2.4.2 數(shù)據(jù)流頻繁項集挖掘的主要問題
2.4.3 數(shù)據(jù)流頻繁項集挖掘內(nèi)容
2.4.4 數(shù)據(jù)流頻繁項集挖掘經(jīng)典算法
2.5 本章小結(jié)
第3章 基于BTA算法的數(shù)據(jù)流頻繁項集挖掘算法
3.1 FIUT-Stream算法分析
3.1.1 相關(guān)定義與性質(zhì)
3.1.2 頻繁項集挖掘
3.1.3 算法優(yōu)缺點分析
3.2 基于BTA的改進FIUT-Stream算法
3.2.1 算法改進思路
3.2.2 改進算法描述
3.3 實驗結(jié)果分析
3.3.1 實驗環(huán)境
3.3.2 運行時間
3.3.3 內(nèi)存占用
3.3.4 可伸縮性
3.4 本章小結(jié)
第4章 數(shù)據(jù)流中的最大頻繁項集挖掘算法
4.1 改進算法分析
4.1.1 相關(guān)定義及性質(zhì)
4.1.2 算法改進思路
4.1.3 改進算法詳細描述
4.2 改進數(shù)據(jù)流最大頻繁項集挖掘算法
4.2.1 窗口初始階段
4.2.2 窗口滑動階段
4.2.3 最大頻繁項集挖掘
4.3 實驗結(jié)果與分析
4.3.1 實驗環(huán)境
4.3.2 運行時間
4.3.3 內(nèi)存占用
4.3.4 可伸縮性
4.4 本章小結(jié)
第5章 總結(jié)與展望
5.1 工作總結(jié)
5.2 工作展望
參考文獻
致謝
攻讀碩士學(xué)位期間從事的科研工作及取得的成果
本文編號:3671749
本文鏈接:http://www.sikaile.net/kejilunwen/shengwushengchang/3671749.html
最近更新
教材專著