基于數(shù)據(jù)流的頻繁高效用集挖掘算法研究
發(fā)布時(shí)間:2023-02-21 10:31
信息時(shí)代產(chǎn)生的海量數(shù)據(jù),使得數(shù)據(jù)挖掘成為當(dāng)今各行各業(yè)制定銷售策略、尋找精準(zhǔn)客戶群等工作的重要手段,其中頻繁項(xiàng)集挖掘(Frequent Itemset Mining,FIM)和高效用項(xiàng)集挖掘(High Utility Itemset Mining,HUIM)是數(shù)據(jù)挖掘領(lǐng)域中的兩個(gè)重要分支。頻繁項(xiàng)集挖掘僅關(guān)注項(xiàng)集在數(shù)據(jù)庫(kù)中出現(xiàn)的次數(shù),而高效用項(xiàng)集挖掘則是考慮用戶偏好、重要性、利潤(rùn)等因素對(duì)項(xiàng)集“有用性”影響,因此更能滿足現(xiàn)實(shí)中人們對(duì)事物“有用性”的要求。而隨著相關(guān)研究的逐漸成熟,有學(xué)者發(fā)現(xiàn)單獨(dú)使用頻繁項(xiàng)集挖掘算法或高效用項(xiàng)集挖掘算法并不能滿足某些實(shí)際場(chǎng)景的應(yīng)用需求,因此,頻繁高效用項(xiàng)集開(kāi)始成為數(shù)據(jù)挖掘領(lǐng)域的研究對(duì)象。當(dāng)前越來(lái)越多領(lǐng)域的數(shù)據(jù)在以數(shù)據(jù)流的形式產(chǎn)生和存在,但其具有的不同于靜態(tài)數(shù)據(jù)的特性給數(shù)據(jù)挖掘工作帶來(lái)了新的要求和挑戰(zhàn),因此針對(duì)數(shù)據(jù)流的挖掘工作也就具有了十分重要的理論意義和實(shí)踐價(jià)值。本文以高效用項(xiàng)集挖掘研究為中心,從幾個(gè)方面對(duì)研究工作進(jìn)行擴(kuò)展,主要包括:(1)針對(duì)FHM(Fast High-utility Mining)算法中EUCS(Estimated Utility Co-oc...
【文章頁(yè)數(shù)】:61 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
abstract
1 緒論
1.1 研究背景及意義
1.2 論文主要研究?jī)?nèi)容
1.3 論文組織結(jié)構(gòu)
2 相關(guān)研究現(xiàn)狀
2.1 頻繁項(xiàng)集挖掘算法
2.2 高效用項(xiàng)集挖掘算法
2.2.1 單一最小效用閾值高效用項(xiàng)集挖掘算法
2.2.2 多最小效用閾值高效用項(xiàng)集挖掘算法
2.2.3 數(shù)據(jù)流高效用項(xiàng)集挖掘算法
2.3 頻繁高效用項(xiàng)集挖掘算法
2.4 數(shù)據(jù)流關(guān)鍵處理技術(shù)
2.4.1 數(shù)據(jù)流窗口模型
2.4.2 數(shù)據(jù)流計(jì)算系統(tǒng)
2.5 本章小結(jié)
3 改進(jìn)的高效用項(xiàng)集挖掘算法
3.1 基本概念及相關(guān)研究
3.2 iFHM算法
3.2.1 搜索空間
3.2.2 剪枝策略
3.2.3 效用列表的構(gòu)建
3.2.4 算法介紹
3.3 實(shí)驗(yàn)與結(jié)果分析
3.3.1 實(shí)驗(yàn)數(shù)據(jù)集
3.3.2 時(shí)間對(duì)比分析
3.3.3 內(nèi)存對(duì)比分析
3.4 本章小結(jié)
4 數(shù)據(jù)流頻繁高效用項(xiàng)集挖掘算法
4.1 基本概念及問(wèn)題定義
4.2 iFHMS-SW算法
4.2.1 剪枝策略
4.2.2 窗口模型
4.2.3 效用列表的構(gòu)建
4.2.4 算法介紹
4.3 實(shí)驗(yàn)與結(jié)果分析
4.3.1 最小支持度閾值對(duì)時(shí)間效率的影響
4.3.2 最小效用閾值對(duì)時(shí)間效率的影響
4.3.3 窗口尺寸對(duì)時(shí)間效率的影響
4.4 本章小結(jié)
5 總結(jié)與展望
5.1 工作總結(jié)
5.2 工作展望
參考文獻(xiàn)
攻讀碩士學(xué)位期間從事的科研工作及取得的成果
致謝
本文編號(hào):3747567
【文章頁(yè)數(shù)】:61 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
abstract
1 緒論
1.1 研究背景及意義
1.2 論文主要研究?jī)?nèi)容
1.3 論文組織結(jié)構(gòu)
2 相關(guān)研究現(xiàn)狀
2.1 頻繁項(xiàng)集挖掘算法
2.2 高效用項(xiàng)集挖掘算法
2.2.1 單一最小效用閾值高效用項(xiàng)集挖掘算法
2.2.2 多最小效用閾值高效用項(xiàng)集挖掘算法
2.2.3 數(shù)據(jù)流高效用項(xiàng)集挖掘算法
2.3 頻繁高效用項(xiàng)集挖掘算法
2.4 數(shù)據(jù)流關(guān)鍵處理技術(shù)
2.4.1 數(shù)據(jù)流窗口模型
2.4.2 數(shù)據(jù)流計(jì)算系統(tǒng)
2.5 本章小結(jié)
3 改進(jìn)的高效用項(xiàng)集挖掘算法
3.1 基本概念及相關(guān)研究
3.2 iFHM算法
3.2.1 搜索空間
3.2.2 剪枝策略
3.2.3 效用列表的構(gòu)建
3.2.4 算法介紹
3.3 實(shí)驗(yàn)與結(jié)果分析
3.3.1 實(shí)驗(yàn)數(shù)據(jù)集
3.3.2 時(shí)間對(duì)比分析
3.3.3 內(nèi)存對(duì)比分析
3.4 本章小結(jié)
4 數(shù)據(jù)流頻繁高效用項(xiàng)集挖掘算法
4.1 基本概念及問(wèn)題定義
4.2 iFHMS-SW算法
4.2.1 剪枝策略
4.2.2 窗口模型
4.2.3 效用列表的構(gòu)建
4.2.4 算法介紹
4.3 實(shí)驗(yàn)與結(jié)果分析
4.3.1 最小支持度閾值對(duì)時(shí)間效率的影響
4.3.2 最小效用閾值對(duì)時(shí)間效率的影響
4.3.3 窗口尺寸對(duì)時(shí)間效率的影響
4.4 本章小結(jié)
5 總結(jié)與展望
5.1 工作總結(jié)
5.2 工作展望
參考文獻(xiàn)
攻讀碩士學(xué)位期間從事的科研工作及取得的成果
致謝
本文編號(hào):3747567
本文鏈接:http://www.sikaile.net/kejilunwen/shengwushengchang/3747567.html
最近更新
教材專著