關(guān)聯(lián)規(guī)則挖掘算法的改進及其在省師范生基本功比賽系統(tǒng)中的應(yīng)用
發(fā)布時間:2024-03-16 04:52
信息技術(shù)高速發(fā)展,全球數(shù)據(jù)的暴增,數(shù)據(jù)挖掘于上世紀(jì)80年代末應(yīng)運而生。數(shù)據(jù)挖掘技術(shù)需要綜合多個學(xué)科專業(yè)知識,關(guān)聯(lián)規(guī)則挖掘就是其中之一,Apriori算法是一種經(jīng)典算法,在多個領(lǐng)域被廣泛使用。但它存在一些缺點,比如需要多次掃描數(shù)據(jù)庫,產(chǎn)生大量無用的候選項集等。本文對數(shù)據(jù)挖掘技術(shù)進行了較為深入的分析和研究,尤其是關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘技術(shù)。對經(jīng)典Apriori算法進行了詳細(xì)探討,分析了已往數(shù)據(jù)挖掘中關(guān)聯(lián)規(guī)則算法的四種改進策略,在此基礎(chǔ)上,本文綜合運用上述的改進策略,提出了兩種優(yōu)化的關(guān)聯(lián)規(guī)則挖掘算法,一種是基于矩陣和TID的MApriori算法;另一種是基于Hash和矩陣的HApriori算法,兩種算法都基于矩陣基礎(chǔ),主要是矩陣的相關(guān)運算操作能有效減少程序的執(zhí)行時間。兩種算法都針對頻繁項集的產(chǎn)生和減少事務(wù)數(shù)據(jù)庫的掃描次數(shù)作了較好的改進,從實現(xiàn)的比對效果看,有了較好程度的優(yōu)化。其次,在關(guān)聯(lián)規(guī)則算法中,引進了關(guān)聯(lián)系數(shù),有效地減少了許多冗余規(guī)則的產(chǎn)生,為用戶尋找自身需要的規(guī)則帶來很大的方便。最后,設(shè)計了省師范生基本功比賽系統(tǒng),將新的關(guān)聯(lián)規(guī)則挖掘算法應(yīng)用到該系統(tǒng)中,對選手的原始數(shù)據(jù)進行預(yù)處理,改變傳統(tǒng)的用...
【文章頁數(shù)】:64 頁
【學(xué)位級別】:碩士
【文章目錄】:
中文摘要
Abstract
第1章 緒論
1.1 研究背景和意義
1.2 研究現(xiàn)狀
1.2.1 國外研究現(xiàn)狀
1.2.2 國內(nèi)研究現(xiàn)狀
1.3 本文研究工作
1.4 論文組織架構(gòu)
第2章 數(shù)據(jù)挖掘理論
2.1 數(shù)據(jù)挖掘的基本概念
2.1.1 數(shù)據(jù)挖掘的定義
2.1.2 數(shù)據(jù)挖掘的對象
2.2 數(shù)據(jù)挖掘的流程
2.3 數(shù)據(jù)挖掘的方法
2.4 關(guān)聯(lián)規(guī)則的基本概念
2.5 關(guān)聯(lián)規(guī)則挖掘的主要步驟
2.6 關(guān)聯(lián)規(guī)則的經(jīng)典算法
2.6.1 Apriori算法介紹
2.6.2 算法步驟
2.6.3 算法的偽代碼
2.6.4 算法matlab程序
2.6.5 算法實例
2.6.6 算法流程圖
2.6.7 Apriori算法不足之處
第3章 算法改進
3.1 Apriori算法改進策略
3.1.1 基于散列的算法
3.1.2 基于矩陣的算法
3.1.3 基于圖的算法
3.1.4 基于TID的算法
3.2 本文提出的兩種算法改進策略
3.2.1 基于矩陣和TID的MApriori算法
3.2.2 基于hash和矩陣的HApriori算法
3.2.3 兩個算法的效率
第4章 改進的衡量規(guī)則——相關(guān)系數(shù)
4.1 問題提出
4.2 相關(guān)系數(shù)
4.3 算法描述
4.4 基于相關(guān)系數(shù)的關(guān)聯(lián)規(guī)則挖掘?qū)嵗?br>第5章 改進算法在省師范生基本功比賽系統(tǒng)的應(yīng)用
5.1 需求分析
5.2 省師范生基本功比賽系統(tǒng)的構(gòu)建
5.2.1 報到系統(tǒng)
5.2.2 成績管理
5.2.3 關(guān)聯(lián)規(guī)則
5.2.4 選手選拔
5.2.5 技術(shù)支持
第6章 總結(jié)和展望
6.1 總結(jié)
6.2 展望
參考文獻(xiàn)
致謝
攻讀碩士學(xué)位期間發(fā)表論文及參加項目
本文編號:3929141
【文章頁數(shù)】:64 頁
【學(xué)位級別】:碩士
【文章目錄】:
中文摘要
Abstract
第1章 緒論
1.1 研究背景和意義
1.2 研究現(xiàn)狀
1.2.1 國外研究現(xiàn)狀
1.2.2 國內(nèi)研究現(xiàn)狀
1.3 本文研究工作
1.4 論文組織架構(gòu)
第2章 數(shù)據(jù)挖掘理論
2.1 數(shù)據(jù)挖掘的基本概念
2.1.1 數(shù)據(jù)挖掘的定義
2.1.2 數(shù)據(jù)挖掘的對象
2.2 數(shù)據(jù)挖掘的流程
2.3 數(shù)據(jù)挖掘的方法
2.4 關(guān)聯(lián)規(guī)則的基本概念
2.5 關(guān)聯(lián)規(guī)則挖掘的主要步驟
2.6 關(guān)聯(lián)規(guī)則的經(jīng)典算法
2.6.1 Apriori算法介紹
2.6.2 算法步驟
2.6.3 算法的偽代碼
2.6.4 算法matlab程序
2.6.5 算法實例
2.6.6 算法流程圖
2.6.7 Apriori算法不足之處
第3章 算法改進
3.1 Apriori算法改進策略
3.1.1 基于散列的算法
3.1.2 基于矩陣的算法
3.1.3 基于圖的算法
3.1.4 基于TID的算法
3.2 本文提出的兩種算法改進策略
3.2.1 基于矩陣和TID的MApriori算法
3.2.2 基于hash和矩陣的HApriori算法
3.2.3 兩個算法的效率
第4章 改進的衡量規(guī)則——相關(guān)系數(shù)
4.1 問題提出
4.2 相關(guān)系數(shù)
4.3 算法描述
4.4 基于相關(guān)系數(shù)的關(guān)聯(lián)規(guī)則挖掘?qū)嵗?br>第5章 改進算法在省師范生基本功比賽系統(tǒng)的應(yīng)用
5.1 需求分析
5.2 省師范生基本功比賽系統(tǒng)的構(gòu)建
5.2.1 報到系統(tǒng)
5.2.2 成績管理
5.2.3 關(guān)聯(lián)規(guī)則
5.2.4 選手選拔
5.2.5 技術(shù)支持
第6章 總結(jié)和展望
6.1 總結(jié)
6.2 展望
參考文獻(xiàn)
致謝
攻讀碩士學(xué)位期間發(fā)表論文及參加項目
本文編號:3929141
本文鏈接:http://www.sikaile.net/jiaoyulunwen/gaodengjiaoyulunwen/3929141.html
最近更新
教材專著