基于粒度計算的動態(tài)挖掘技術(shù)研究
發(fā)布時間:2017-10-02 19:26
本文關(guān)鍵詞:基于粒度計算的動態(tài)挖掘技術(shù)研究
更多相關(guān)文章: 動態(tài)數(shù)據(jù)挖掘 數(shù)據(jù)流 頻繁模式 窗口技術(shù) 粒度計算
【摘要】:隨著計算機技術(shù)、網(wǎng)絡(luò)技術(shù)和通信技術(shù)的迅速發(fā)展,傳統(tǒng)的動態(tài)數(shù)據(jù)挖掘方法很難適應(yīng)動態(tài)數(shù)據(jù)庫和實時數(shù)據(jù)庫的不斷更新,為了采取分而治之的思想來降低動態(tài)環(huán)境的復(fù)雜性,粒度計算方法被應(yīng)用到動態(tài)數(shù)據(jù)挖掘中,其通過改變信息粒度的大小來隱藏或揭示挖掘?qū)ο蟮募?xì)節(jié),從而達(dá)到發(fā)現(xiàn)不同層次信息的目的。在動態(tài)數(shù)據(jù)挖掘環(huán)境下構(gòu)建基于粒度計算的數(shù)據(jù)挖掘模型,實現(xiàn)對動態(tài)數(shù)據(jù)的自適應(yīng)處理具有重要的研究意義。論文針對數(shù)據(jù)流的頻繁模式挖掘問題,從研究滑動窗口的頻繁閉項集挖掘入手,探討了基于粒度計算的數(shù)據(jù)流頻繁模式挖掘技術(shù)。首先,構(gòu)建了復(fù)合粒度,為自適應(yīng)處理動態(tài)數(shù)據(jù)提供粒度計算的理論基礎(chǔ);論文在構(gòu)建了信息窗口下的對象粒、屬性粒和結(jié)構(gòu)粒等復(fù)合粒度之后,提出了粒度計算和轉(zhuǎn)換的方法,從而實現(xiàn)不同問題空間的粒度轉(zhuǎn)換。然后,提出了頻繁閉項集的生成方法;該方法通過混合進制映射生成模糊頻繁閉項集的搜索空間,運用對象粒度計算產(chǎn)生模糊頻繁閉項集,運用屬性粒度計算發(fā)現(xiàn)頻繁閉項集。接著,建立了嵌入式粒度計算模型;該模型能夠根據(jù)不同數(shù)據(jù)特點自適應(yīng)的構(gòu)建不同層次的粒度,通過超級狀態(tài)粒化成子狀態(tài)的方法來降低挖掘環(huán)境的復(fù)雜性,即一方面,運用結(jié)構(gòu)粒與對象粒的轉(zhuǎn)換方法,實現(xiàn)用粒度計算思想來求解不同問題空間的模糊頻繁閉項集;另一方面,運用對象粒向?qū)傩粤5霓D(zhuǎn)換方法求解問題空間的頻繁閉項集。最后,論文研究了數(shù)據(jù)流上滑動窗口內(nèi)的首次數(shù)據(jù)讀入和數(shù)據(jù)更新技術(shù),結(jié)合建立的嵌入式粒度計算模型,提出了基于嵌入式粒度計算的數(shù)據(jù)流頻繁模式挖掘模型。該模型能夠在首次讀入數(shù)據(jù)階段和數(shù)據(jù)更新階段,運用嵌入式粒度計算來實時挖掘頻繁閉項集。與典型的挖掘算法相比,實驗證明該模型在不同特點的數(shù)據(jù)集上具有較好的挖掘效率,在動態(tài)挖掘過程中內(nèi)存占用相對穩(wěn)定,特別是在頻繁項集數(shù)目較多時,內(nèi)存占用比其它算法少。為了拓展這個挖掘模型,論文在時間衰減的界標(biāo)窗口上,運用基于嵌入式粒度計算的數(shù)據(jù)流頻繁模式挖掘模型來發(fā)現(xiàn)最大頻繁項集。實驗證明該模型也具有較好的挖掘效率和空間利用率,從而也體現(xiàn)了它在窗口模型上的挖掘通用性。
【關(guān)鍵詞】:動態(tài)數(shù)據(jù)挖掘 數(shù)據(jù)流 頻繁模式 窗口技術(shù) 粒度計算
【學(xué)位授予單位】:電子科技大學(xué)
【學(xué)位級別】:博士
【學(xué)位授予年份】:2015
【分類號】:TP311.13
【目錄】:
- 摘要5-6
- Abstract6-13
- 第一章 緒論13-25
- 1.1 研究工作的背景與意義13-14
- 1.2 國內(nèi)外研究歷史與現(xiàn)狀14-23
- 1.2.1 傳統(tǒng)數(shù)據(jù)挖掘技術(shù)的研究現(xiàn)狀14-18
- 1.2.1.1 挖掘算法的拓展研究14-16
- 1.2.1.2 挖掘類型的衍生研究16-17
- 1.2.1.3 挖掘模型的演化研究17-18
- 1.2.2 基于粒度計算的關(guān)聯(lián)規(guī)則挖掘研究現(xiàn)狀18-20
- 1.2.2.1 粒度計算的模型18-19
- 1.2.2.2 粒度計算在關(guān)聯(lián)規(guī)則挖掘中的應(yīng)用現(xiàn)狀19-20
- 1.2.3 動態(tài)數(shù)據(jù)挖掘技術(shù)的研究現(xiàn)狀20-23
- 1.2.3.1 現(xiàn)有的動態(tài)挖掘技術(shù)21-22
- 1.2.3.2 基于數(shù)據(jù)流的頻繁模式挖掘現(xiàn)狀22-23
- 1.3 本文的主要貢獻(xiàn)與創(chuàng)新23-24
- 1.4 本論文的結(jié)構(gòu)安排24-25
- 第二章 動態(tài)數(shù)據(jù)挖掘與粒度計算基礎(chǔ)25-47
- 2.1 關(guān)聯(lián)規(guī)則挖掘25-34
- 2.1.1 基本概念25-26
- 2.1.2 關(guān)聯(lián)規(guī)則的挖掘過程26-27
- 2.1.3 頻繁模式發(fā)現(xiàn)的經(jīng)典算法27-34
- 2.1.3.1 算法Apriori框架27-29
- 2.1.3.2 算法FP-growth框架29-34
- 2.1.3.3 兩種框架的優(yōu)缺點分析34
- 2.2 動態(tài)數(shù)據(jù)挖掘34-42
- 2.2.1 基本概念34-35
- 2.2.2 動態(tài)數(shù)據(jù)挖掘的框架及步驟35-36
- 2.2.3 數(shù)據(jù)流動態(tài)挖掘技術(shù)36-42
- 2.2.3.1 基于窗.的動態(tài)挖掘36-38
- 2.2.3.2 基于窗.的經(jīng)典數(shù)據(jù)流頻繁模式挖掘算法38-42
- 2.3 粒度計算42-46
- 2.3.1 粒度計算的基本組成42-44
- 2.3.1.1 粒子43
- 2.3.1.2 粒層43
- 2.3.1.3 粒結(jié)構(gòu)43-44
- 2.3.2 粒度計算模型44-45
- 2.3.2.1 模糊信息粒化理論和詞計算模型44
- 2.3.2.2 基于粗糙集理論的粒度計算模型44
- 2.3.2.3 基于商空間理論的粒度計算模型44-45
- 2.3.2.4 基于集合論的粒度計算模型45
- 2.3.3 基于劃分的粒度計算模型45-46
- 2.4 本章小結(jié)46-47
- 第三章 基于嵌入式粒度計算的數(shù)據(jù)流頻繁模式挖掘47-109
- 3.1 問題描述47-48
- 3.2 基本概念及性質(zhì)48-76
- 3.2.1 數(shù)據(jù)流的相關(guān)概念48-49
- 3.2.2 頻繁項集的相關(guān)概念及性質(zhì)49-50
- 3.2.3 閉項集的相關(guān)概念及性質(zhì)50-56
- 3.2.3.1 Galois連接50-52
- 3.2.3.2 頻繁閉項集及模糊頻繁閉項集52-56
- 3.2.4 粒度計算的相關(guān)概念及性質(zhì)56-76
- 3.2.4.1 對象粒的構(gòu)建及粒度計算59-62
- 3.2.4.2 屬性粒的構(gòu)建及粒度計算62-65
- 3.2.4.3 結(jié)構(gòu)粒的構(gòu)建及粒度計算65-76
- 3.3 基于粒度計算的頻繁模式動態(tài)挖掘技術(shù)76-88
- 3.3.1 求解空間的粒度轉(zhuǎn)換方法76-81
- 3.3.1.1 同層粒度之間的轉(zhuǎn)換方法76-80
- 3.3.1.2 異層粒度之間的轉(zhuǎn)換方法80-81
- 3.3.2 頻繁閉項集的生成方法81-83
- 3.3.2.1 頻繁閉項集的產(chǎn)生思想81
- 3.3.2.2 頻繁閉項集的實現(xiàn)算法81-83
- 3.3.3 嵌入式粒度計算的動態(tài)挖掘模型83-88
- 3.3.3.1 嵌入式粒度計算83-84
- 3.3.3.2 動態(tài)嵌入規(guī)則84-85
- 3.3.3.3 算法描述85-86
- 3.3.3.4 算法的正確性和完備性86-88
- 3.4 基于嵌入式粒度計算的數(shù)據(jù)流頻繁模式挖掘模型88-108
- 3.4.1 建模思路88
- 3.4.2 算法描述88-95
- 3.4.2.1 首次讀入操作89-91
- 3.4.2.2 更新操作91-93
- 3.4.2.3 挖掘模型的實現(xiàn)算法93-95
- 3.4.3 性能分析95-97
- 3.4.3.1 算法的數(shù)據(jù)結(jié)構(gòu)95-96
- 3.4.3.2 首次讀入數(shù)據(jù)96
- 3.4.3.3 更新操作96-97
- 3.4.3.4 算法的時空復(fù)雜度分析97
- 3.4.4 實驗比較97-107
- 3.4.4.1 實驗環(huán)境及測試方法98-99
- 3.4.4.2 數(shù)據(jù)流的設(shè)計及實驗比較99-105
- 3.4.4.3 實驗比較結(jié)果分析105-107
- 3.4.5 大數(shù)據(jù)對算法的影響107-108
- 3.5 本章小結(jié)108-109
- 第四章 模型拓展應(yīng)用研究109-123
- 4.1 問題描述109-110
- 4.2 拓展模型的關(guān)鍵技術(shù)110-113
- 4.2.1 相關(guān)概念拓展110-111
- 4.2.1.1 信息窗的數(shù)據(jù)流參數(shù)110
- 4.2.1.2 對象粒的參數(shù)110-111
- 4.2.2 最大頻繁項集的生成方法111-112
- 4.2.3 發(fā)現(xiàn)最大頻繁項集的嵌入式粒度計算模型112-113
- 4.3 基于嵌入式粒度計算的最大頻繁項集挖掘113-119
- 4.3.1 模型思路113-114
- 4.3.2 算法描述114-119
- 4.3.2.1 首次讀入操作114-116
- 4.3.2.2 更新操作116-117
- 4.3.2.3 挖掘模型的實現(xiàn)算法117-119
- 4.4 實驗比較119-122
- 4.5 本章小結(jié)122-123
- 第五章 總結(jié)與展望123-125
- 5.1 全文總結(jié)123-124
- 5.2 后續(xù)展望124-125
- 致謝125-126
- 參考文獻(xiàn)126-135
- 攻讀博士學(xué)位期間取得的成果135-136
本文編號:961422
本文鏈接:http://www.sikaile.net/shoufeilunwen/xxkjbs/961422.html
最近更新
教材專著