基于粒計算的關聯(lián)關系挖掘研究
發(fā)布時間:2023-04-02 16:43
隨著信息技術的飛速發(fā)展,科學和工業(yè)等各個領域積累了海量的數(shù)據(jù)。海量數(shù)據(jù)中存在著豐富的關聯(lián)關系結(jié)構,識別和篩選有價值的關聯(lián)關系是大數(shù)據(jù)復雜關聯(lián)關系挖掘的重要任務之一。復雜關聯(lián)關系挖掘廣泛應用到機器學習和數(shù)據(jù)挖掘任務中,其發(fā)展深刻影響著相關領域的進展。然而,海量數(shù)據(jù)集中數(shù)據(jù)類型的復雜多樣性、數(shù)據(jù)分布的不確定性、關聯(lián)關系復雜多樣性、多種關聯(lián)關系共存性及偽相關關系存在性等特點,使得統(tǒng)計學意義下的關聯(lián)關系挖掘方法面臨諸多挑戰(zhàn)。基于消減誤差比例原理設計的關聯(lián)關系度量,傾向于識別線性關聯(lián)關系,對較復雜關聯(lián)關系的識別需要依賴變換函數(shù)的選擇。基于統(tǒng)計獨立性檢驗設計的關聯(lián)關系度量,嚴重依賴于聯(lián)合分布函數(shù)和邊際分布函數(shù)的估計方法,不同的估計方法或同種方法的不同參數(shù)設置都會產(chǎn)生不同的估計結(jié)果,在數(shù)據(jù)聯(lián)合分布不存在時甚至無法計算。使用這些方法進行復雜關聯(lián)關系挖掘,它們自身的缺陷和復雜性會不同程度地影響識別任務的準確性,增加任務難度。因此,亟待發(fā)展基于數(shù)據(jù)驅(qū)動的、不依賴數(shù)據(jù)分布、不依賴參數(shù)選擇、不受關聯(lián)關系形式影響且簡單有效的復雜關聯(lián)關系度量新范式。粒計算越來越成為人工智能、信息處理、數(shù)據(jù)挖掘和知識發(fā)現(xiàn)領域處理復...
【文章頁數(shù)】:149 頁
【學位級別】:博士
【文章目錄】:
中文摘要
ABSTRACT
第一章 緒論
1.1 研究背景和意義
1.1.1 關聯(lián)關系挖掘的基礎性
1.1.2 關聯(lián)關系挖掘的必要性
1.1.3 關聯(lián)關系挖掘的緊迫性
1.1.4 關聯(lián)關系度量面臨的挑戰(zhàn)
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 統(tǒng)計意義下的關聯(lián)關系度量及其進展
1.2.2 粒計算有望推動復雜關聯(lián)關系挖掘研究進展
1.3 研究思路和創(chuàng)新
1.4 研究內(nèi)容和組織結(jié)構
第二章 統(tǒng)計學意義下的關聯(lián)關系度量與挑戰(zhàn)分析
2.1 基于PRE原理的關聯(lián)關系度量
2.1.1 二元變量間關聯(lián)關系度量
2.1.2 多元變量間關聯(lián)關系度量
2.1.3 方法的挑戰(zhàn)分析
2.2 基于獨立性檢驗的關聯(lián)關系度量
2.2.1 基于分布函教的關聯(lián)關系度量
2.2.2 基于概率密度函數(shù)的關聯(lián)關系度量
2.2.3 基于特征函數(shù)的關聯(lián)關系度量
2.2.4 方法的挑戰(zhàn)分析
2.3 大數(shù)據(jù)背景下關聯(lián)關系度量可能需滿足的性質(zhì)
2.4 本章小結(jié)
第三章 粒結(jié)構的有效性和代表性分析
3.1 問題描述
3.2 粒結(jié)構知識表示
3.3 粒結(jié)構間的差異
3.4 粒結(jié)構分組算法
3.5 粒結(jié)構分組算法的性能評估
3.5.1 分散度
3.5.2 近似度
3.6 實驗結(jié)果分析
3.6.1 收斂性分析
3.6.2 有效性分析
3.6.3 可擴展性分析
3.7 本章小結(jié)
第四章 多元變量間關聯(lián)關系挖掘
4.1 基于k-NN粒的關聯(lián)度量方法
4.1.1 鄰域互信息
4.1.2 最大鄰域系數(shù)MNC
4.1.3 MNC的相關性質(zhì)
4.2 基于鄰域視角的相關方法
4.2.1 基于k-NN統(tǒng)計量的方法
4.2.2 基于k-NN圖的方法
4.3 實驗分析
4.3.1 參數(shù)有效性分析
4.3.2 模擬數(shù)據(jù)實驗分析
4.3.3 真實數(shù)據(jù)實驗分析
4.4 本章小結(jié)
第五章 二元變量關聯(lián)關系的非參數(shù)方法
5.1 MNC的原理展示
5.2 基于最大鄰域信息的非參數(shù)探索統(tǒng)計量
5.2.1 單調(diào)性程度
5.2.2 接近函數(shù)關系的程度
5.2.3 復雜度
5.3 實驗分析
5.3.1 在WHO數(shù)據(jù)集中的應用
5.3.2 在基因表達數(shù)據(jù)中的應用
5.4 本章小結(jié)
第六章 多元變量內(nèi)關聯(lián)關系挖掘
6.1 前期工作
6.1.1 全關聯(lián)
6.1.2 最大全關聯(lián)系數(shù)
6.2 基于k-NN粒的最大全關聯(lián)系數(shù)
6.2.1 鄰域全關聯(lián)
6.2.2 計算MNA
6.3 實驗分析
6.3.1 統(tǒng)計意義下的多元變量內(nèi)關聯(lián)度量
6.3.2 維度偏差分析
6.3.3 統(tǒng)計功效分析
6.3.4 真實數(shù)據(jù)實驗分析
6.4 本章小結(jié)
第七章 關聯(lián)度量在聚類分析中的應用
7.1 問題描述
7.2 模糊C-均值算法
7.3 多樣性誘導的模糊C-均值算法
7.3.1 多樣性度量
7.3.2 所提方法DiFCM
7.4 分析求解所提目標函數(shù)
7.4.1 時間復雜度分析
7.4.2 算法收斂性分析
7.5 實驗結(jié)果
7.5.1 比較方法和參數(shù)設置
7.5.2 模擬數(shù)據(jù)實驗分析
7.5.3 修正后Iris數(shù)據(jù)實驗分析
7.5.4 真實數(shù)據(jù)實驗分析
7.5.5 收斂性分析
7.5.6 敏感性分析
7.6 本章小結(jié)
結(jié)論及展望
參考文獻
攻讀博士學位期間取得的研究成果
致謝
個人簡況及聯(lián)系方式
本文編號:3779573
【文章頁數(shù)】:149 頁
【學位級別】:博士
【文章目錄】:
中文摘要
ABSTRACT
第一章 緒論
1.1 研究背景和意義
1.1.1 關聯(lián)關系挖掘的基礎性
1.1.2 關聯(lián)關系挖掘的必要性
1.1.3 關聯(lián)關系挖掘的緊迫性
1.1.4 關聯(lián)關系度量面臨的挑戰(zhàn)
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 統(tǒng)計意義下的關聯(lián)關系度量及其進展
1.2.2 粒計算有望推動復雜關聯(lián)關系挖掘研究進展
1.3 研究思路和創(chuàng)新
1.4 研究內(nèi)容和組織結(jié)構
第二章 統(tǒng)計學意義下的關聯(lián)關系度量與挑戰(zhàn)分析
2.1 基于PRE原理的關聯(lián)關系度量
2.1.1 二元變量間關聯(lián)關系度量
2.1.2 多元變量間關聯(lián)關系度量
2.1.3 方法的挑戰(zhàn)分析
2.2 基于獨立性檢驗的關聯(lián)關系度量
2.2.1 基于分布函教的關聯(lián)關系度量
2.2.2 基于概率密度函數(shù)的關聯(lián)關系度量
2.2.3 基于特征函數(shù)的關聯(lián)關系度量
2.2.4 方法的挑戰(zhàn)分析
2.3 大數(shù)據(jù)背景下關聯(lián)關系度量可能需滿足的性質(zhì)
2.4 本章小結(jié)
第三章 粒結(jié)構的有效性和代表性分析
3.1 問題描述
3.2 粒結(jié)構知識表示
3.3 粒結(jié)構間的差異
3.4 粒結(jié)構分組算法
3.5 粒結(jié)構分組算法的性能評估
3.5.1 分散度
3.5.2 近似度
3.6 實驗結(jié)果分析
3.6.1 收斂性分析
3.6.2 有效性分析
3.6.3 可擴展性分析
3.7 本章小結(jié)
第四章 多元變量間關聯(lián)關系挖掘
4.1 基于k-NN粒的關聯(lián)度量方法
4.1.1 鄰域互信息
4.1.2 最大鄰域系數(shù)MNC
4.1.3 MNC的相關性質(zhì)
4.2 基于鄰域視角的相關方法
4.2.1 基于k-NN統(tǒng)計量的方法
4.2.2 基于k-NN圖的方法
4.3 實驗分析
4.3.1 參數(shù)有效性分析
4.3.2 模擬數(shù)據(jù)實驗分析
4.3.3 真實數(shù)據(jù)實驗分析
4.4 本章小結(jié)
第五章 二元變量關聯(lián)關系的非參數(shù)方法
5.1 MNC的原理展示
5.2 基于最大鄰域信息的非參數(shù)探索統(tǒng)計量
5.2.1 單調(diào)性程度
5.2.2 接近函數(shù)關系的程度
5.2.3 復雜度
5.3 實驗分析
5.3.1 在WHO數(shù)據(jù)集中的應用
5.3.2 在基因表達數(shù)據(jù)中的應用
5.4 本章小結(jié)
第六章 多元變量內(nèi)關聯(lián)關系挖掘
6.1 前期工作
6.1.1 全關聯(lián)
6.1.2 最大全關聯(lián)系數(shù)
6.2 基于k-NN粒的最大全關聯(lián)系數(shù)
6.2.1 鄰域全關聯(lián)
6.2.2 計算MNA
6.3 實驗分析
6.3.1 統(tǒng)計意義下的多元變量內(nèi)關聯(lián)度量
6.3.2 維度偏差分析
6.3.3 統(tǒng)計功效分析
6.3.4 真實數(shù)據(jù)實驗分析
6.4 本章小結(jié)
第七章 關聯(lián)度量在聚類分析中的應用
7.1 問題描述
7.2 模糊C-均值算法
7.3 多樣性誘導的模糊C-均值算法
7.3.1 多樣性度量
7.3.2 所提方法DiFCM
7.4 分析求解所提目標函數(shù)
7.4.1 時間復雜度分析
7.4.2 算法收斂性分析
7.5 實驗結(jié)果
7.5.1 比較方法和參數(shù)設置
7.5.2 模擬數(shù)據(jù)實驗分析
7.5.3 修正后Iris數(shù)據(jù)實驗分析
7.5.4 真實數(shù)據(jù)實驗分析
7.5.5 收斂性分析
7.5.6 敏感性分析
7.6 本章小結(jié)
結(jié)論及展望
參考文獻
攻讀博士學位期間取得的研究成果
致謝
個人簡況及聯(lián)系方式
本文編號:3779573
本文鏈接:http://www.sikaile.net/shoufeilunwen/xxkjbs/3779573.html
最近更新
教材專著