高維數(shù)據(jù)子空間聚類(lèi)方法
發(fā)布時(shí)間:2023-09-17 07:12
受到“維度災(zāi)難”的影響,高維數(shù)據(jù)的聚類(lèi)效率與聚類(lèi)結(jié)果的精度難以得到保證。為了降低“維度災(zāi)難”對(duì)聚類(lèi)結(jié)果的影響,采用子空間聚類(lèi)算法,生成高維數(shù)據(jù)集的子空間,并將在子空間中聚類(lèi)得到的結(jié)果作為數(shù)據(jù)分析的依據(jù)。這一過(guò)程中子空間的質(zhì)量是保證子空間聚類(lèi)算法有效性的關(guān)鍵,有兩種提高子空間質(zhì)量的方法,一是在子空間生成的過(guò)程中制定有效的生成規(guī)則,二是在子空間生成之后根據(jù)相應(yīng)的篩選策略精簡(jiǎn)子空間。本文同時(shí)采用以上兩種方法,首先采用高維數(shù)據(jù)中維度密度高的維度生成子空間。其次在子空間內(nèi)自適應(yīng)地生成網(wǎng)格,根據(jù)網(wǎng)格密度精簡(jiǎn)子空間內(nèi)的數(shù)據(jù)。之后再次根據(jù)維度密度將子空間內(nèi)的低密度維度剪枝,以提高子空間的質(zhì)量。聚類(lèi)過(guò)程中采用網(wǎng)格聚類(lèi)的方法,根據(jù)網(wǎng)格的鄰接性對(duì)子空間聚類(lèi)。實(shí)驗(yàn)證明該算法在UCI(University of California-Irvine)數(shù)據(jù)集上能得到較好的實(shí)驗(yàn)結(jié)果,并且在抗噪聲能力,伸縮性以及效率實(shí)驗(yàn)中都能產(chǎn)生良好的實(shí)驗(yàn)結(jié)果。針對(duì)高維數(shù)據(jù)中有存在不確定數(shù)據(jù)的情況,為了避免不確定數(shù)據(jù)對(duì)高維數(shù)據(jù)聚類(lèi)結(jié)果造成影響,提出高維不確定數(shù)據(jù)的子空間聚類(lèi)算法,分別針對(duì)高維不確定數(shù)據(jù)中維度不確定與值不確定的情況提出相...
【文章頁(yè)數(shù)】:62 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 研究背景和意義
1.2 國(guó)內(nèi)外現(xiàn)狀研究分析
1.3 課題來(lái)源及研究?jī)?nèi)容
1.3.1 課題的來(lái)源
1.3.2 課題的主要研究?jī)?nèi)容
第2章 聚類(lèi)分析技術(shù)介紹
2.1 聚類(lèi)分析的概念與聚類(lèi)過(guò)程
2.2 高維數(shù)據(jù)以及聚類(lèi)方法介紹
2.2.1 降維方法介紹
2.2.2 Clique算法
2.3 不確定數(shù)據(jù)以及聚類(lèi)方法介紹
2.3.1 不確定數(shù)據(jù)的相似度表示
2.3.2 不確定數(shù)據(jù)聚類(lèi)方法
2.4 本章小結(jié)
第3章 高維高密度子空間聚類(lèi)算法
3.1 基于hoeffding界子空間生成算法
3.2 基于凝聚的不規(guī)則網(wǎng)格算法
3.3 基于子空間相似的剪枝算法
3.4 基于分類(lèi)比較的聚類(lèi)算法
3.5 實(shí)驗(yàn)與分析
3.6 本章小結(jié)
第4章 高維不確定數(shù)據(jù)的子空間聚類(lèi)算法
4.1 KNN算法
4.2 維度不確定聚類(lèi)算法
4.2.1 部分?jǐn)?shù)據(jù)維度不確定的子空間聚類(lèi)算法
4.2.2 數(shù)據(jù)集維度不確定子空間聚類(lèi)算法
4.3 值不確定子空間聚類(lèi)算法
4.3.1 數(shù)據(jù)值模糊聚類(lèi)
4.3.2 數(shù)據(jù)值缺失聚類(lèi)
4.4 基于子空間的復(fù)雜高維不確定數(shù)據(jù)聚類(lèi)算法
4.5 實(shí)驗(yàn)與分析
4.6 本章小結(jié)
結(jié)論
參考文獻(xiàn)
攻讀碩士學(xué)位期間發(fā)表的學(xué)術(shù)論文
致謝
本文編號(hào):3847252
【文章頁(yè)數(shù)】:62 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 研究背景和意義
1.2 國(guó)內(nèi)外現(xiàn)狀研究分析
1.3 課題來(lái)源及研究?jī)?nèi)容
1.3.1 課題的來(lái)源
1.3.2 課題的主要研究?jī)?nèi)容
第2章 聚類(lèi)分析技術(shù)介紹
2.1 聚類(lèi)分析的概念與聚類(lèi)過(guò)程
2.2 高維數(shù)據(jù)以及聚類(lèi)方法介紹
2.2.1 降維方法介紹
2.2.2 Clique算法
2.3 不確定數(shù)據(jù)以及聚類(lèi)方法介紹
2.3.1 不確定數(shù)據(jù)的相似度表示
2.3.2 不確定數(shù)據(jù)聚類(lèi)方法
2.4 本章小結(jié)
第3章 高維高密度子空間聚類(lèi)算法
3.1 基于hoeffding界子空間生成算法
3.2 基于凝聚的不規(guī)則網(wǎng)格算法
3.3 基于子空間相似的剪枝算法
3.4 基于分類(lèi)比較的聚類(lèi)算法
3.5 實(shí)驗(yàn)與分析
3.6 本章小結(jié)
第4章 高維不確定數(shù)據(jù)的子空間聚類(lèi)算法
4.1 KNN算法
4.2 維度不確定聚類(lèi)算法
4.2.1 部分?jǐn)?shù)據(jù)維度不確定的子空間聚類(lèi)算法
4.2.2 數(shù)據(jù)集維度不確定子空間聚類(lèi)算法
4.3 值不確定子空間聚類(lèi)算法
4.3.1 數(shù)據(jù)值模糊聚類(lèi)
4.3.2 數(shù)據(jù)值缺失聚類(lèi)
4.4 基于子空間的復(fù)雜高維不確定數(shù)據(jù)聚類(lèi)算法
4.5 實(shí)驗(yàn)與分析
4.6 本章小結(jié)
結(jié)論
參考文獻(xiàn)
攻讀碩士學(xué)位期間發(fā)表的學(xué)術(shù)論文
致謝
本文編號(hào):3847252
本文鏈接:http://www.sikaile.net/kejilunwen/shengwushengchang/3847252.html
最近更新
教材專(zhuān)著