基于深度學習的聚類算法的研究
發(fā)布時間:2021-10-17 07:24
隨著現(xiàn)代社會數(shù)據(jù)采集量和傳輸量的不斷增長,數(shù)據(jù)也朝著高維、無結(jié)構(gòu)化方向發(fā)展,數(shù)據(jù)挖掘成為當今不可或缺的工具。而無監(jiān)督學習由于不需要人為的標注數(shù)據(jù),成為了其中一個重要分支。聚類是一種無監(jiān)督的將數(shù)據(jù)按一定規(guī)律劃分為多個子類的方法。經(jīng)典算法如K均值、DBSCAN等方法盡管在低維結(jié)構(gòu)化數(shù)據(jù)上取得了不錯的聚類效果,但是由于高維數(shù)據(jù)存在維度災難問題,使這些方法很難直接應用。此后大量降維方法被提出并應用于聚類之前的一個先行步驟,然而這類方法也往往需要太多人為假設而無法很好適應高維無結(jié)構(gòu)化數(shù)據(jù)。面對高維數(shù)據(jù)可能分布于多個低維子空間的特點,子空間聚類成為了一類高效的算法。它通過將樣本劃分至多個低維子空間,同時實現(xiàn)了類別劃分和子空間分布挖掘。其中,基于自表達的方法也在流形保持上取得了有效的成果,但是面對越來越復雜數(shù)據(jù),這類方法也逐漸難以處理各類高維數(shù)據(jù),例如語音、圖像、文本等。近年來,得益于神經(jīng)網(wǎng)絡和深度學習的發(fā)展,其非線性映射能力使得更大規(guī)模和更深層次的特征提取得到了可能。利用深度學習來提高聚類性能成為了研究的一個趨勢。然而,目前的基于深度學習的算法大多基于歐式距離來作為樣本間的相似性,很難保持樣本之間...
【文章來源】:電子科技大學四川省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:63 頁
【學位級別】:碩士
【部分圖文】:
一個非線性降維的例子
MNIST、COIL20、Umist、ORL數(shù)據(jù)集上對相似性矩陣A的可視化
RCV1類別樹樣例
【參考文獻】:
碩士論文
[1]基于深度學習的高維數(shù)據(jù)聚類算法研究[D]. 朱寧.華東交通大學 2019
[2]基于子空間的聚類算法研究[D]. 羅靖.江南大學 2017
本文編號:3441368
【文章來源】:電子科技大學四川省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:63 頁
【學位級別】:碩士
【部分圖文】:
一個非線性降維的例子
MNIST、COIL20、Umist、ORL數(shù)據(jù)集上對相似性矩陣A的可視化
RCV1類別樹樣例
【參考文獻】:
碩士論文
[1]基于深度學習的高維數(shù)據(jù)聚類算法研究[D]. 朱寧.華東交通大學 2019
[2]基于子空間的聚類算法研究[D]. 羅靖.江南大學 2017
本文編號:3441368
本文鏈接:http://www.sikaile.net/kejilunwen/shengwushengchang/3441368.html
最近更新
教材專著