基于流型的貝葉斯層次聚類分析
發(fā)布時間:2021-09-17 15:29
聚類分析是一類重要的無監(jiān)督學習算法,其目的是在沒有樣本標簽的情況下將數(shù)據(jù)總體劃分為彼此性質(zhì)不同的子集。由于沒有標簽指導訓練過程,聚類分析中兩個關鍵的問題是子類個數(shù)的選擇和類間距離度量標準的選取。當樣本的維數(shù)很高時,聚類分析還需要對樣本進行降維,以達到減少計算量,舍棄無用信息的目的。高維數(shù)據(jù)的潛在結構雖然是低維的,但往往是非線性的,因此傳統(tǒng)的線性降維方法,如主成分分析等在降維時會丟失數(shù)據(jù)集的內(nèi)部結構。目前尚沒有一種能夠?qū)Ω呔S數(shù)據(jù)進行有效聚類分析的算法。為了能對高維圖像數(shù)據(jù)進行有效的降維,同時在聚類時避免主觀選擇類的個數(shù)和樣本間的距離度量標準,本文考慮基于流型的貝葉斯層析聚類分析,即首先用適當?shù)牧餍蛯W習算法對圖像數(shù)據(jù)進行有效的降維,對降維后的數(shù)據(jù)進行貝葉斯層次聚類分析。本文選用手寫數(shù)字識別、物體識別和人臉識別共三組實際高維圖像數(shù)據(jù)進行聚類分析,分析結果表明,流型學習能夠在降維的同時最大程度的保留圖像數(shù)據(jù)集的內(nèi)部結構。同時,與傳統(tǒng)的聚類算法以及基于線性降維的貝葉斯層次聚類算法相比,基于流型降維的貝葉斯層次聚類法能夠以較低的計算量自動的選擇出接近真實值的子類個數(shù),同時對數(shù)據(jù)進行恰當?shù)木垲悺?nbsp;
【文章來源】:云南大學云南省 211工程院校
【文章頁數(shù)】:48 頁
【學位級別】:碩士
【部分圖文】:
每個MNIST樣本是2828的灰度圖片
線性整體結構有時不利于聚類分析
手寫數(shù)字‘3’在三維流型中變化
本文編號:3399002
【文章來源】:云南大學云南省 211工程院校
【文章頁數(shù)】:48 頁
【學位級別】:碩士
【部分圖文】:
每個MNIST樣本是2828的灰度圖片
線性整體結構有時不利于聚類分析
手寫數(shù)字‘3’在三維流型中變化
本文編號:3399002
本文鏈接:http://www.sikaile.net/kejilunwen/zidonghuakongzhilunwen/3399002.html
最近更新
教材專著