基于超限學(xué)習(xí)機(jī)的聚類算法研究
發(fā)布時(shí)間:2017-10-13 07:06
本文關(guān)鍵詞:基于超限學(xué)習(xí)機(jī)的聚類算法研究
更多相關(guān)文章: 聚類 K均值算法 人工神經(jīng)網(wǎng)絡(luò) 超限學(xué)習(xí)機(jī)
【摘要】:聚類技術(shù)作為數(shù)據(jù)分析中的重要手段,在信息爆炸的現(xiàn)代生活中變得越來(lái)越重要。為了獲得符合常識(shí)的信息,人們對(duì)數(shù)據(jù)進(jìn)行總結(jié)和歸納,利用自身的經(jīng)驗(yàn)將數(shù)據(jù)聚類為知識(shí)。如今,在各個(gè)領(lǐng)域都產(chǎn)生了大量且復(fù)雜的數(shù)據(jù),對(duì)一些領(lǐng)域的信號(hào)進(jìn)行分析的復(fù)雜度遠(yuǎn)遠(yuǎn)超出了人的分析能力,這就使利用機(jī)器代替人工分析數(shù)據(jù)成為亟待解決的問(wèn)題,也是人類智慧向人工智慧的跨越。人工神經(jīng)網(wǎng)絡(luò)是以大腦神經(jīng)元為原型的數(shù)據(jù)分析算法,其與聚類技術(shù)的結(jié)合將使聚類技術(shù)更加符合數(shù)據(jù)內(nèi)在的規(guī)律,進(jìn)一步提高聚類算法的性能。為了探索人工神經(jīng)網(wǎng)絡(luò)與聚類技術(shù)相結(jié)合的方式,本文進(jìn)行了如下研究工作:首先,本文回顧了聚類技術(shù)的發(fā)展歷程,在分析聚類算法所涉及相關(guān)技術(shù)的同時(shí),尋找人工神經(jīng)網(wǎng)絡(luò)與聚類技術(shù)相結(jié)合的切入點(diǎn)。通過(guò)總結(jié)各種聚類算法及人工神經(jīng)網(wǎng)絡(luò)的聯(lián)系與區(qū)別,本文發(fā)現(xiàn)超限學(xué)習(xí)機(jī)模型擁有能夠契合迭代式聚類算法的特點(diǎn),并嘗試將其與經(jīng)典的迭代式聚類算法——K均值算法相結(jié)合。其次,為了研究超限學(xué)習(xí)機(jī)模型與K均值算法的結(jié)合方式,提出了一種基于K均值算法迭代聚類框架的模塊化描述。通過(guò)劃分和拓展K均值算法的步驟,歸納出包括特征空間映射、初始化聚類中心、相似性函數(shù)、聚類中心更新以及判斷終止條件這五個(gè)關(guān)鍵模塊,并闡述了實(shí)現(xiàn)各個(gè)模塊的技術(shù)方案。接著,本文具體描述了超限學(xué)習(xí)機(jī)模型與K均值算法的結(jié)合方案,提出基于超限學(xué)習(xí)機(jī)的聚類算法(K-Extreme Learning Machines Clustering,KELMC)。為了使得該方法能夠適應(yīng)不同的數(shù)據(jù)環(huán)境,本文依據(jù)前面提及的各模塊實(shí)現(xiàn)方案,提出了兩種針對(duì)KELMC算法的優(yōu)化策略,即基于ELM-AE與PCA特征空間的KELMC算法和半監(jiān)督流形學(xué)習(xí)的KELMC算法。最后,本文分別在人工數(shù)據(jù)集和UCI數(shù)據(jù)集上對(duì)所提出的三種方法進(jìn)行了聚類性能的分析與驗(yàn)證,并在實(shí)驗(yàn)過(guò)程中討論了所提出方法的參數(shù)選擇問(wèn)題。實(shí)驗(yàn)結(jié)果顯示,本文提出的KELMC算法將超限學(xué)習(xí)機(jī)模型與聚類技術(shù)進(jìn)行了有效結(jié)合,并在多數(shù)數(shù)據(jù)集上獲得了較好的聚類效果,具有較強(qiáng)的適應(yīng)與泛化能力。
【關(guān)鍵詞】:聚類 K均值算法 人工神經(jīng)網(wǎng)絡(luò) 超限學(xué)習(xí)機(jī)
【學(xué)位授予單位】:北京工業(yè)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:TP311.13
【目錄】:
- 摘要4-5
- Abstract5-8
- 第1章 緒論8-14
- 1.1 研究背景及意義8-9
- 1.2 研究歷史及現(xiàn)狀9-12
- 1.2.1 聚類算法相關(guān)技術(shù)現(xiàn)狀9-10
- 1.2.2 人工神經(jīng)網(wǎng)絡(luò)相關(guān)技術(shù)現(xiàn)狀10-12
- 1.3 課題來(lái)源12-13
- 1.4 本文研究?jī)?nèi)容及結(jié)構(gòu)13-14
- 第2章 背景技術(shù)介紹14-22
- 2.1 K均值算法14-16
- 2.2 超限學(xué)習(xí)機(jī)模型16-18
- 2.3 超限學(xué)習(xí)機(jī)自編碼器18-20
- 2.4 本章小結(jié)20-22
- 第3章 基于超限學(xué)習(xí)機(jī)的聚類算法22-42
- 3.1 K均值算法的模塊化描述22-25
- 3.1.1 特征空間映射23-24
- 3.1.2 聚類中心初始化24-25
- 3.1.3 相似性函數(shù)25
- 3.1.4 聚類中心更新25
- 3.1.5 終止條件判斷25
- 3.2 基于超限學(xué)習(xí)機(jī)的聚類算法25-31
- 3.2.1 模型參數(shù)初始化27
- 3.2.2 模型訓(xùn)練集的構(gòu)成27-28
- 3.2.3 超限學(xué)習(xí)機(jī)模型的訓(xùn)練28
- 3.2.4 終止條件判斷28-29
- 3.2.5 聚類中心更新29
- 3.2.6 KELMC算法描述29-31
- 3.3 基于ELM-AE與PCA特征空間的KELMC算法31-35
- 3.3.1 基于ELM-AE的特征映射32
- 3.3.2 基于PCA的特征降維32-33
- 3.3.3 EP-KELMC算法描述33-35
- 3.4 基于半監(jiān)督流形學(xué)習(xí)的KELMC算法35-40
- 3.4.1 流形結(jié)構(gòu)信息獲取36-37
- 3.4.2 半監(jiān)督超限學(xué)習(xí)機(jī)模型的訓(xùn)練37-38
- 3.4.3 聚類中心更新38
- 3.4.4 MF-KELMC算法描述38-40
- 3.5 本章小結(jié)40-42
- 第4章 實(shí)驗(yàn)分析及參數(shù)討論42-56
- 4.1 實(shí)驗(yàn)描述42-45
- 4.1.1 聚類算法的評(píng)價(jià)指標(biāo)42
- 4.1.2 人工數(shù)據(jù)集描述42-43
- 4.1.3 UCI數(shù)據(jù)集描述43-45
- 4.2 參數(shù)選擇45-50
- 4.2.1 正則項(xiàng)系數(shù)45-47
- 4.2.2 隱層節(jié)點(diǎn)個(gè)數(shù)47-49
- 4.2.3 中心樣本個(gè)數(shù)49-50
- 4.3 實(shí)驗(yàn)的結(jié)果及分析50-54
- 4.3.1 在人工數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果分析50-53
- 4.3.2 在UCI數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果分析53-54
- 4.4 本章小結(jié)54-56
- 結(jié)論56-58
- 參考文獻(xiàn)58-62
- 攻讀碩士學(xué)位期間的研究成果62-64
- 致謝64
本文編號(hào):1023463
本文鏈接:http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/1023463.html
最近更新
教材專著