天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 數(shù)學(xué)論文 >

基于圖模型的高效聚類算法研究

發(fā)布時間:2017-05-13 19:21

  本文關(guān)鍵詞:基于圖模型的高效聚類算法研究,由筆耕文化傳播整理發(fā)布。


【摘要】:近年來,隨著社會網(wǎng)絡(luò)、通信網(wǎng)絡(luò)、生物網(wǎng)絡(luò)等在各領(lǐng)域應(yīng)用的快速發(fā)展,其產(chǎn)生的圖模型數(shù)據(jù)更是呈現(xiàn)出快速增長的態(tài)勢。圖作為一種數(shù)據(jù)結(jié)構(gòu)具有本身其特有的表示方法和信息,一個圖模型可能包含幾百到幾百萬的頂點,而這些頂點及其連接的邊構(gòu)成的關(guān)聯(lián)信息在不同領(lǐng)域中都具有不同的意義,隨著數(shù)據(jù)規(guī)模的不斷增長,如何有效的對這些信息進行綜合分析并從中獲取有用的信息進行應(yīng)用,是非常必要的,也是本文研究的主要的方向。聚類分析作為機器學(xué)習(xí)的一個重要工具目前已經(jīng)被廣泛應(yīng)用于文本挖掘、生物信息學(xué)、模式識別等領(lǐng)域的科學(xué)研究,隨著圖模型數(shù)據(jù)的廣泛應(yīng)用,圖聚類也成為了一類較為重要的聚類分析方法,圖聚類是圖數(shù)據(jù)分析的有效技術(shù)之一。在構(gòu)造節(jié)點的相似矩陣時經(jīng)常采用距離作為評價標(biāo)準(zhǔn),而節(jié)點間存在多條等長路徑及k短路徑,這些路徑間的關(guān)系都會對節(jié)點間相似性產(chǎn)生影響,因此綜合考慮節(jié)點間的距離關(guān)系有助于更好的衡量節(jié)點間的相似性。針對這一問題,本文提出一個基于前k短路徑的圖聚類算法(DRGC),該算法參照譜聚類算法的思想,使用前k短路徑模型構(gòu)造相似矩陣,利用多層自動編碼器代替譜聚類算法中的特征分解實現(xiàn)對數(shù)據(jù)的重構(gòu),并且可以大大減少特征分解所用時間,最后利用非參數(shù)貝葉斯模型進行聚類,因狄利克雷過程具有很好的聚類性質(zhì)并且可以實現(xiàn)對數(shù)據(jù)的自動劃分,因此該算法可以在不預(yù)先指定聚類數(shù)目的情況下得到數(shù)據(jù)集的正確合理劃分。為了克服單一聚類算法對數(shù)據(jù)集敏感的問題,本文提出了一個基于多數(shù)投票的聚類集成算法,該算法利用前k短路徑的圖聚類算法、k均值算法、譜聚類算法作為基聚類算法,以模塊度最高的一組聚類結(jié)果的標(biāo)簽作為基準(zhǔn)標(biāo)簽,,分析與其他聚類結(jié)果的標(biāo)簽之間的關(guān)系,并通過計算對其進行統(tǒng)一,最后通過投票計算出數(shù)據(jù)集最終的聚類劃分結(jié)果。最后,本文對所提出的兩個算法進行了仿真實驗,實驗證明,本文所提出的算法具有良好的聚類性質(zhì),可以得到較為準(zhǔn)確的聚類劃分結(jié)果。
【關(guān)鍵詞】:圖聚類 k最短路徑 聚類集成
【學(xué)位授予單位】:北京交通大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:O157.5;TP311.13
【目錄】:
  • 致謝5-6
  • 摘要6-7
  • ABSTRACT7-11
  • 1 引言11-14
  • 1.1 研究背景及意義11-12
  • 1.2 本文研究的主要內(nèi)容12-13
  • 1.3 論文的組織安排13-14
  • 2 圖聚類研究理論基礎(chǔ)14-25
  • 2.1 圖聚類研究概述14-20
  • 2.1.1 圖模型相關(guān)概念14-15
  • 2.1.2 圖聚類主要方法概述15-20
  • 2.2 聚類集成20-24
  • 2.2.1 聚類集成基本概念20-21
  • 2.2.2 聚類成員的構(gòu)造21-22
  • 2.2.3 合并策略22-24
  • 2.3 本章小結(jié)24-25
  • 3 基于前k短路徑的圖聚類算法25-45
  • 3.1 問題提出25
  • 3.2 前K短路徑的圖聚類算法25-33
  • 3.2.1 相似矩陣構(gòu)造25-27
  • 3.2.2 數(shù)據(jù)重構(gòu)表達27-29
  • 3.2.3 聚類階段29-31
  • 3.2.4 算法流程31-33
  • 3.3 算法仿真及結(jié)果分析33-44
  • 3.3.1 實驗數(shù)據(jù)集33-34
  • 3.3.2 實驗評價標(biāo)準(zhǔn)34-35
  • 3.3.3 實驗結(jié)果分析35-44
  • 3.4 本章小結(jié)44-45
  • 4 基于多數(shù)投票的圖聚類集成算法45-57
  • 4.1 問題提出45
  • 4.2 算法設(shè)計與分析45-51
  • 4.2.1 標(biāo)簽統(tǒng)一策略45-47
  • 4.2.2 合并策略47-48
  • 4.2.3 算法流程48-51
  • 4.3 算法仿真及結(jié)果分析51-55
  • 4.4 本章小結(jié)55-57
  • 5 結(jié)論與展望57-59
  • 5.1 本文總結(jié)57
  • 5.2 未來展望57-59
  • 參考文獻59-63
  • 作者簡歷及攻讀碩士學(xué)位期間取得的研究成果63-65
  • 學(xué)位論文數(shù)據(jù)集65

【相似文獻】

中國期刊全文數(shù)據(jù)庫 前10條

1 田彥山;;基于山峰聚類的聚類上限確定方法[J];江西師范大學(xué)學(xué)報(自然科學(xué)版);2007年02期

2 趙超;舒紅;朱欣焰;戴上平;;氣象數(shù)據(jù)概化中的最佳聚類數(shù)研究[J];華中師范大學(xué)學(xué)報(自然科學(xué)版);2008年03期

3 高翠芳;吳小俊;;復(fù)雜生物數(shù)據(jù)集的聚類數(shù)自動確定方法[J];生物信息學(xué);2010年04期

4 謝娟英;馬箐;謝維信;;一種確定最佳聚類數(shù)的新算法[J];陜西師范大學(xué)學(xué)報(自然科學(xué)版);2012年01期

5 王凌峰;;基于構(gòu)成要素的聚類算法[J];統(tǒng)計與決策;2007年19期

6 程慈;柴瑞敏;;聚類數(shù)的自動確定[J];科技信息(科學(xué)教研);2008年14期

7 方世良;一個聚類數(shù)動態(tài)可調(diào)的水聲信號聚類算法[J];聲學(xué)學(xué)報;1996年S1期

8 李闖;端木京順;蔡忠義;高建國;;基于判斷矩陣的專家模糊核聚類組合賦權(quán)方法[J];控制與決策;2012年09期

9 田娟,王崇駿,李靜,陳兆乾;一個基于譜圖分割的簡單聚類算法[J];復(fù)旦學(xué)報(自然科學(xué)版);2004年05期

10 張李軍;;改進的FCM聚類算法的實現(xiàn)和有效性研究[J];硅谷;2009年10期

中國重要會議論文全文數(shù)據(jù)庫 前9條

1 高翠芳;吳小俊;;基于二階差分的聚類數(shù)自動確定方法[A];江蘇省系統(tǒng)工程學(xué)會第十一屆學(xué)術(shù)年會論文集[C];2009年

2 劉洋;江志綱;丁增喜;王大玲;鮑玉斌;于戈;;一種基于圖的聚類算法GB-Cluster[A];第十九屆全國數(shù)據(jù)庫學(xué)術(shù)會議論文集(技術(shù)報告篇)[C];2002年

3 李浪波;傅彥;劉紅;;基于范例推理的網(wǎng)格和密度聚類算法[A];第二十二屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(技術(shù)報告篇)[C];2005年

4 婁冬梅;陳明;朱有娜;;一種基于密度的無參數(shù)聚類算法[A];第二十三屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(研究報告篇)[C];2006年

5 魏昕路;洪志令;姜青山;;一種基于樣本縮減策略的新窗口式聚類算法[A];第二十四屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(研究報告篇)[C];2007年

6 程尊平;周鼎;王晨;周皓峰;汪衛(wèi);施伯樂;;SDPHC——基于密度的分割和分層的自校聚類算法[A];第二十一屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(研究報告篇)[C];2004年

7 張曉峰;王麗珍;陸葉;;一種基于屬性加權(quán)的不確定K-means聚類算法[A];第26屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(B輯)[C];2009年

8 蔡軍;袁華鵬;陳金海;施伯樂;;一種基于相似性分析的聚類新算法:PDS算法[A];第十八屆全國數(shù)據(jù)庫學(xué)術(shù)會議論文集(研究報告篇)[C];2001年

9 胡仲義;郭超;王永炎;劉勝航;王宏安;;基于時間衰減和特征變量的數(shù)據(jù)流聚類算法[A];第29屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(B輯)(NDBC2012)[C];2012年

中國博士學(xué)位論文全文數(shù)據(jù)庫 前10條

1 胡雅婷;可能性聚類方法研究及應(yīng)用[D];吉林大學(xué);2012年

2 王縱虎;聚類分析優(yōu)化關(guān)鍵技術(shù)研究[D];西安電子科技大學(xué);2012年

3 周世兵;聚類分析中的最佳聚類數(shù)確定方法研究及應(yīng)用[D];江南大學(xué);2011年

4 楊燕;基于計算智能的聚類組合算法研究[D];西南交通大學(xué);2006年

5 馮永;基于計算智能的聚類技術(shù)及其應(yīng)用研究[D];重慶大學(xué);2006年

6 劉晨;高伸縮性聚類分析方法研究[D];哈爾濱工程大學(xué);2013年

7 王強;局部疊加基因表達模式聚類分析方法研究[D];哈爾濱工業(yè)大學(xué);2012年

8 姜磊;混合演化聚類算法研究及其應(yīng)用[D];武漢大學(xué);2012年

9 尹學(xué)松;半監(jiān)督聚類分析策略設(shè)計及其拓展性研究[D];南京航空航天大學(xué);2009年

10 白亮;聚類學(xué)習(xí)的理論分析與高效算法研究[D];山西大學(xué);2012年

中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條

1 魏建東;K-means初始化算法研究[D];南京理工大學(xué);2015年

2 張依;基于MapReduce的k-means聚類算法并行化研究[D];中央民族大學(xué);2015年

3 劉嬋;蟻群與K均值聚類算法融合研究及其在用戶分群中的應(yīng)用[D];西南科技大學(xué);2015年

4 朱琪;基于減法聚類的混合算法研究[D];湖南科技大學(xué);2015年

5 韓偉森;聚類集成研究與應(yīng)用[D];貴州大學(xué);2015年

6 譚浩;K-Means算法改進及其在森林健康評價中的應(yīng)用[D];中南林業(yè)科技大學(xué);2015年

7 嚴(yán)巍;以KPCA為核心的FCM算法改進[D];成都理工大學(xué);2015年

8 汪娟;基于權(quán)重設(shè)計的聚類集成算法研究[D];重慶大學(xué);2015年

9 牛品菽;基于圖模型的高效聚類算法研究[D];北京交通大學(xué);2016年

10 喬坤;基于系統(tǒng)能量理論的聚類算法及其應(yīng)用研究[D];西安建筑科技大學(xué);2007年


  本文關(guān)鍵詞:基于圖模型的高效聚類算法研究,,由筆耕文化傳播整理發(fā)布。



本文編號:363430

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/yysx/363430.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶a012f***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com