天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 搜索引擎論文 >

面向大數(shù)據(jù)集的遞增聚類(lèi)方法研究

發(fā)布時(shí)間:2017-03-30 21:03

  本文關(guān)鍵詞:面向大數(shù)據(jù)集的遞增聚類(lèi)方法研究,由筆耕文化傳播整理發(fā)布。


【摘要】:隨著信息技術(shù)的不斷發(fā)展,數(shù)據(jù)挖掘、搜索引擎、大數(shù)據(jù)等領(lǐng)域受到了人們?cè)絹?lái)越多的關(guān)注。聚類(lèi)技術(shù),尤其是大數(shù)據(jù)背景下的聚類(lèi)技術(shù),在數(shù)據(jù)分析領(lǐng)域得到了廣泛的應(yīng)用,也成為了近年來(lái)專(zhuān)家學(xué)者們的研究熱點(diǎn),F(xiàn)有的聚類(lèi)技術(shù)的研究主要側(cè)重于靜態(tài)的單一聚類(lèi)算法,即在進(jìn)行聚類(lèi)之前,對(duì)整體數(shù)據(jù)集進(jìn)行一次掃描。但是,在大數(shù)據(jù)背景下的很多應(yīng)用場(chǎng)景,數(shù)據(jù)流本身是動(dòng)態(tài)生成和讀取的,也受限于空間和時(shí)間的限制,靜態(tài)聚類(lèi)算法有其一定的限制。另外,數(shù)據(jù)集本身的分布、聚類(lèi)算法的參數(shù)選擇等因素對(duì)聚類(lèi)結(jié)果有著很大的影響,只使用單一的一種聚類(lèi)算法對(duì)數(shù)據(jù)集進(jìn)行分析存在較大的風(fēng)險(xiǎn)。在這樣的背景下,本文主要進(jìn)行了下述兩個(gè)方面的工作:(1)本文提出了一種新的遞增聚類(lèi)算法——基于高斯混合模型樹(shù)的遞增聚類(lèi)算法。隨著數(shù)據(jù)流的讀入,數(shù)據(jù)不斷地被插入到高斯混合模型樹(shù),高斯混合模型樹(shù)也隨之自底向上的被構(gòu)建。構(gòu)建樹(shù)的過(guò)程即遞增聚類(lèi)的過(guò)程。樹(shù)的葉子節(jié)點(diǎn)對(duì)應(yīng)著稠密的單高斯數(shù)據(jù)分布,樹(shù)的非葉子節(jié)點(diǎn)對(duì)應(yīng)著高斯混合模型分布。遞增聚類(lèi)樹(shù)構(gòu)建完畢之后,樹(shù)的節(jié)點(diǎn)對(duì)應(yīng)著聚類(lèi)的結(jié)果。(2)本文提出了一種新的融合聚類(lèi)算法——基于高斯混合模型和證據(jù)理論的融合聚類(lèi)算法。在多組候選聚類(lèi)結(jié)果的基礎(chǔ)上,引入證據(jù)理論計(jì)算每個(gè)數(shù)據(jù)點(diǎn)在不同候選聚類(lèi)結(jié)果下的置信度,通過(guò)新計(jì)算出的融合后的置信度確定該數(shù)據(jù)點(diǎn)的聚類(lèi)歸屬。本文對(duì)提出的算法進(jìn)行了詳細(xì)的實(shí)驗(yàn),分別在人工生成數(shù)據(jù)集、二維點(diǎn)數(shù)據(jù)集、真實(shí)數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn),對(duì)聚類(lèi)算法的準(zhǔn)確性、時(shí)間復(fù)雜度、空間復(fù)雜度、穩(wěn)定性、可擴(kuò)展性、參數(shù)敏感性等重要指標(biāo)進(jìn)行了測(cè)試,并與現(xiàn)有的靜態(tài)聚類(lèi)算法、遞增聚類(lèi)算法和融合聚類(lèi)算法進(jìn)行比較。實(shí)驗(yàn)證明,本文提出的遞增聚類(lèi)算法和融合聚類(lèi)算法取得了很好的效果,具有較強(qiáng)的實(shí)際應(yīng)用意義。
【關(guān)鍵詞】:遞增聚類(lèi) 融合聚類(lèi) 高斯混合模型 證據(jù)理論 大數(shù)據(jù)
【學(xué)位授予單位】:北京理工大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類(lèi)號(hào)】:TP311.13;TP202
【目錄】:
  • 摘要5-6
  • Abstract6-9
  • 第1章 緒論9-16
  • 1.1 引言9-10
  • 1.2 研究現(xiàn)狀10-13
  • 1.2.1 靜態(tài)聚類(lèi)方法研究現(xiàn)狀10-11
  • 1.2.2 遞增聚類(lèi)方法研究現(xiàn)狀11-13
  • 1.2.3 融合聚類(lèi)方法研究現(xiàn)狀13
  • 1.3 研究目標(biāo)和內(nèi)容13-15
  • 1.3.1 研究目標(biāo)13-14
  • 1.3.2 研究?jī)?nèi)容14
  • 1.3.3 主要問(wèn)題和難點(diǎn)14-15
  • 1.4 論文結(jié)構(gòu)15-16
  • 第2章 背景知識(shí)16-22
  • 2.1 引言16
  • 2.2 高斯混合模型16-17
  • 2.3 高斯混合模型相似性度量公式17
  • 2.4 證據(jù)理論17-18
  • 2.5 實(shí)驗(yàn)數(shù)據(jù)庫(kù)及評(píng)價(jià)準(zhǔn)則18-20
  • 2.5.1 實(shí)驗(yàn)數(shù)據(jù)庫(kù)18-19
  • 2.5.2 評(píng)價(jià)標(biāo)準(zhǔn)19-20
  • 2.6 本章小結(jié)20-22
  • 第3章 基于高斯混合模型樹(shù)的遞增聚類(lèi)算法22-49
  • 3.1 引言22
  • 3.2 本文方法22-32
  • 3.2.1 高斯混合模型樹(shù)23-24
  • 3.2.2 數(shù)據(jù)插入24-25
  • 3.2.3 數(shù)據(jù)刪除25-28
  • 3.2.4 聚類(lèi)樹(shù)的更新28-30
  • 3.2.5 聚類(lèi)結(jié)果的確定30-32
  • 3.3 實(shí)驗(yàn)32-47
  • 3.3.1 實(shí)驗(yàn)設(shè)置32-33
  • 3.3.2 實(shí)驗(yàn)結(jié)果與分析33-47
  • 3.4 本章小結(jié)47-49
  • 第4章 基于高斯混合模型和證據(jù)理論的融合聚類(lèi)算法49-57
  • 4.1 引言49-50
  • 4.2 本文方法50-53
  • 4.2.1 基于高斯混合模型的數(shù)據(jù)擬合方法50-51
  • 4.2.2 基于證據(jù)理論的融合聚類(lèi)算法51-53
  • 4.3 實(shí)驗(yàn)53-56
  • 4.3.1 實(shí)驗(yàn)設(shè)置53-54
  • 4.3.2 實(shí)驗(yàn)結(jié)果與分析54-56
  • 4.4 本章小結(jié)56-57
  • 第5章 總結(jié)與展望57-59
  • 5.1 本文工作總結(jié)57-58
  • 5.2 下一步工作展望58-59
  • 參考文獻(xiàn)59-65
  • 攻讀學(xué)位期間發(fā)表論文與研究成果清單65-66
  • 致謝66

【參考文獻(xiàn)】

中國(guó)期刊全文數(shù)據(jù)庫(kù) 前1條

1 于達(dá)仁,胡清華,鮑文;融合粗糙集和模糊聚類(lèi)的連續(xù)數(shù)據(jù)知識(shí)發(fā)現(xiàn)[J];中國(guó)電機(jī)工程學(xué)報(bào);2004年06期


  本文關(guān)鍵詞:面向大數(shù)據(jù)集的遞增聚類(lèi)方法研究,,由筆耕文化傳播整理發(fā)布。



本文編號(hào):278059

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/sousuoyinqinglunwen/278059.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶(hù)7cbef***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com