天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 計算機論文 >

基于MapReduce的K-Medoids并行算法研究

發(fā)布時間:2018-02-02 02:05

  本文關鍵詞: K-Medoids 分布式計算 Hadoop 并行采樣 出處:《遼寧工程技術大學》2015年碩士論文 論文類型:學位論文


【摘要】:大數(shù)據(jù)時代,信息呈爆炸性增長,準確的從海量數(shù)據(jù)中進行數(shù)據(jù)的挖掘對當今信息化社會具有重要的價值意義。作為基于劃分的聚類算法K-Medoids,其較大的時間復雜度以及傳統(tǒng)的初始中心點隨機選擇策略已經(jīng)無法適應海量數(shù)據(jù)下的聚類要求。使用MapReduce并行計算模型對算法進行改進,雖然能夠提高算法的運行效率,但是無法解決大數(shù)據(jù)量下的聚類結果不精確,以及收斂性低下的問題,所以必須還要從算法本身出發(fā)去解決這些問題。針對傳統(tǒng)的K-Medoids算法對初始聚類中心敏感、收斂速度較慢,以及在海量數(shù)據(jù)環(huán)境下所面臨的單臺計算機的性能瓶頸問題,從中心點替換方法以及初始簇心選擇方案入手,并利用MapReduce分布式編程模型結合并行隨機采樣策略,實現(xiàn)了一種高效的K-Medoids算法,最后利用Hadoop的分布式存儲及計算特性,實現(xiàn)算法的二次優(yōu)化。通過和傳統(tǒng)的K-Medoids算法以及K-Means算法比較,改進后的K-Medoids算法在集群環(huán)境下不僅有著良好的加速比,在聚類精度以及收斂性上都有了一定程度上的改善。
[Abstract]:In the big data era, the information is increasing explosively. It is of great value to mine the data accurately from the massive data. As a clustering algorithm based on partition K-Medoids, it is of great value to the information society today. Its large time complexity and the traditional random selection strategy of initial center can not meet the clustering requirements of massive data. The algorithm is improved by using MapReduce parallel computing model. Although it can improve the efficiency of the algorithm, it can not solve the problem of inaccurate clustering results and low convergence under the large amount of data. The traditional K-Medoids algorithm is sensitive to the initial clustering center and the convergence speed is slow. And the performance bottleneck of a single computer in the environment of massive data, starting with the center replacement method and the initial cluster center selection scheme. Using MapReduce distributed programming model and parallel random sampling strategy, an efficient K-Medoids algorithm is implemented. Finally, by using the distributed storage and computing characteristics of Hadoop, the quadratic optimization of the algorithm is realized, which is compared with the traditional K-Medoids algorithm and K-Means algorithm. The improved K-Medoids algorithm not only has a good speedup in the cluster environment, but also improves the clustering accuracy and convergence to some extent.
【學位授予單位】:遼寧工程技術大學
【學位級別】:碩士
【學位授予年份】:2015
【分類號】:TP338.6

【相似文獻】

相關期刊論文 前10條

1 葛磊;武芳;王鵬波;張冬林;;3維建筑綜合中基于最小特征的面平移算法[J];測繪科學技術學報;2009年02期

2 駱雯,孫延明,陳振威,陳錦昌;判斷點與封閉多邊形相對關系的改進算法[J];機械;1999年03期

3 李林;盧顯良;;一種基于切割映射的規(guī)則沖突消除算法[J];電子學報;2008年02期

4 劉巧玲;張紅英;林茂松;;一種簡單快速的圖像去霧算法[J];計算機應用與軟件;2013年07期

5 林亞平,楊小林;快速概率分析進化算法及其性能研究[J];電子學報;2001年02期

6 章郡鋒;吳曉紅;黃曉強;何小海;;基于暗原色先驗去霧的改進算法[J];電視技術;2013年23期

7 楊鐵軍;靳婷;;一種動態(tài)整周模糊值求解算法及其仿真分析[J];系統(tǒng)工程與電子技術;2007年01期

8 周秀玲;郭平;陳寶維;王靜;;幾種計算超體積算法的比較研究[J];計算機工程;2011年03期

9 吳一戎,胡東輝,彭海良;Chirp Scaling SAR成象算法及其實現(xiàn)[J];電子科學學刊;1995年03期

10 王貴竹;一種產(chǎn)生單向分解值的算法[J];安徽大學學報(自然科學版);2001年03期

相關會議論文 前10條

1 尹冀鋒;;一種新的圖象自適應增強算法[A];四川省通信學會一九九二年學術年會論文集[C];1992年

2 寧春平;田家瑋;郭延輝;王影;張英濤;鄭桂霞;劉研;;計算機輔助增強、分割算法在鑒別乳腺良、惡性腫塊中的應用價值[A];中華醫(yī)學會第十次全國超聲醫(yī)學學術會議論文匯編[C];2009年

3 謝麗聰;;SVB查詢改寫算法的改進[A];第二十一屆中國數(shù)據(jù)庫學術會議論文集(研究報告篇)[C];2004年

4 鄭存紅;;復雜背景下相關跟蹤算法研究及DSP實現(xiàn)[A];中國光學學會2010年光學大會論文集[C];2010年

5 楊文杰;吳軍;;RFID抗沖突算法研究[A];2008通信理論與技術新進展——第十三屆全國青年通信學術會議論文集(上)[C];2008年

6 高山;畢篤彥;魏娜;;一種基于UPF的小目標TBD算法[A];第十四屆全國圖象圖形學學術會議論文集[C];2008年

7 周磊;張衛(wèi)華;王曉奇;張軍;;基于流水算法的智能路障機器人設計[A];2011年全國電子信息技術與應用學術會議論文集[C];2011年

8 潘巍;李戰(zhàn)懷;陳群;索博;李衛(wèi)榜;;面向MapReduce的非對稱分片復制連接算法優(yōu)化技術研究[A];第29屆中國數(shù)據(jù)庫學術會議論文集(B輯)(NDBC2012)[C];2012年

9 李偉偉;蔡康穎;鄭新;王文成;;3D模型中重復結構的多尺度快速檢測算法[A];第六屆和諧人機環(huán)境聯(lián)合學術會議(HHME2010)、第19屆全國多媒體學術會議(NCMT2010)、第6屆全國人機交互學術會議(CHCI2010)、第5屆全國普適計算學術會議(PCC2010)論文集[C];2010年

10 楊任爾;陳懇;勵金祥;;基于棱邊方向檢測的運動自適應去隔行算法[A];Proceedings of 2010 Chinese Control and Decision Conference[C];2010年

相關重要報紙文章 前1條

1 國泰君安資產(chǎn)管理部;“算法交易”是道指暴跌罪魁禍首?[N];上海證券報;2010年

相關博士學位論文 前10條

1 馮輝;網(wǎng)絡化的并行與分布式優(yōu)化算法研究及應用[D];復旦大學;2013年

2 許玉杰;云計算環(huán)境下海量數(shù)據(jù)的并行聚類算法研究[D];大連海事大學;2014年

3 李琰;基于貓群算法的高光譜遙感森林類型識別研究[D];東北林業(yè)大學;2015年

4 陳加順;海洋環(huán)境下聚類算法的研究[D];南京航空航天大學;2014年

5 王洋;基于群體智能的通信網(wǎng)絡告警關聯(lián)規(guī)則挖掘算法研究[D];太原理工大學;2015年

6 雷雨;面向考試時間表問題的啟發(fā)式進化算法研究[D];西安電子科技大學;2015年

7 熊霖;大數(shù)據(jù)下的數(shù)據(jù)選擇與學習算法研究[D];西安電子科技大學;2015年

8 周雷;基于圖結構的目標檢測與分割算法研究[D];上海交通大學;2014年

9 王冰;人工蜂群算法的改進及相關應用的研究[D];北京理工大學;2015年

10 蔣亦樟;多視角和遷移學習識別方法和智能建模研究[D];江南大學;2015年

相關碩士學位論文 前10條

1 姚鑫宇;EMD去噪與MUSIC算法在DOA估計中的聯(lián)合應用[D];昆明理工大學;2015年

2 陸進;面向含噪數(shù)據(jù)聚類相關算法的研究[D];復旦大學;2014年

3 葉一舟;紅外弱小目標檢測算法研究[D];上海交通大學;2015年

4 王繼重;基于Hadoop和Mahout的K-Means算法設計與實現(xiàn)[D];大連海事大學;2016年

5 何靜;遙感圖像的快速壓縮算法研究[D];北京交通大學;2016年

6 章華燕;鋼軌擦傷檢測算法研究[D];北京交通大學;2016年

7 王一博;MODIS地震熱異常的數(shù)據(jù)處理與算法研究[D];中國石油大學(華東);2014年

8 成鑫;基于組合優(yōu)化問題的多目標模因算法的研究[D];南京航空航天大學;2015年

9 傅致暉;基于協(xié)同分割的視頻目標分割算法研究[D];上海交通大學;2015年

10 張媛;運動車輛檢測與跟蹤算法的研究與實現(xiàn)[D];大連海事大學;2016年

,

本文編號:1483375

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/jisuanjikexuelunwen/1483375.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶87653***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com