天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 軟件論文 >

基于Spark的BIRCH算法并行化的設計與實現

發(fā)布時間:2018-06-26 19:41

  本文選題:Spark + BIRCH并行化 ; 參考:《計算機工程與科學》2017年01期


【摘要】:在分布式計算和內存為王的時代,Spark作為基于內存計算的分布式框架技術得到了前所未有的關注與應用。著重研究BIRCH算法在Spark上并行化的設計和實現,經過理論性能分析得到并行化過程中時間消耗較多的Spark轉化操作,同時根據并行化BIRCH算法的有向無環(huán)圖DAG,減少shuffle和磁盤讀寫頻率,以期達到性能優(yōu)化。最后,將并行化后的BIRCH算法分別與單機的BIRCH算法和MLlib中的K-Means聚類算法做了性能對比實驗。實驗結果表明,通過Spark對BIRCH算法并行化,其聚類質量沒有明顯的損失,并且獲得了比較理想的運行時間和加速比。
[Abstract]:In the era of distributed computing and memory being king, Spark, as a distributed framework based on memory computing, has received unprecedented attention and application. This paper focuses on the design and implementation of parallelization of Birch algorithm on Spark. Through theoretical performance analysis, the Spark conversion operation, which consumes more time in the process of parallelization, is obtained. At the same time, according to the directed acyclic graph DAG of parallelized Birch algorithm, the frequency of shuffle and disk reading and writing is reduced. In order to achieve performance optimization. Finally, the parallel Birch algorithm is compared with the single-machine Birch algorithm and the K-Means clustering algorithm in MLlib. The experimental results show that the BIRCH algorithm is parallelized by Spark without obvious loss of clustering quality, and the ideal running time and speedup ratio are obtained.
【作者單位】: 北京郵電大學智能通信軟件與多媒體北京重點實驗室;北京郵電大學計算機學院;國網山東省電力公司電力科學研究院;
【基金】:國家863計劃(2015AA050204) 國網科技項目(60873120)
【分類號】:TP311.13

【相似文獻】

相關期刊論文 前10條

1 吳正娟;職為梅;楊勇;范明;;并行化的粒子群技術[J];微計算機信息;2009年36期

2 齊書陽;;迎接并行化的明天[J];軟件世界;2009年06期

3 曹琳,楊學軍,金國華;兩種并行化機制的分析[J];計算機研究與發(fā)展;1993年09期

4 金國華,,陳福接;并行化技術與工具[J];計算機研究與發(fā)展;1996年07期

5 蔡立志,童維勤,廖文昭;序列拼裝程序的并行化研究與實現[J];計算機工程與應用;2003年14期

6 王偉;潘建偉;;有限差分法的并行化計算實現[J];電腦知識與技術;2008年07期

7 程錦松;;迭代法的并行化[J];安徽大學學報(自然科學版);1997年03期

8 陳再高;王s

本文編號:2071189


資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/2071189.html


Copyright(c)文論論文網All Rights Reserved | 網站地圖 |

版權申明:資料由用戶7d1f9***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com