基于Spark的海量少數(shù)民族文化資源數(shù)據(jù)挖掘研究
【圖文】:
Spark 運行框架rk 相對于 MapReduce 的優(yōu)勢不僅體現(xiàn)在基于內(nèi)存的性能上,更架集成了更多的子項目[56],包括Spark SQL(交互式操作)、Spark )、MachineLearning lib(機器學(xué)習(xí)庫)、Graphx(并行圖計算庫)。S圖 2.2 所示:rk 的核心是其計算邏輯,提供了多種組件,運行在通用平臺上SparkSQL 可實現(xiàn)對數(shù)據(jù)庫的操作,主要分 3 步處理;第一步 DataFrame 中提供的方法存儲在內(nèi)存中,它支持多種格式的數(shù)用 SQLContext 類;第二步數(shù)據(jù)處理可以實現(xiàn)各種算法,主ntext 類,完成 hive 數(shù)據(jù)庫的操作;第三步結(jié)果輸入是把計算的部存儲文件。Machine Learnig lib 是常用機器學(xué)習(xí)庫的算法實現(xiàn)ng 會不斷接收從接收器發(fā)送來的數(shù)據(jù)流,把時間片內(nèi)的數(shù)據(jù)打包
圖 2.3 Spark運行模式riverProgram 是 Spark 的一個應(yīng)用程序,負責(zé)對整個集群的監(jiān)控,節(jié)點;它通過 SparkContext 來連接整個集群,包含 main 函數(shù),是操作的接口。ClusterManager 負責(zé)分配程序運行所需要的資源和保正常運行;Worker 是集群的計算節(jié)點,存在于每個 Slave 中,rManager 的命令,并以周期性的心跳機制向 ClusterManager 匯報集。每個 Worker 可以單獨的運行,,接收到一個作業(yè),將其劃分為多個Executor 進程進行計算或者數(shù)據(jù)的存儲。DriverProgram 創(chuàng)建進程時 DAGScheduler 和 TaskScheduler;DAGScheduler 屬于高層調(diào)度模ffle 將作業(yè)劃分為不同的 Stage,同時會根據(jù) Partition 構(gòu)造每個 Sta任務(wù),然后以任務(wù)組的形式交由 TaskScheduler 具體執(zhí)行。2.5 YARN 資源管理器
【學(xué)位授予單位】:云南師范大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2019
【分類號】:G122;TP311.13
【參考文獻】
相關(guān)期刊論文 前10條
1 董春濤;李文婷;沈晴霓;吳中海;;Hadoop YARN大數(shù)據(jù)計算框架及其資源調(diào)度機制研究[J];信息通信技術(shù);2015年01期
2 黃永林;;數(shù)字化背景下非物質(zhì)文化遺產(chǎn)的保護與利用[J];文化遺產(chǎn);2015年01期
3 林樂波;陳魯峰;;網(wǎng)絡(luò)教研:引領(lǐng)教研的“新引擎”[J];基礎(chǔ)教育參考;2013年24期
4 劉鵬;孟炎;吳艷艷;宋丹娃;;聚類分析和孤立點技術(shù)在網(wǎng)絡(luò)安全態(tài)勢中的應(yīng)用[J];網(wǎng)絡(luò)安全技術(shù)與應(yīng)用;2013年03期
5 饒君;吳斌;東昱曉;;MapReduce環(huán)境下的并行復(fù)雜網(wǎng)絡(luò)鏈路預(yù)測[J];軟件學(xué)報;2012年12期
6 李宗天;;淺談如何保護和傳承朝鮮族傳統(tǒng)音樂文化[J];品牌(理論月刊);2010年11期
7 華銓平;;面向數(shù)據(jù)特征的分布式數(shù)據(jù)挖掘研究[J];計算機工程與設(shè)計;2010年06期
8 王沁;李磊;陸成勇;孫富明;;平均計算時間復(fù)雜度優(yōu)化的動態(tài)粒子群優(yōu)化算法[J];計算機科學(xué);2010年03期
9 王月;柴瑞敏;;減聚類的模糊C-均值算法在文本分類中的應(yīng)用[J];計算機系統(tǒng)應(yīng)用;2010年03期
10 吳建平;王耀希;代紅兵;;文化遺產(chǎn)數(shù)字化應(yīng)用平臺的技術(shù)構(gòu)建[J];計算機應(yīng)用研究;2006年08期
相關(guān)博士學(xué)位論文 前4條
1 衛(wèi)守林;分布式天文海量數(shù)據(jù)處理與控制研究[D];中國科學(xué)院大學(xué)(中國科學(xué)院云南天文臺);2017年
2 黃家周;文化建設(shè)視域下民族地區(qū)馬克思主義大眾化的路徑研究[D];西南交通大學(xué);2015年
3 王銳;數(shù)字博物館資源虛擬化與數(shù)據(jù)集成方法研究[D];山東大學(xué);2010年
4 李明;智能優(yōu)化排樣技術(shù)研究[D];浙江大學(xué);2006年
相關(guān)碩士學(xué)位論文 前10條
1 趙海燕;基于卷積神經(jīng)網(wǎng)絡(luò)的民族服飾圖像教育資源檢索研究[D];云南師范大學(xué);2018年
2 韓浩;基于云計算的釣魚網(wǎng)站檢測研究[D];中國礦業(yè)大學(xué);2018年
3 鄧家璧;模擬移動床分離過程的控制與優(yōu)化方法研究[D];沈陽化工大學(xué);2018年
4 錢雅倫;基于智能算法的配電網(wǎng)故障自愈方法研究[D];華北電力大學(xué);2018年
5 馮亮亮;基于Hadoop的MapReduce性能優(yōu)化研究[D];南京郵電大學(xué);2017年
6 陳萌;分布式視頻快速識別分析系統(tǒng)設(shè)計與實現(xiàn)[D];西安電子科技大學(xué);2017年
7 何亞南;基于時序動態(tài)描述邏輯的民族文化資源知識表示形式化模型研究[D];云南師范大學(xué);2017年
8 吳稀鈺;基于Spark的譜聚類算法及其在QAR數(shù)據(jù)中的應(yīng)用[D];中國民航大學(xué);2017年
9 劉四平;多源數(shù)據(jù)融合的協(xié)同過濾算法研究[D];湖南大學(xué);2017年
10 陳慧麗;云計算環(huán)境下靜態(tài)任務(wù)調(diào)度機制研究[D];武漢理工大學(xué);2017年
本文編號:2697501
本文鏈接:http://www.sikaile.net/shekelunwen/wenhuayichanlunwen/2697501.html