分布式流計算平臺計算節(jié)點的系統(tǒng)設計與實現(xiàn)
發(fā)布時間:2021-06-30 12:43
現(xiàn)今,隨著互聯(lián)網(wǎng)和物聯(lián)網(wǎng)的不斷發(fā)展,接入互聯(lián)網(wǎng)的人群基數(shù)不斷增大,接入物聯(lián)網(wǎng)的設備劇增。在網(wǎng)絡中,時時刻刻都有海量的數(shù)據(jù)流在動態(tài)的流動,而這些信息流中隱藏著很多對國防、科技、商業(yè)有用的信息,而很多高價值的信息,都具有很強的時效性,需要實時分析提取。處理這些海量的實時數(shù)據(jù),需要高性能的分布式流式計算系統(tǒng),通過輸入數(shù)據(jù)流可以實時的從系統(tǒng)中獲得分析結果。而分布式流式計算系統(tǒng)的計算節(jié)點的性能好壞將會直接影響消息處理的時延,因此低數(shù)據(jù)處理延時、高系統(tǒng)吞吐量則是分布式流式計算系統(tǒng)的核心指標。在此條件下,如何設計一個低延時、高吞吐并且具有良好的功能擴展性的計算節(jié)點框架,成為分布式流式計算系統(tǒng)的難點所在。本文主要完成以下方面創(chuàng)新和工作:1.以目前實驗室自主研發(fā)的分布式流式計算平臺的計算節(jié)點日常使用中,其計算節(jié)點高數(shù)據(jù)吞吐量和低消息處理延時不能同時滿足的問題為背景。本文通過分析實時流式計算場景下,流式數(shù)據(jù)的特征、計算節(jié)點的消息收發(fā)方式和消息處理方式,提出了一個適合流式計算場景的計算節(jié)點框架。此框架優(yōu)化了計算節(jié)點收發(fā)數(shù)據(jù)的方式和改進了數(shù)據(jù)的處理方式,從而升系統(tǒng)吞吐能力并降低了消息處理延時;2.數(shù)據(jù)流中的數(shù)...
【文章來源】:電子科技大學四川省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:94 頁
【學位級別】:碩士
【部分圖文】:
多線程服務程序模型
電子科技大學碩士學位論文5.2 M:N 線程庫 uthreadLib 測試為了測試 uthreadLib 的啟動大量用戶態(tài)輕量級線程用來并行計算的功能,設計一個 CPU 密集型計算的任務,分別用一個 pthread 線程執(zhí)行 nworks 次計算任務和用 nworks 個用戶態(tài)線程并行去計算任務。用 nmon 工具查看兩種不同的計算模式,CPU 狀態(tài)圖如圖5-8所示:
46464241434444SpoutSplit BoltCalc BoltMerge Bolt圖 5-18 worker 間數(shù)據(jù)傳輸吞吐量測試 DAG由于 42 節(jié)點是整個系統(tǒng)中,數(shù)據(jù)的總出入口,因此我們觀測 42 的網(wǎng)絡吞吐量就可以得知整個系統(tǒng)的數(shù)據(jù)處理吞吐量。作為對比,下面將列出不同并發(fā)處理模式下 Worker 間數(shù)據(jù)傳輸?shù)耐掏铝繉Ρ,Worker 的版本分別有 one eventloop per thread 模式和本文提出的 uthread 改進版。其中 one eventloop per thread 模式指的是,一個 I/O 線程和若干 worker thread。I/O 線程只負責監(jiān)聽 tcp 連接,把建立的 tcp 連接負載均衡的分配給 worker thread,而 worker thread 中包含一個 epoll,為一個單獨的 EventLoop。因此單個 workerthread 可以專門處理多路數(shù)據(jù)連接。
【參考文獻】:
期刊論文
[1]大數(shù)據(jù)流式計算:關鍵技術及系統(tǒng)實例[J]. 孫大為,張廣艷,鄭緯民. 軟件學報. 2014(04)
[2]網(wǎng)絡大數(shù)據(jù):現(xiàn)狀與展望[J]. 王元卓,靳小龍,程學旗. 計算機學報. 2013(06)
[3]大數(shù)據(jù)背景下商務管理研究若干前沿課題[J]. 馮芷艷,郭迅華,曾大軍,陳煜波,陳國青. 管理科學學報. 2013(01)
[4]大數(shù)據(jù)研究:未來科技及經(jīng)濟社會發(fā)展的重大戰(zhàn)略領域——大數(shù)據(jù)的研究現(xiàn)狀與科學思考[J]. 李國杰,程學旗. 中國科學院院刊. 2012(06)
[5]大數(shù)據(jù)分析——RDBMS與MapReduce的競爭與共生[J]. 覃雄派,王會舉,杜小勇,王珊. 軟件學報. 2012(01)
[6]基于EPOLL的單進程事件驅動通信服務器設計與分析[J]. 段翰聰,盧顯良,宋杰. 計算機應用. 2004(10)
本文編號:3257764
【文章來源】:電子科技大學四川省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:94 頁
【學位級別】:碩士
【部分圖文】:
多線程服務程序模型
電子科技大學碩士學位論文5.2 M:N 線程庫 uthreadLib 測試為了測試 uthreadLib 的啟動大量用戶態(tài)輕量級線程用來并行計算的功能,設計一個 CPU 密集型計算的任務,分別用一個 pthread 線程執(zhí)行 nworks 次計算任務和用 nworks 個用戶態(tài)線程并行去計算任務。用 nmon 工具查看兩種不同的計算模式,CPU 狀態(tài)圖如圖5-8所示:
46464241434444SpoutSplit BoltCalc BoltMerge Bolt圖 5-18 worker 間數(shù)據(jù)傳輸吞吐量測試 DAG由于 42 節(jié)點是整個系統(tǒng)中,數(shù)據(jù)的總出入口,因此我們觀測 42 的網(wǎng)絡吞吐量就可以得知整個系統(tǒng)的數(shù)據(jù)處理吞吐量。作為對比,下面將列出不同并發(fā)處理模式下 Worker 間數(shù)據(jù)傳輸?shù)耐掏铝繉Ρ,Worker 的版本分別有 one eventloop per thread 模式和本文提出的 uthread 改進版。其中 one eventloop per thread 模式指的是,一個 I/O 線程和若干 worker thread。I/O 線程只負責監(jiān)聽 tcp 連接,把建立的 tcp 連接負載均衡的分配給 worker thread,而 worker thread 中包含一個 epoll,為一個單獨的 EventLoop。因此單個 workerthread 可以專門處理多路數(shù)據(jù)連接。
【參考文獻】:
期刊論文
[1]大數(shù)據(jù)流式計算:關鍵技術及系統(tǒng)實例[J]. 孫大為,張廣艷,鄭緯民. 軟件學報. 2014(04)
[2]網(wǎng)絡大數(shù)據(jù):現(xiàn)狀與展望[J]. 王元卓,靳小龍,程學旗. 計算機學報. 2013(06)
[3]大數(shù)據(jù)背景下商務管理研究若干前沿課題[J]. 馮芷艷,郭迅華,曾大軍,陳煜波,陳國青. 管理科學學報. 2013(01)
[4]大數(shù)據(jù)研究:未來科技及經(jīng)濟社會發(fā)展的重大戰(zhàn)略領域——大數(shù)據(jù)的研究現(xiàn)狀與科學思考[J]. 李國杰,程學旗. 中國科學院院刊. 2012(06)
[5]大數(shù)據(jù)分析——RDBMS與MapReduce的競爭與共生[J]. 覃雄派,王會舉,杜小勇,王珊. 軟件學報. 2012(01)
[6]基于EPOLL的單進程事件驅動通信服務器設計與分析[J]. 段翰聰,盧顯良,宋杰. 計算機應用. 2004(10)
本文編號:3257764
本文鏈接:http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/3257764.html
最近更新
教材專著