天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 計算機論文 >

基于多核處理器的自適應(yīng)異構(gòu)并行庫的優(yōu)化與實現(xiàn)

發(fā)布時間:2017-07-28 13:32

  本文關(guān)鍵詞:基于多核處理器的自適應(yīng)異構(gòu)并行庫的優(yōu)化與實現(xiàn)


  更多相關(guān)文章: 并行庫優(yōu)化 自適應(yīng)選擇 線程分配


【摘要】:串行計算的時代已經(jīng)結(jié)束了。隨著多核處理器的出現(xiàn),高性能并行計算,現(xiàn)在已經(jīng)作為主流出現(xiàn)。而本項目中的并行庫,就是為用戶提供高性能計算的TM并行庫,可協(xié)助開發(fā)者,開發(fā)出性能高效的應(yīng)用程序。 本論文是針對并行庫的優(yōu)化與實現(xiàn)展開的,,與英特爾的并行庫TBB作為參照,找到現(xiàn)TM并行庫存在的瓶頸問題及效率慢的原因,并根據(jù)發(fā)現(xiàn)的問題以及多案例提供的數(shù)據(jù)對比來確定優(yōu)化方案,根據(jù)優(yōu)化方案進行具體的編碼實現(xiàn)工作。 從技術(shù)難點方面看,涉及到并行子任務(wù)劃分技術(shù),由于劃分后的每個子任務(wù)在多核處理器下并行運行,因此子任務(wù)的劃分大小直接影響運行效率;線程“復(fù)用”策略,減少線程被“喚醒”的額外時間;串并行路徑的自適應(yīng)學習方法,把未經(jīng)學習的數(shù)據(jù)通過學習過程找到規(guī)律,即判斷出串行走向和并行走向;在判斷走向時,是根據(jù)已知學習點進行的曲線擬合,涉及最小二乘法的數(shù)學優(yōu)化技術(shù)來進行曲線擬合。優(yōu)化過程中,提高運行效率的關(guān)鍵之一就是進行更佳的線程分配策略的過程,優(yōu)化線程分配主要從兩方面入手,一方面是減少線程間的切換,另一方面是充分利用當前線程。 本項目用C++語言開發(fā),是一套C++模板庫,TM并行庫的功能包括parallel_for并行算法,Pipeline流水線算法,因此提高這兩大功能的效率,就是提高整體TM并行庫的效率,優(yōu)化功能就是以提高parallel_for和pipeline為目標的。parallel_for沿用思路的優(yōu)化與實現(xiàn),改善了原parallel_for在小數(shù)據(jù)量或小任務(wù)量下運行效率低的問題,并使TM更加具有競爭力。串并行路徑選擇器功能的添加,為后續(xù)運行提供了提示作用,提高小數(shù)據(jù)量下執(zhí)行串行的效率。 經(jīng)過多案例下的測試,證明本次優(yōu)化提高并行庫的執(zhí)行性能,且通過功能實現(xiàn),完成了部分預(yù)期優(yōu)化目標,提高TM自身的競爭力,對于用戶具有較高的實用價值。
【關(guān)鍵詞】:并行庫優(yōu)化 自適應(yīng)選擇 線程分配
【學位授予單位】:哈爾濱工業(yè)大學
【學位級別】:碩士
【學位授予年份】:2014
【分類號】:TP311.1;TP332
【目錄】:
  • 摘要4-5
  • Abstract5-10
  • 縮略詞和專業(yè)術(shù)語10-11
  • 第1章 緒論11-15
  • 1.1 課題來源及研究意義11
  • 1.2 與課題相關(guān)的國內(nèi)外研究綜述11-13
  • 1.2.1 業(yè)內(nèi)類似并行庫介紹11-12
  • 1.2.2 并行研究領(lǐng)域及任務(wù)調(diào)度技術(shù)12-13
  • 1.3 本論文的主要工作內(nèi)容13-15
  • 第2章 并行算法介紹及項目關(guān)鍵技術(shù)分析15-23
  • 2.1 并行算法介紹15-17
  • 2.1.1 Parallel_for 算法介紹15-16
  • 2.1.2 Pipeline 算法介紹16-17
  • 2.2 關(guān)鍵技術(shù)分析17-22
  • 2.2.1 線程分配的“遞歸”策略17-19
  • 2.2.2 串并行的自適應(yīng)學習算法19-20
  • 2.2.3 曲線擬合最小二乘法20-21
  • 2.2.4 線程分配策略21-22
  • 2.3 本章小結(jié)22-23
  • 第3章 并行庫優(yōu)化的需求分析23-31
  • 3.1 調(diào)度流程23-24
  • 3.2 關(guān)鍵接口及任務(wù)類型24-26
  • 3.3 功能需求26-29
  • 3.3.1 明確優(yōu)化方案26-27
  • 3.3.2 Parallel_for 算法優(yōu)化27-28
  • 3.3.3 串并行路徑選擇器功能28-29
  • 3.3.4 Pipeline 算法優(yōu)化29
  • 3.4 優(yōu)化需求29-30
  • 3.4.1 優(yōu)化目標30
  • 3.4.2 優(yōu)化內(nèi)容30
  • 3.5 本章小結(jié)30-31
  • 第4章 優(yōu)化并行庫的詳細設(shè)計及實現(xiàn)31-60
  • 4.1 Parallel_for 算法優(yōu)化與實現(xiàn)31-40
  • 4.1.1 思路來源31-33
  • 4.1.2 Parallel_for 優(yōu)化具體實現(xiàn)33-37
  • 4.1.3 Parallel_for 優(yōu)化前后對比37-39
  • 4.1.4 Parallel_for 優(yōu)化前后案例數(shù)據(jù)對比39
  • 4.1.5 Parallel_for 優(yōu)化結(jié)論39-40
  • 4.2 串并行路徑選擇器功能40-56
  • 4.2.1 問題提出40-42
  • 4.2.2 動態(tài)估算獲取權(quán)重方案42-45
  • 4.2.3 自適應(yīng)學習估算曲線擬合策略45
  • 4.2.4 自適應(yīng)學習步長與點數(shù)的選取45-47
  • 4.2.5 串并行具體實現(xiàn)流程47-48
  • 4.2.6 串并行選擇模型48-54
  • 4.2.7 串并行選擇優(yōu)化結(jié)論54-55
  • 4.2.8 串并行路徑選擇器的局限性55-56
  • 4.3 Pipeline 主線程沿用實現(xiàn)及展望56-59
  • 4.3.1 優(yōu)化方案確定56-57
  • 4.3.2 主線程沿用實現(xiàn)57-58
  • 4.3.3 展望功能58-59
  • 4.4 本章小結(jié)59-60
  • 第5章 優(yōu)化結(jié)果的案例測試和數(shù)據(jù)分析60-72
  • 5.1 測試環(huán)境60-61
  • 5.2 測試軟件并行庫的對比61
  • 5.3 Parallel_for 優(yōu)化實現(xiàn)測試結(jié)果61-67
  • 5.3.1 一維子字符串查找案例62-64
  • 5.3.2 一維求平均值案例64-66
  • 5.3.3 二維 Mandelbrot 和矩陣相乘案例對比66-67
  • 5.4 串并行路徑選擇器優(yōu)化實現(xiàn)測試結(jié)果67-70
  • 5.4.1 串并行矩陣相乘案例68-69
  • 5.4.2 串并行矩陣相加案例69-70
  • 5.5 Pipeline 主線程沿用優(yōu)化實現(xiàn)測試結(jié)果70-71
  • 5.6 本章小結(jié)71-72
  • 結(jié)論72-74
  • 參考文獻74-79
  • 致謝79-80
  • 個人簡歷80

【參考文獻】

中國期刊全文數(shù)據(jù)庫 前9條

1 孫海霞;馬玉鳳;;負載均衡綜述[J];電腦知識與技術(shù);2006年08期

2 ;Linear-regression models and algorithms based on the Total-Least-Squares principle[J];Geodesy and Geodynamics;2012年02期

3 Wang Leyang;;Properties of the total least squares estimation[J];Geodesy and Geodynamics;2012年04期

4 胡斌;袁道華;;TBB多核編程及其混合編程模型的研究[J];計算機技術(shù)與發(fā)展;2009年02期

5 劉巧英;喬玉蘭;孫玉強;;并行技術(shù)領(lǐng)域中調(diào)度算法研究[J];中國科技信息;2009年05期

6 黃伯平;趙蔚;余延冬;;自適應(yīng)學習系統(tǒng)參考模型比較分析研究[J];中國電化教育;2009年08期

7 ;Multi-loop adaptive internal model control based on a dynamic partial least squares model[J];Journal of Zhejiang University-Science A(Applied Physics & Engineering);2011年03期

8 楊熾夫;鄭淑濤;靳軍;朱思斌;韓俊偉;;Forward kinematics analysis of parallel manipulator using modified global Newton-Raphson method[J];Journal of Central South University of Technology;2010年06期

9 Xiaolong Xu;Jiaxing Wu;Geng Yang;Ruchuan Wang;;Low-power task scheduling algorithm for large-scale cloud data centers[J];Journal of Systems Engineering and Electronics;2013年05期



本文編號:584319

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/jisuanjikexuelunwen/584319.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶520d1***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com