【摘要】:一直以來(lái),處理器芯片廠商通過(guò)不斷提高主頻和指令級(jí)并行執(zhí)行能力來(lái)提升處理器的性能。現(xiàn)如今這種方法受到內(nèi)存帶寬、指令級(jí)并行度、單線程性能、功耗等諸多因素的限制,已無(wú)法延續(xù)下去。從應(yīng)用需求來(lái)看,日益復(fù)雜的科學(xué)計(jì)算、多媒體、虛擬化等多個(gè)應(yīng)用領(lǐng)域都在呼喚更為強(qiáng)大的計(jì)算能力。在技術(shù)困境和應(yīng)對(duì)計(jì)算能力需求的雙重驅(qū)動(dòng)下,多核處理器芯片作為處理器芯片廠商的應(yīng)對(duì)策略,成為提升處理器性能的事實(shí)上的解決方案,這使得提升處理器性能的思路轉(zhuǎn)變成為不斷提高單個(gè)處理器芯片中處理核心的數(shù)目。 多核處理器提供大規(guī)模線程并行執(zhí)行能力,使應(yīng)用本身有巨大的性能提升潛力,但這給高效率地開(kāi)發(fā)高性能并行應(yīng)用提出巨大挑戰(zhàn)。另一方面,并行程序性能優(yōu)化的過(guò)程一直都是以具體程序和具體計(jì)算平臺(tái)架構(gòu)為研究對(duì)象,收集性能數(shù)據(jù)、分析數(shù)據(jù)、尋找解決辦法、修改代碼實(shí)施改進(jìn)及評(píng)測(cè)性能,這使得優(yōu)化后的程序很難保證性能的可擴(kuò)展性。而從應(yīng)用角度出發(fā),分析、歸納各個(gè)種應(yīng)用中的核心計(jì)算過(guò)程,利用符合多核處理器芯片架構(gòu)的并行計(jì)算模型對(duì)這些核心計(jì)算過(guò)程進(jìn)行優(yōu)化,得出可以被重復(fù)利用的高性能可擴(kuò)展的軟件庫(kù),即可以支持新應(yīng)用的高效開(kāi)發(fā),也可以保證程序性能的可擴(kuò)展性。 在此背景下,本文以分層并行計(jì)算模型思想為指導(dǎo),從應(yīng)用驅(qū)動(dòng)的并行程序性能優(yōu)化的角度出發(fā),首先提出了面向多核處理器芯片體系結(jié)構(gòu)的并行算法設(shè)計(jì)模型,在此基礎(chǔ)上對(duì)并行掃描算法進(jìn)行分析優(yōu)化,得出新的具有良好擴(kuò)展性、高性能g-scan算法,之后對(duì)13種核心計(jì)算實(shí)體之一的稀疏線性代數(shù)計(jì)算實(shí)體深入研究,應(yīng)用g-scan算法設(shè)計(jì)實(shí)現(xiàn)了新的稀疏矩陣-向量運(yùn)算算法,并應(yīng)用到結(jié)構(gòu)工程領(lǐng)域中廣泛使用的有限元分析軟件OpenSees,大大提升了其執(zhí)行效率。本文主要的工作和研究成果包括: (1)面向同構(gòu)多核處理器芯片體系結(jié)構(gòu)的UPMM并行計(jì)算模型 本文以當(dāng)前主流處理器芯片廠商推出的多核處理器芯片體系結(jié)構(gòu)為研究對(duì)象,通過(guò)分析各種多核處理器芯片緩存結(jié)構(gòu)及片上處理核心之間互連特征,設(shè)計(jì)出適用于多種同構(gòu)多核處理器體系結(jié)構(gòu)的并行算法設(shè)計(jì)模型UPMM,并詳細(xì)描述其模型參數(shù)及特征。根據(jù)數(shù)值計(jì)算及科學(xué)計(jì)算應(yīng)用中的基本算法邏輯單元,分析其數(shù)據(jù)訪問(wèn)模式;以此為依據(jù)分析UPMM模型數(shù)據(jù)訪問(wèn)開(kāi)銷。最后基于UPMM模型及數(shù)據(jù)訪問(wèn)開(kāi)銷分析結(jié)論對(duì)矩陣乘運(yùn)算的并行算法進(jìn)行詳細(xì)的性能及緩存開(kāi)銷的研究。實(shí)驗(yàn)證明,利用UPMM模型能較為準(zhǔn)確地分析并行算法的性能及緩存訪問(wèn)開(kāi)銷。 (2)可擴(kuò)展多核處理器模擬器 針對(duì)目前難以通過(guò)較少核心數(shù)目的多核處理器芯片來(lái)推斷較多處理核心數(shù)目芯片的應(yīng)用程序性能瓶頸和性能需求的問(wèn)題,本文基于SimpleScalar用戶態(tài)模擬器工具,利用SystemC設(shè)計(jì)并實(shí)現(xiàn)了配置靈活、可擴(kuò)展的多核處理器芯片模擬器。通過(guò)功能性實(shí)驗(yàn)證明該模擬器能夠?qū)崿F(xiàn)多個(gè)模擬核并發(fā)執(zhí)行指令的設(shè)計(jì)目標(biāo);通過(guò)與實(shí)際采用多核處理器芯片架構(gòu)的計(jì)算機(jī)對(duì)比,證實(shí)本文設(shè)計(jì)實(shí)現(xiàn)的多核模擬器能夠較為準(zhǔn)確地模擬多核處理器多線程并發(fā)執(zhí)行的特點(diǎn);通過(guò)模擬器性能實(shí)驗(yàn)證明該模擬器比sim-outorder在指令執(zhí)行上更加高效;通過(guò)測(cè)試cachemisses實(shí)驗(yàn),證明了UPMM模型在對(duì)并行算法性能分析時(shí)的準(zhǔn)確性。 (3)研究基于UPMM模型基礎(chǔ)并行算法 本文對(duì)廣泛應(yīng)用于排序、最小生成樹(shù)、稀疏矩陣-向量運(yùn)算等問(wèn)題的并行掃描算法開(kāi)展深入研究,對(duì)其在PRAM模型和UPMM模型上的計(jì)算復(fù)雜度進(jìn)行分析比較,改進(jìn)原有算法的數(shù)據(jù)訪問(wèn)順序,充分發(fā)掘數(shù)據(jù)的時(shí)間和空間局域性,并設(shè)計(jì)出基于UPMM模型新的掃描算法,即g-scan算法;通過(guò)對(duì)13種計(jì)算實(shí)體之一的稀疏矩陣-向量運(yùn)算算法的研究,應(yīng)用g-scan算法,設(shè)計(jì)實(shí)現(xiàn)了適用于多種體系結(jié)構(gòu)的稀疏矩陣-向量運(yùn)算算法。多核模擬器的仿真實(shí)驗(yàn)和實(shí)際多核處理器計(jì)算機(jī)的真實(shí)實(shí)驗(yàn),證明了新算法具有較高的性能和較好的可擴(kuò)展性。該研究成果為實(shí)際應(yīng)用如有限元分析、分子動(dòng)力學(xué)分析等提供高性能的基礎(chǔ)運(yùn)算例程。 (4)并行有限元分析軟件OpenSeesSP的性能優(yōu)化 本文以廣泛應(yīng)用于結(jié)構(gòu)工程領(lǐng)域中的開(kāi)源有限元軟件OpenSees的并行版本OpenSeesSP為研究對(duì)象,通過(guò)詳細(xì)分析其性能,發(fā)現(xiàn)該程序三個(gè)性能瓶頸分別是求解線性/非線性方程組時(shí)的分解矩陣算法、進(jìn)程間通信及求解線性/非線性方程組時(shí)的矩陣-向量運(yùn)算算法。設(shè)計(jì)基于行優(yōu)先的并行矩陣UTDU算法,在單節(jié)點(diǎn)使用多線程進(jìn)行矩陣分解,大大提高計(jì)算節(jié)點(diǎn)的計(jì)算效率;通過(guò)利用MPI2中對(duì)于多線程通信的支持,使用OpenMP多線程多進(jìn)程同時(shí)通信,,提高進(jìn)程間通信效率,有效緩解通信性能瓶頸。通過(guò)利用新設(shè)計(jì)的稀疏矩陣-向量計(jì)算算法,大大加快線性/非線性方程組求解過(guò)程。在實(shí)際高性能多核集群計(jì)算平臺(tái)中測(cè)試了上述性能優(yōu)化方案,實(shí)驗(yàn)結(jié)果表明對(duì)OpenSeesSP的性能優(yōu)化非常顯著。
[Abstract]:......
【學(xué)位授予單位】:北京工業(yè)大學(xué)
【學(xué)位級(jí)別】:博士
【學(xué)位授予年份】:2012
【分類號(hào)】:TP332
【參考文獻(xiàn)】
相關(guān)期刊論文 前5條
1 張錦雄;韋化;;基于OpenMP的對(duì)稱矩陣LDL~T分解并行算法實(shí)現(xiàn)[J];廣西科學(xué)院學(xué)報(bào);2008年03期
2 計(jì)永昶,丁衛(wèi)群,陳國(guó)良,安虹;一種實(shí)用的并行計(jì)算模型[J];計(jì)算機(jī)學(xué)報(bào);2001年04期
3 劉黎明,程建鋼;實(shí)對(duì)稱矩陣 LDL~T 分解的異步并行算法與實(shí)現(xiàn)[J];南京建筑工程學(xué)院學(xué)報(bào);1997年04期
4 張健飛,姜弘道;對(duì)稱正定矩陣的并行LDL~T分解算法實(shí)現(xiàn)[J];計(jì)算機(jī)工程與設(shè)計(jì);2003年10期
5 陳國(guó)良;苗乾坤;孫廣中;徐云;鄭啟龍;;分層并行計(jì)算模型[J];中國(guó)科學(xué)技術(shù)大學(xué)學(xué)報(bào);2008年07期
相關(guān)碩士學(xué)位論文 前3條
1 凌炯;面向?qū)ο箝_(kāi)放程序OpenSees在鋼筋混凝土結(jié)構(gòu)非線性分析中的應(yīng)用與初步開(kāi)發(fā)[D];重慶大學(xué);2004年
2 商磊;大規(guī)模線性方程組求解的并行算法及應(yīng)用[D];西北工業(yè)大學(xué);2007年
3 許入文;NHBL并行計(jì)算模型的擴(kuò)展及其性能驗(yàn)證[D];北京交通大學(xué);2008年
本文編號(hào):
2321924
本文鏈接:http://www.sikaile.net/kejilunwen/jisuanjikexuelunwen/2321924.html