基于Multi-GPU并行的多場耦合相場模型計算及優(yōu)化研究

發(fā)布時間：2020-09-11 10:12

　　隨著高性能計算技術(shù)的不斷發(fā)展,各種高性能計算方法被廣泛地應(yīng)用于實際工程領(lǐng)域,在國民經(jīng)濟、國防建設(shè)和科技發(fā)展中占有非常重要的戰(zhàn)略地位。相場法是目前用于模擬枝晶微觀組織結(jié)構(gòu)最有效的方法之一。伴隨著相場模型的不斷完善和發(fā)展,流場、溫度場、溶質(zhì)場等外部場被耦合到相場中,使得多場耦合相場模型的求解存在計算量大、計算效率低、計算區(qū)域受限等問題。且在相關(guān)實際應(yīng)用領(lǐng)域,對相場模型在求解規(guī)模上的擴大也有了更為迫切地需求。研究高性能計算方法求解相場模型已成為了計算機科學(xué)與工程學(xué)、材料學(xué)等交叉學(xué)科的研究熱點。多節(jié)點CPU+GPU異構(gòu)的高性能計算集群為提高相場模型求解速度、擴大相場求解規(guī)模提供了新的有力支持。本文基于相場模型與Lattice Boltzmann方法,建立了多場耦合三維PF-LBM相場模型。在多節(jié)點CPU+GPU異構(gòu)集群上,基于CUDA+MPI編程平臺,提出了Multi-GPU并行計算方法,實現(xiàn)了對多場耦合的PF-LBM相場模型的模擬數(shù)值求解。分析了影響Multi-GPU并行計算方法性能的諸多因素,針對MPI通信延遲、GPU計算與通信重疊等問題,提出了兩種相應(yīng)的優(yōu)化方案。為了驗證提出的Multi-GPU并行計算方法的可靠性和有效性,把Multi-GPU并行計算方法求解PF-LBM相場模型的結(jié)果與經(jīng)典理論值以及其他學(xué)者已有的研究結(jié)果進行了對比分析。同時,將優(yōu)化前后的模擬結(jié)果進行對比,驗證了優(yōu)化方案的有效性。對比和分析結(jié)果表明:在高性能計算集群上,采用Multi-GPU并行計算方法的求解結(jié)果與經(jīng)典理論值相符合,證明本文基于Multi-GPU并行方法求解PF-LBM相場模型是行之有效的。相較于以往的模擬計算方法,Multi-GPU并行計算方法在計算效率和模擬規(guī)模上都有一定提升。其中,相較于傳統(tǒng)CPU串行算法,Multi-GPU并行計算方法的加速比最大可達58(21GPU)。相較于節(jié)點數(shù)相同的MPI并行算法,Multi-GPU算法也具有更好的加速求解效果。在相場模擬規(guī)模方面,Multi-GPU并行計算方法的模擬規(guī)模最大可達819?819?819。兩種優(yōu)化方案M-GPU和CB-GPU均能在一定程度上實現(xiàn)對Multi-GPU計算模型的優(yōu)化,且在較大規(guī)模的相場模擬中,CB-GPU計算模型擁有更好的優(yōu)化效果。
【學(xué)位單位】：蘭州理工大學(xué)
【學(xué)位級別】：碩士
【學(xué)位年份】：2018
【中圖分類】：TP38
【部分圖文】：

模塊圖,并行機,計算節(jié)點,內(nèi)存

圖 2.1 并行機體系結(jié)構(gòu)：計算節(jié)點與內(nèi)存模塊分離圖 2.2 并行機體系結(jié)構(gòu)：計算節(jié)點包含內(nèi)存模塊內(nèi)存訪問模型、微處理器以及互聯(lián)網(wǎng)絡(luò)的差異，目前可將主流對稱多處理共享存儲并行機（SMP：Symmetric MultiProcess儲并行機（DSM：Distributed Shared Memory）、機群（clu

模塊圖,并行機,計算節(jié)點,內(nèi)存

9圖 2.2 并行機體系結(jié)構(gòu)：計算節(jié)點包含內(nèi)存模塊根據(jù)內(nèi)存訪問模型、微處理器以及互聯(lián)網(wǎng)絡(luò)的差異，目前可將主流的并行類為：對稱多處理共享存儲并行機（SMP：Symmetric MultiProcessing）、共享存儲并行機（DSM：Distributed Shared Memory）、機群（cluster）、（constellation）和大規(guī)模并行機（MPP：Massively Parallel Processing）等。本文將對 SMP 和 DSM 兩種主流并行機的體系結(jié)構(gòu)進行簡要介紹。對于對稱多處理共享存儲并行機（SMP）來說，其處理器和內(nèi)存模塊在互絡(luò)兩側(cè)對稱的分布，如圖 2.3 所示。其主要特征在于存儲器的對稱共享。系任一存儲模塊中的存儲單元和 I/O 模塊均可被任一處理器直接訪問，對于每處理器來說其訪問延遲、帶寬和訪問成功率均是一致的，所有的內(nèi)存單元統(tǒng)

示意圖,體系結(jié)構(gòu),示意圖,并行程序設(shè)計

基于 Multi-GPU 并行的多場耦合相場模型計算及優(yōu)化研究每個處理器在系統(tǒng)中地位相同，系統(tǒng)中不含特權(quán)處理器。每個處個局部高速緩存 Cache，使得每個處理器擁有一個相對獨立的局部Cache 中的數(shù)據(jù)要和存儲塊中的相應(yīng)數(shù)據(jù)保持同步。在 SMP 并行器之間的通信是由進程通過共享數(shù)據(jù)區(qū)域的讀寫操作來實現(xiàn)的，因要略低于網(wǎng)絡(luò)通信的時延。由于 SMP 并行機的以上特性，故其可并行程序設(shè)計、共享存儲并行程序設(shè)計。但同時，SMP 也存在可性低的缺點。

【參考文獻】

相關(guān)期刊論文前10條

1 朱昶勝;鄧新;馮力;李浩;;MPI+OpenMP環(huán)境下的二元合金三維相場模型的并行方法[J];蘭州理工大學(xué)學(xué)報;2017年04期

2 朱昶勝;朱鳴芳;李浩;王永賢;馮立;;基于MPI二元合金三維枝晶生長相場法的并行研究[J];蘭州理工大學(xué)學(xué)報;2016年06期

3 朱昶勝;車超;馮力;肖榮振;;基于MPI的三維枝晶生長相場法的并行計算[J];蘭州理工大學(xué)學(xué)報;2015年05期

4 朱昶勝;賈金芳;馮力;肖榮振;王永賢;;基于GPU的流動影響枝晶生長相場方法[J];蘭州理工大學(xué)學(xué)報;2015年03期

5 王智平;張辛健;路陽;馮力;朱昶勝;安靈敏;;PF-LBM模型模擬強迫對流對二元合金枝晶生長的影響[J];蘭州理工大學(xué)學(xué)報;2014年04期

6 路陽;安靈敏;王智平;馮力;朱昶勝;張辛健;;強迫層流環(huán)境下多晶粒生長的相場法模擬[J];蘭州理工大學(xué)學(xué)報;2014年03期

7 姚光超;鄭堯;肖利民;阮利;;基于MPI+GPU的哼唱檢索系統(tǒng)加速[J];計算機工程與科學(xué);2013年11期

8 許彥芹;陳慶奎;;基于SMP集群的MPI+CUDA模型的研究與實現(xiàn)[J];計算機工程與設(shè)計;2010年15期

9 呂冬蘭;龍文元;夏春;潘美滿;萬紅;;強迫對流影響合金凝固過程枝晶生長的數(shù)值模擬[J];特種鑄造及有色合金;2009年11期

10 馮力;王智平;路陽;朱昌盛;;二元合金多晶粒的枝晶生長的等溫相場模型[J];物理學(xué)報;2008年02期

相關(guān)碩士學(xué)位論文前1條

1 李佳佳;異構(gòu)GPU集群的并行編程模型及實現(xiàn)[D];復(fù)旦大學(xué);2013年

本文編號：2816541

資料下載

論文發(fā)表

支付寶下載

Download by Alipay
微信下載

Download by Wechat
會員下載

Download by Member

本文鏈接：http://www.sikaile.net/kejilunwen/jisuanjikexuelunwen/2816541.html

上一篇：西班牙推出世界首臺3D食品打印機
下一篇：高頻動態(tài)編碼信號采集與存儲系統(tǒng)研究

論文發(fā)表

·知網(wǎng)|萬方|維普|龍源|省級|國家級|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|

天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于Multi-GPU并行的多場耦合相場模型計算及優(yōu)化研究