基于國產(chǎn)高性能計算機的GRAPES性能優(yōu)化研究
本文關(guān)鍵詞:基于國產(chǎn)高性能計算機的GRAPES性能優(yōu)化研究,由筆耕文化傳播整理發(fā)布。
【摘要】:數(shù)值天氣預(yù)報系統(tǒng)是一個高性能計算技術(shù)與數(shù)值天氣預(yù)報技術(shù)結(jié)合的綜合性學(xué)科。數(shù)值天氣預(yù)報技術(shù)的發(fā)展是推動高性能計算機發(fā)展的重要動力,而高性能計算的發(fā)展為數(shù)值天氣預(yù)報系統(tǒng)采用更加復(fù)雜準確的預(yù)報模型提供了軟硬件基礎(chǔ)。近年來,高性能計算機的性能不斷攀升,出現(xiàn)了以異構(gòu)眾核處理器為組建部件的異構(gòu)高性能計算機。與傳統(tǒng)的單核或多核處理器相比,異構(gòu)處理器的存儲體系和訪存方式發(fā)生了巨大的變化,需要研究新的并行計算方法發(fā)揮異構(gòu)高性能計算機的體系結(jié)構(gòu)優(yōu)勢。GRAPES是我國自主研發(fā)的新一代研究/業(yè)務(wù)數(shù)值天氣預(yù)報系統(tǒng),其通信模式和計算過程復(fù)雜,代碼量高達十萬余行。如何利用新一代國產(chǎn)異構(gòu)高性能計算機的體系結(jié)構(gòu)優(yōu)勢,提高GRAPES模式在國產(chǎn)高性能計算機上的運算效率和計算速度,達到實際數(shù)值預(yù)報業(yè)務(wù)的時限要求,改善GRAPES模式在大規(guī)模并行時的可擴展性,是亟待研究的問題。本文研究了GRAPES的計算原理,對GRAPES程序結(jié)構(gòu)進行了分析并找到影響GRAPES并行效率和可擴展性的熱點子程序。通過對國產(chǎn)高性能計算系統(tǒng)的深入了解,構(gòu)建了實驗所需的MPI并行環(huán)境。針對模式I/O及初始化部分“通信熱點”集中,系統(tǒng)消息緩存過大等問題,為各個子程序分別設(shè)計了高效的通信策略,有效提升了程序的可擴展性和運行速度,其中部分子程序的性能提升達到5倍以上。對于模式迭代積分過程,設(shè)計了“粗粒度MPI并行+細粒度眾核并行”多級異構(gòu)并行方案,充分利用異構(gòu)高性能計算機的體系結(jié)構(gòu)優(yōu)勢,使用數(shù)量眾多的協(xié)處理器為GRAPES模式的迭代積分過程提供加速效果,并提出了幾種多級異構(gòu)并行方案的優(yōu)化策略,有效提升了該方案的并行效率,在使用4096至256顆處理器核進行10天預(yù)報迭代積分過程時,可分別減少1至6個小時不等的運行時間。通過使用兩種不同分辨率的輸入數(shù)據(jù),在多個并行規(guī)模下對優(yōu)化方案進行測試,得到了程序各部分消耗的墻鐘時間,并計算了程序的加速比和并行效率。實驗結(jié)果表明,本文設(shè)計的各種優(yōu)化方案有效地提高了GRAPES模式的運行效率,改善了GRAPES模式的可擴展性,充分發(fā)揮了異構(gòu)眾核處理器的優(yōu)勢,使GRAPES模式能夠達到實際數(shù)值預(yù)報業(yè)務(wù)的時限要求。此外,本文提出的多級異構(gòu)并行計算方案和優(yōu)化策略不僅適用于數(shù)值天氣預(yù)報系統(tǒng)GRAPES,也適用于其他具有多重循環(huán)的高性能計算課題,具有一定的推廣意義。
【關(guān)鍵詞】:GRAPES模式 數(shù)值天氣預(yù)報 并行計算 異構(gòu)計算機 多級并行 優(yōu)化策略
【學(xué)位授予單位】:上海交通大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2014
【分類號】:TP38
【目錄】:
- 摘要3-5
- ABSTRACT5-10
- 第一章 緒論10-15
- 1.1 研究背景10-13
- 1.1.1 數(shù)值天氣預(yù)報發(fā)展概況10-11
- 1.1.2 國內(nèi)外高性能計算系統(tǒng)發(fā)展概況11-13
- 1.2 課題來源及目的13-14
- 1.3 本文主要研究內(nèi)容14-15
- 第二章 消息傳遞接口及實驗平臺綜述15-21
- 2.1 消息傳遞編程規(guī)范15-17
- 2.1.1 消息傳遞編程模型15-16
- 2.1.2 MPI的產(chǎn)生16
- 2.1.3 MPI的實現(xiàn)16-17
- 2.2 MPI并行環(huán)境構(gòu)建17-19
- 2.2.1 本課題采用的MPI實現(xiàn)17-18
- 2.2.2 配置MPICH實驗環(huán)境18-19
- 2.3 硬件環(huán)境介紹19-20
- 2.4 本章小結(jié)20-21
- 第三章 程序結(jié)構(gòu)及性能分析21-26
- 3.1 GRAPES程序結(jié)構(gòu)21-23
- 3.2 GRAPES并行區(qū)域分解方案23-24
- 3.3 程序性能數(shù)據(jù)獲取及分析24-25
- 3.3.1 獲取程序性能數(shù)據(jù)24
- 3.3.2 性能數(shù)據(jù)分析24-25
- 3.4 本章小結(jié)25-26
- 第四章 GRAPES模式I/O及初始化優(yōu)化26-35
- 4.1 GRAPES_INPUT子程序優(yōu)化方案設(shè)計與實現(xiàn)26-30
- 4.1.1 grapes_input子程序結(jié)構(gòu)分析26-28
- 4.1.2 grapes_input子程序優(yōu)化方案設(shè)計28-30
- 4.2 COLM_INIT子程序優(yōu)化方案設(shè)計與實現(xiàn)30-32
- 4.2.1 colm_init子程序結(jié)構(gòu)分析30-31
- 4.2.2 colm_init子程序優(yōu)化方案設(shè)計31-32
- 4.3 模式輸出子程序優(yōu)化方案設(shè)計與實現(xiàn)32-34
- 4.3.1 模式輸出子程序結(jié)構(gòu)分析32-33
- 4.3.2 模式輸出子程序優(yōu)化方案設(shè)計33-34
- 4.4 本章小結(jié)34-35
- 第五章 GRAPES異構(gòu)并行算法研究35-46
- 5.1 眾核并行編程模型介紹35-36
- 5.2 GRAPES多級混合并行編程方案設(shè)計36-38
- 5.3 眾核并行編程優(yōu)化策略38-39
- 5.3.1 數(shù)據(jù)布局優(yōu)化38
- 5.3.2 計算與DMA通信相互隱藏38-39
- 5.3.3 離散數(shù)組內(nèi)存調(diào)整39
- 5.4 眾核并行編程的實現(xiàn)39-44
- 5.4.1 眾核并行編程方法39-43
- 5.4.2 使用Open Acc進行眾核編程43-44
- 5.5 本章小結(jié)44-46
- 第六章 實驗結(jié)果與性能分析46-57
- 6.1 模式I/O及初始化優(yōu)化結(jié)果及分析46-49
- 6.1.1 grapes_input子程序優(yōu)化結(jié)果46-47
- 6.1.2 colm_init子程序優(yōu)化結(jié)果47-48
- 6.1.3 模式輸出子程序優(yōu)化結(jié)果48-49
- 6.2 模式積分迭代過程優(yōu)化結(jié)果及分析49-52
- 6.3 預(yù)報結(jié)果驗證52-56
- 6.4 本章小結(jié)56-57
- 第七章 總結(jié)與展望57-59
- 7.1 全文工作總結(jié)57
- 7.2 進一步研究的展望57-59
- 參考文獻59-62
- 致謝62-63
- 攻讀學(xué)位期間發(fā)表的學(xué)術(shù)論文63-65
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 樊建平;;高性能計算機的發(fā)展現(xiàn)狀與趨勢[J];計算機教育;2004年05期
2 笑春風(fēng);;權(quán)威看臺向您詮釋——中國高性能計算機的今天、明天[J];計算機教育;2004年06期
3 李國杰;;高性能計算機是先進生產(chǎn)力[J];計算機教育;2004年06期
4 樊建平,陳明宇;追蹤下一代高性能計算機前沿?zé)狳c[J];科技潮;2004年05期
5 ;高性能計算機標(biāo)準:在希望與光明中前行[J];信息技術(shù)與標(biāo)準化;2007年06期
6 ;國內(nèi)首次高性能計算機相關(guān)標(biāo)準立項批準[J];現(xiàn)代電子技術(shù);2007年11期
7 ;我國研制成功首臺采用龍芯2號的國產(chǎn)萬億次高性能計算機[J];中國集成電路;2008年01期
8 ;我國首臺萬億次高性能計算機誕生[J];大眾科技;2008年02期
9 朱瑩;;淺談高性能計算機的發(fā)展現(xiàn)狀和瓶頸[J];科技情報開發(fā)與經(jīng)濟;2008年18期
10 ;我國將制定高性能計算機石油行業(yè)應(yīng)用標(biāo)準[J];計量與測試技術(shù);2009年07期
中國重要會議論文全文數(shù)據(jù)庫 前10條
1 ;《計算機研究與發(fā)展》高性能計算機及應(yīng)用專刊(2005年)征稿啟事[A];第二十一屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(研究報告篇)[C];2004年
2 孫凝輝;;高性能計算機的應(yīng)用和發(fā)展[A];第六屆全國計算機應(yīng)用聯(lián)合學(xué)術(shù)會議論文集[C];2002年
3 曹燕;;國家氣象信息中心高性能計算機的現(xiàn)狀及展望[A];信息技術(shù)在氣象領(lǐng)域的開發(fā)應(yīng)用論文集(一)[C];2005年
4 陳國良;;高性能計算及其應(yīng)用(節(jié)選)[A];“廣東科協(xié)論壇第27期:高性能計算與技術(shù)創(chuàng)新”薈萃[C];2009年
5 黃金禮;劉光明;胡維;;基于網(wǎng)絡(luò)服務(wù)的高性能計算機能耗管理研究[A];第十六屆計算機工程與工藝年會暨第二屆微處理器技術(shù)論壇論文集[C];2012年
6 黃清南;梁曉光;張利發(fā);;高性能計算機上光子輸運的并行計算[A];中國工程物理研究院科技年報(1998)[C];1998年
7 魏帆;張寶花;劉倩;金鐘;;面向新一代高性能計算機的量子化學(xué)程序并行化框架[A];中國化學(xué)會第28屆學(xué)術(shù)年會第13分會場摘要集[C];2012年
8 彭德純;;分布式并行處理研究的若干問題[A];IEEE北京分會第一屆學(xué)術(shù)年會論文集[C];1987年
9 許榕生;周玉林;吳春珍;;高性能計算機在物理學(xué)中的應(yīng)用[A];第8屆全國核電子學(xué)與核探測技術(shù)學(xué)術(shù)年會論文集(二)[C];1996年
10 劉菁;馮丹;;高性能計算機在河南省氣象局的應(yīng)用探討[A];2011年中國氣象學(xué)會氣象通信與信息技術(shù)委員會暨國家氣象信息中心科技年會論文摘要[C];2011年
中國重要報紙全文數(shù)據(jù)庫 前10條
1 本報記者 劉路沙;我國高性能計算機如何再攀高峰[N];光明日報;2003年
2 徐建華;高性能計算機標(biāo)準助力信息產(chǎn)業(yè)[N];中國質(zhì)量報;2007年
3 寧雷;高性能計算機標(biāo)準有望出臺[N];中國電腦教育報;2007年
4 本報記者 寧雷;曙光牽頭成立中國高性能計算機標(biāo)準工作委員會[N];中國電腦教育報;2007年
5 韓丹;高性能計算機標(biāo)準制定將遇阻力[N];經(jīng)濟參考報;2007年
6 曹增光;中國沖頂高性能計算機標(biāo)準[N];中國經(jīng)濟時報;2007年
7 原國鋒;高性能計算機亟需國家標(biāo)準[N];人民日報;2007年
8 本報記者 朱毅 胡志敏;期待國產(chǎn)高性能計算機“破冰”[N];政府采購信息報;2006年
9 馮曉芳 趙曉輝;我國高性能計算機標(biāo)準制定蓄勢待發(fā)[N];中國信息報;2007年
10 尹訓(xùn)寧;我國將研究制定高性能計算機標(biāo)準[N];中國知識產(chǎn)權(quán)報;2007年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前1條
1 李暉;高性能計算機若干關(guān)鍵問題研究[D];中國科學(xué)技術(shù)大學(xué);2009年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前9條
1 喻杰;面向高性能計算機體系結(jié)構(gòu)的MapReduce編程框架優(yōu)化研究[D];國防科學(xué)技術(shù)大學(xué);2013年
2 劉釗;基于國產(chǎn)高性能計算機的GRAPES性能優(yōu)化研究[D];上海交通大學(xué);2014年
3 陳良;大型高性能計算機集群故障快速診斷與自動恢復(fù)系統(tǒng)開發(fā)[D];電子科技大學(xué);2012年
4 雷強;高性能計算機功耗管理系統(tǒng)設(shè)計與實現(xiàn)[D];國防科學(xué)技術(shù)大學(xué);2012年
5 黃,
本文編號:390524
本文鏈接:http://www.sikaile.net/kejilunwen/jisuanjikexuelunwen/390524.html