天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于異構(gòu)計算的MOND數(shù)值模擬加速技術(shù)研究

發(fā)布時間:2018-09-14 17:22
【摘要】:現(xiàn)代宇宙學(xué)中,科學(xué)家們提出了許多新理論來解釋種種天文現(xiàn)象。他們需要基于觀測現(xiàn)象進行精確的數(shù)值模擬,依據(jù)模擬結(jié)果驗證新理論的正確性。而天文觀測結(jié)果表明,基于牛頓力學(xué)所建立的宇宙學(xué)模型無法解釋觀測獲得的星系旋轉(zhuǎn)曲線等現(xiàn)象。為了解決這些問題,理論物理學(xué)家指出牛頓力學(xué)在星系大尺度空間下可能不準(zhǔn)確,發(fā)展出不同于暗物質(zhì)理論的修正牛頓動力學(xué)理論(Modified Newtonian Dynamics,MOND)。但是由于MOND理論的數(shù)值模擬包含具有高計算復(fù)雜度的N體模擬,受計算能力的制約,MOND數(shù)值模擬的規(guī)模一直不大。N體模擬是天體動力學(xué)模擬中重要的基礎(chǔ)運算之一。它不僅在天體物理學(xué)中被用來模擬星系的演變、驗證新的宇宙學(xué)理論,還在等離子體物理、分子動力學(xué)、流體動力學(xué)等科學(xué)、工程領(lǐng)域都有著重要的地位。隨著近年來計算機技術(shù)的發(fā)展帶來的計算能力驟增,N體模擬的規(guī)模越來越大,在各個領(lǐng)域也發(fā)揮著越來越重要的作用。目前對于N體模擬的計算能力需求依舊在不斷增大。為了簡化計算,研究人員做出了許多假設(shè),提出了多種近似算法,比如粒子網(wǎng)格算法(Particle Mesh,PM),樹形算法(Tree),樹-粒子網(wǎng)格混合(TreePM)算法以及粒子-粒子網(wǎng)格混合算法(P3M)。其中,TreePM算法,由于可以較好地平衡計算精度和速度的需求,在天文學(xué)數(shù)值模擬領(lǐng)域獲得了廣泛的應(yīng)用。為了進一步提高計算速度,多種計算加速技術(shù)也被應(yīng)用到N體模擬中。利用新的計算加速技術(shù)來加速N體模擬也一直是學(xué)術(shù)界和工業(yè)界的研究熱點。可編程邏輯門陣列(FPGA)和通用圖形處理單元(GPGPU)由于各自的特點,經(jīng)常被用到N體模擬加速中。本學(xué)位論文主要圍繞加速MOND數(shù)值模擬展開,基于應(yīng)用的需求選擇了合適的TreePMN體模擬算法,剖析了算法的計算瓶頸,依據(jù)運算特點將計算任務(wù)分配給GPU、FPGA;接著利用包含CPU、GPU、FPGA的異構(gòu)加速平臺實現(xiàn)了對MOND數(shù)值模擬的加速。借助FPGA動態(tài)可重構(gòu)的功能,當(dāng)PM模塊空閑時,將其邏輯資源配置成Tree模塊,從而提高了資源利用率。實驗結(jié)果表明,動態(tài)可重構(gòu)功能的加入使得系統(tǒng)性能提升了 24%。本文的異構(gòu)平臺較傳統(tǒng)的高性能CPU服務(wù)器有更好的計算性能和更低的功耗。當(dāng)粒子數(shù)為3x106、網(wǎng)格大小為1283、Tree算法中計算的張角為0.5時,異構(gòu)平臺相比于CPU服務(wù)器的加速比為9.37,能耗比為24.42。本文最后探討將異構(gòu)加速平臺擴展至多個計算節(jié)點的方式,分析了設(shè)計的可擴展性。本論文主要研究工作包括:(1)基于MOND數(shù)值模擬的特點,對比研究了各種N體模擬算法,針對MOND數(shù)值模擬中數(shù)據(jù)模擬規(guī)模大、計算復(fù)雜度高、模擬時間長、具有強成團性的特點,選用了經(jīng)典的TreePM算法,并且對其進行更為深入的研究。首先,以CPU串行實現(xiàn)為基礎(chǔ),分析算法各部分的占用時間,剖析算法的性能瓶頸。針對Tree部分中耗時最多的建立樹型數(shù)據(jù)結(jié)構(gòu)、粒子相互作用勢能計算以及多維快速傅里葉變換計算部分在不同平臺上的加速,分析加速效果,比較優(yōu)劣。同時,分析TreePM算法的訪存模式,對Tree部分粒子進行預(yù)先排序,加速了粒子的勢能計算。(2)實現(xiàn)了基于TreePM算法的MOND數(shù)值模擬異構(gòu)加速。主要采用FPGA進行核心計算,利用FPGA動態(tài)可重構(gòu)的特點,為多維快速傅里葉變換計算和粒子間相互作用勢能計算合理分配邏輯資源。同時,由GPU完成樹型數(shù)據(jù)結(jié)構(gòu)建立這種具有較高并行度的遞歸算法。余下的任務(wù)調(diào)配、粒子位置和速度的更新、以及數(shù)據(jù)的輸入輸出等工作則交由CPU完成。該設(shè)計充分利用了各平臺的特點,提高了 TreePM算法實現(xiàn)的性能及功耗比,首次完成了 TreePM算法在FPGA、CPU和GPU異構(gòu)平臺上的加速,為N體模擬加速提供新的實現(xiàn)方案。(3)進一步地探討設(shè)計的合理性,提出上述算法實現(xiàn)的擴展方案。采用皮亞諾-希爾伯特曲線來劃分各節(jié)點Tree計算的區(qū)域范圍,并結(jié)合FPGA的動態(tài)可重構(gòu)的特性,更細(xì)粒度地分配資源,減小負(fù)載不均衡帶來的影響,實現(xiàn)良好的可擴展性。
[Abstract]:......
【學(xué)位授予單位】:中國科學(xué)技術(shù)大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2017
【分類號】:P159

【參考文獻】

相關(guān)期刊論文 前1條

1 馮瓏瓏;朱維善;;現(xiàn)代宇宙學(xué)中的數(shù)值模擬技術(shù)和應(yīng)用[J];中國科學(xué):物理學(xué) 力學(xué) 天文學(xué);2013年06期

相關(guān)博士學(xué)位論文 前1條

1 彭波;天文數(shù)據(jù)處理中硬件加速機制的關(guān)鍵技術(shù)研究[D];中國科學(xué)技術(shù)大學(xué);2016年

,

本文編號:2243374

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/shoufeilunwen/benkebiyelunwen/2243374.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶12667***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com