天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 理工論文 > 氣象學(xué)論文 >

閃電數(shù)值模式GPU并行化計(jì)算及其初步應(yīng)用

發(fā)布時(shí)間:2021-11-13 07:09
  閃電數(shù)值模式中的空間電場計(jì)算部分一直是模式中最為耗時(shí)的部分,迭代法求解空間電位無法同時(shí)滿足高空間分辨率與高計(jì)算精度,造成模擬結(jié)果與實(shí)際有所誤差。受計(jì)算時(shí)間的限制,全空間模擬域下的三維閃電模擬程序空間分辨率一直得不到提升,為了提升閃電數(shù)值模式的可靠性,本文基于已有的閃電數(shù)值模擬程序,通過修改其電場計(jì)算部分的迭代算法,去除迭代過程中數(shù)據(jù)依賴性并使用CUDA架構(gòu),將電場計(jì)算部分移植到GPU并行計(jì)算平臺中,使用CPU+GPU協(xié)同計(jì)算,提升了計(jì)算效率。此外,在優(yōu)化后的閃電數(shù)值模擬程序基礎(chǔ)上,建立固定的經(jīng)典電荷經(jīng)典電荷結(jié)構(gòu)進(jìn)行敏感性實(shí)驗(yàn),討論云中電荷結(jié)構(gòu)(主要是離地最近電荷層)與自持型上行閃電傳播特征與空間電荷分布之間的關(guān)系。主要研究成果如下:(1)在已有閃電數(shù)值模式基礎(chǔ)上,采用CUDA架構(gòu),同時(shí)對其電場計(jì)算中迭代算法去除數(shù)據(jù)依賴性,使用PGI編譯器重新構(gòu)寫編譯,使其計(jì)算方法得以在GPU中并行化計(jì)算,大大提升了閃電數(shù)值模擬程序的精確性與速度。此外,通過對比不同空間分辨率不同迭代精度下的算法的計(jì)算速度,發(fā)現(xiàn)同樣迭代精度下,空間分辨率越高,GPU并行化計(jì)算的加速比越高,同等空間分辨率情況下,不同迭代精... 

【文章來源】:南京信息工程大學(xué)江蘇省

【文章頁數(shù)】:50 頁

【學(xué)位級別】:碩士

【部分圖文】:

閃電數(shù)值模式GPU并行化計(jì)算及其初步應(yīng)用


建筑物高度與上行地閃啟動(dòng)時(shí)環(huán)境電場之間的關(guān)系圖

示意圖,離散空間,示意圖,迭代


南京信息工程大學(xué)碩士學(xué)位論文12圖2.2離散空間示意圖圖2.2中h是模擬域的空間分辨率,空間分辨率越高,電位分布計(jì)算越精確,模擬出的閃電通道形態(tài)與觀測越為相近,模擬結(jié)果可靠性更高,因此空間分辨率高低是衡量閃電數(shù)值模式好壞的一個(gè)重要標(biāo)準(zhǔn)。離散化后的泊松方程方程如下:(2φx2)i,j=φi,j12φi,j+φi,j1h2(2φy2)i,j=φi+1,j2φi,j+φi+1,jh2(2.5)綜合為:φ(i,j)=14(φ(i+1,j)+φ(i,j1)+φ(i+1,j)+φ(i,j1)+h2f)(2.6)其中f代表源項(xiàng),在靜電場泊松方程中指的是-p/ε,h代表空間分辨率。離散空間中每一個(gè)點(diǎn)都近似滿足這個(gè)公式,當(dāng)空間網(wǎng)格點(diǎn)過大時(shí),直接求解算法復(fù)雜,適合采用迭代法求解,常見的方法有超松弛迭代和雅克比迭代。一般情況選取合適的松弛因子,超松弛迭代算發(fā)法比雅可比迭代要快。本文考慮到之后采用GPU并行計(jì)算,而超松弛迭代過程中數(shù)據(jù)依賴性較大,無法進(jìn)行并行計(jì)算。而雅克比迭代也是一種常見的迭代求解大型線性方程的算法,本身具有較好的并行性,因此采用雅克比迭代進(jìn)行計(jì)算,迭代公式如下。φ(i,j)k+1=14(φk(i+1,j)+φk(i,j1)+φk(i+1,j)+φk(i,j1)+h2f)(2.7)其中k是指迭代次數(shù),在每一次迭代中,一點(diǎn)更新后數(shù)值由四周四點(diǎn)的數(shù)值計(jì)算而成,每一次迭代后數(shù)值越趨近于正確值。使用迭代誤差衡量更新后的數(shù)值的精確度,誤差計(jì)算公式如下:Error=(+1)(+1)(2.8)

示意圖,內(nèi)存,架構(gòu),示意圖


第三章閃電數(shù)值模擬并行化15Enddo!$endkernel!$kernellooppresent(u1,u2)collapse(2)Doi=1,mDoj=1,nu2(i,j)=(u1(i-1,j)+u1(i+1,j)+u1(i,j+1)+u1(i,j-1)+h2f(i,j))/4EnddoEnddo!$endkernel3.2.2CPU與GPU數(shù)據(jù)通信優(yōu)化閃電數(shù)值模擬程序中除了電場計(jì)算的主體計(jì)算部分外,還存在大量的邏輯判斷跳出循環(huán)等語句,這些語句GPU運(yùn)行速度過慢,因此閃電數(shù)值模式程序的主體部分仍是放于CPU中進(jìn)行串行執(zhí)行,整個(gè)閃電數(shù)值模式程序采用是GPU+CPU協(xié)同運(yùn)行在計(jì)算模塊中將數(shù)據(jù)置入GPU中進(jìn)行并行計(jì)算。CPU中數(shù)據(jù)執(zhí)行是通過主機(jī)中內(nèi)存進(jìn)行存放數(shù)據(jù)數(shù)組,而GPU中數(shù)據(jù)的計(jì)算是則將數(shù)組存放于GPU顯存當(dāng)中,二者存放位置不同,具體數(shù)據(jù)分布傳輸如下圖:圖3.1CPU與GPU內(nèi)存分布架構(gòu)示意圖如圖3.1所示,CPU中數(shù)據(jù)存放于主機(jī)中的內(nèi)存設(shè)備,而GPU數(shù)據(jù)則存放于GPU中的顯存,兩者之間通過PCI接口進(jìn)行數(shù)據(jù)通信傳輸[74-76]。一個(gè)三維高精度閃電的模擬域的空間電位分布數(shù)值大小通常高達(dá)1GB(4000*5000格點(diǎn)數(shù)下),在閃電向上發(fā)展的每一步時(shí),計(jì)算機(jī)都需將主機(jī)中通道分布數(shù)組傳遞至GPU中作為泊松方程邊界條件進(jìn)行并行計(jì)算,在重解了空間電位之后,位于GPU中的


本文編號:3492572

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/projectlw/qxxlw/3492572.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶a2cf2***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請E-mail郵箱bigeng88@qq.com