天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 物理論文 >

基于異構(gòu)計(jì)算的三維FDTD并行算法及其在電磁仿真中的應(yīng)用

發(fā)布時(shí)間:2019-11-10 17:41
【摘要】:時(shí)域有限差分(FDTD)法是求解電磁學(xué)中麥克斯韋方程組的重要方法之一,一直以來(lái)獲得了廣泛的使用,但是應(yīng)用于電大尺寸目標(biāo)仿真時(shí)存在巨大的耗時(shí)問(wèn)題。為解決這一問(wèn)題,利用圖形處理器(GPU)的并行處理特性,結(jié)合計(jì)算統(tǒng)一設(shè)備架構(gòu)(CUDA),以低通濾波器為算例,實(shí)現(xiàn)了時(shí)域卷積理想匹配層(CPML)吸收邊界的三維FDTD高性能加速計(jì)算,目標(biāo)網(wǎng)格數(shù)達(dá)5百萬(wàn)。實(shí)驗(yàn)在Fermi架構(gòu)的Quadro 4000和Tesla M2050兩款GPU上實(shí)測(cè),誤差均在10~(-4)范圍內(nèi),相對(duì)于同時(shí)期的CPU分別可獲得36和55倍以上的加速,結(jié)果表明該方法具有精度高、效率高、通用性和實(shí)用性強(qiáng)等特點(diǎn)。
【圖文】:

網(wǎng)格圖,網(wǎng)格,共享內(nèi)存,線程


Yee網(wǎng)格在三維空間中與其他六個(gè)網(wǎng)格相鄰,如圖1所示。位于棱邊的電場(chǎng)值由四個(gè)Yee網(wǎng)格共享,位于網(wǎng)格面中心的磁場(chǎng)值由兩個(gè)Yee網(wǎng)格共享。Figure1YeegridoftheFDTDalgorithm圖1FDTD算法的Yee網(wǎng)格CUDA編程模型的grid善于處理二維數(shù)據(jù),而需要求解的電磁目標(biāo)為三維結(jié)構(gòu)。本文采用了最直接的切片方法(SlicingMethod)將三維空間映射到二維,并以點(diǎn)構(gòu)成面,以面構(gòu)成體的方式來(lái)實(shí)現(xiàn)三維結(jié)構(gòu)的仿真。如圖2所示,線程與三維空間中的Yee單元在位置上一一對(duì)應(yīng),x對(duì)應(yīng)實(shí)際空間中的j,y對(duì)應(yīng)k,并在jk平面遞增。線程所計(jì)算的點(diǎn)在同一個(gè)平面,相鄰的多個(gè)平面就組成了三維物理空間,便于完成三維電磁場(chǎng)仿真。Figure2CorrespondingrelationbetweenYeegridsandCUDAthreads圖2Yee網(wǎng)格與CUDA線程的對(duì)應(yīng)關(guān)系為了提高全局存儲(chǔ)器的訪存效率,本文對(duì)切片每一層都用CudaMallocPitch函數(shù)分配冗余存儲(chǔ)空間。Fermi計(jì)算架構(gòu)64KB的片上存儲(chǔ)器可以配置成48KB的共享內(nèi)存和16KB的L1Cache,也可以配置成16KB的共享內(nèi)存和48KB的L1Cache。由于共享內(nèi)存需要顯式的代碼實(shí)現(xiàn),因此,本文采用低代價(jià)的L1Cache來(lái)提高數(shù)據(jù)訪問(wèn)命中率。之前的嘗試也證實(shí)了采用共享內(nèi)存相對(duì)于采用L1Cache并沒(méi)有提升算法性能。3.2FDTD算法實(shí)現(xiàn)流程圖對(duì)于整個(gè)算法流程,計(jì)算機(jī)采用異構(gòu)架構(gòu),GPU以協(xié)處理器的方式與CPU協(xié)同工作,程

流程圖,線程,對(duì)應(yīng)關(guān)系,網(wǎng)格


維結(jié)構(gòu)。本文采用了最直接的切片方法(SlicingMethod)將三維空間映射到二維,并以點(diǎn)構(gòu)成面,以面構(gòu)成體的方式來(lái)實(shí)現(xiàn)三維結(jié)構(gòu)的仿真。如圖2所示,線程與三維空間中的Yee單元在位置上一一對(duì)應(yīng),x對(duì)應(yīng)實(shí)際空間中的j,y對(duì)應(yīng)k,并在jk平面遞增。線程所計(jì)算的點(diǎn)在同一個(gè)平面,相鄰的多個(gè)平面就組成了三維物理空間,便于完成三維電磁場(chǎng)仿真。Figure2CorrespondingrelationbetweenYeegridsandCUDAthreads圖2Yee網(wǎng)格與CUDA線程的對(duì)應(yīng)關(guān)系為了提高全局存儲(chǔ)器的訪存效率,本文對(duì)切片每一層都用CudaMallocPitch函數(shù)分配冗余存儲(chǔ)空間。Fermi計(jì)算架構(gòu)64KB的片上存儲(chǔ)器可以配置成48KB的共享內(nèi)存和16KB的L1Cache,也可以配置成16KB的共享內(nèi)存和48KB的L1Cache。由于共享內(nèi)存需要顯式的代碼實(shí)現(xiàn),因此,本文采用低代價(jià)的L1Cache來(lái)提高數(shù)據(jù)訪問(wèn)命中率。之前的嘗試也證實(shí)了采用共享內(nèi)存相對(duì)于采用L1Cache并沒(méi)有提升算法性能。3.2FDTD算法實(shí)現(xiàn)流程圖對(duì)于整個(gè)算法流程,計(jì)算機(jī)采用異構(gòu)架構(gòu),GPU以協(xié)處理器的方式與CPU協(xié)同工作,程序的流程圖如圖3所示。主機(jī)端主要負(fù)責(zé)物理目標(biāo)以及集總參數(shù)電路建模、模型媒質(zhì)參量初始化、內(nèi)存分配、媒質(zhì)網(wǎng)格剖分、場(chǎng)量和更新系數(shù)初始化,,將內(nèi)存中計(jì)算所用的三維電磁場(chǎng)數(shù)據(jù)變量等傳遞到顯存,激活內(nèi)核進(jìn)行電磁場(chǎng)加速仿真,并維持電磁場(chǎng)在時(shí)間上的推進(jìn)。設(shè)備端執(zhí)行核函數(shù),更新場(chǎng)域,完成全局場(chǎng)域以及CPML區(qū)域的場(chǎng)值計(jì)算。由2

【相似文獻(xiàn)】

相關(guān)期刊論文 前5條

1 許楨;;關(guān)于CPU+GPU異構(gòu)計(jì)算的研究與分析[J];科技信息;2010年17期

2 金滔,徐煒民;網(wǎng)絡(luò)并行方式的PVM異構(gòu)計(jì)算環(huán)境[J];上海大學(xué)學(xué)報(bào)(自然科學(xué)版);1996年02期

3 曾國(guó)蓀,周定康,黃明和;異構(gòu)計(jì)算開(kāi)發(fā)最大循環(huán)并行性(英文)[J];江西師范大學(xué)學(xué)報(bào)(自然科學(xué)版);2000年04期

4 魚(yú)濱,華慶一;基于CORBA的分布式異構(gòu)計(jì)算環(huán)境的分析與實(shí)踐[J];西北大學(xué)學(xué)報(bào)(自然科學(xué)版);2000年02期

5 ;[J];;年期

相關(guān)會(huì)議論文 前2條

1 陳虎;陳思桐;李觀釗;羅偉良;甄真;張林亞;干蕓蕓;賴(lài)路雙;奚建清;;異構(gòu)計(jì)算平臺(tái)上列存儲(chǔ)數(shù)據(jù)庫(kù)的并行查詢(xún)技術(shù)研究[A];第29屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(B輯)(NDBC2012)[C];2012年

2 林新華;顧一眾;;上海交通大學(xué)高性能計(jì)算建設(shè)理念與實(shí)踐[A];中國(guó)高等教育學(xué)會(huì)教育信息化分會(huì)第十二次學(xué)術(shù)年會(huì)論文集[C];2014年

相關(guān)重要報(bào)紙文章 前9條

1 本報(bào)記者 霍光;走出異構(gòu)計(jì)算的認(rèn)識(shí)誤區(qū)[N];中國(guó)計(jì)算機(jī)報(bào);2009年

2 本報(bào)記者 霍光;異構(gòu)計(jì)算兩大引擎再次加速[N];中國(guó)計(jì)算機(jī)報(bào);2009年

3 ;計(jì)算:從工作到生活[N];中國(guó)計(jì)算機(jī)報(bào);2010年

4 姑蘇飄雪;異構(gòu)計(jì)算,PC效率的提升之道[N];電腦報(bào);2012年

5 本報(bào)記者 李萬(wàn)予;Altera披露新異構(gòu)計(jì)算核心[N];中國(guó)計(jì)算機(jī)報(bào);2013年

6 本報(bào)記者 王星;異構(gòu)計(jì)算引領(lǐng)軟件開(kāi)發(fā)創(chuàng)新[N];電腦報(bào);2012年

7 本報(bào)記者 霍光;計(jì)算未來(lái)[N];中國(guó)計(jì)算機(jī)報(bào);2012年

8 ;“芯”融聚 謀未來(lái)[N];中國(guó)電腦教育報(bào);2011年

9 李映;MIPS能否從“芯”再出發(fā)[N];中國(guó)電子報(bào);2012年

相關(guān)博士學(xué)位論文 前1條

1 張丹;面向異構(gòu)體系結(jié)構(gòu)的任務(wù)流化技術(shù)研究[D];解放軍信息工程大學(xué);2012年

相關(guān)碩士學(xué)位論文 前10條

1 范興山;基于異構(gòu)計(jì)算的矩陣廣義逆算法研究及實(shí)現(xiàn)[D];電子科技大學(xué);2014年

2 蒲宇亮;基于異構(gòu)計(jì)算系統(tǒng)的圖像信息提取關(guān)鍵算法研究與實(shí)現(xiàn)[D];電子科技大學(xué);2016年

3 彭玉炳;基于異構(gòu)計(jì)算的CNN并行框架的設(shè)計(jì)與實(shí)現(xiàn)[D];電子科技大學(xué);2016年

4 紀(jì)劍雄;基于異構(gòu)計(jì)算系統(tǒng)中動(dòng)態(tài)任務(wù)分配的蜂群算法研究[D];華東師范大學(xué);2008年

5 周斯波;異構(gòu)計(jì)算環(huán)境下的地圖代數(shù)空間分析并行方法研究[D];中國(guó)地質(zhì)大學(xué);2013年

6 朱偉;異構(gòu)計(jì)算環(huán)境下高性能網(wǎng)絡(luò)模擬任務(wù)劃分[D];江南大學(xué);2014年

7 張勝輝;基于FPGA加速的異構(gòu)計(jì)算多結(jié)點(diǎn)系統(tǒng)實(shí)時(shí)硬件任務(wù)調(diào)度與管理[D];華東交通大學(xué);2013年

8 何東陽(yáng);適用異構(gòu)計(jì)算環(huán)境中監(jiān)控軟件系統(tǒng)的研究與實(shí)踐[D];東華大學(xué);2012年

9 周子航;基于OpenCL異構(gòu)計(jì)算的數(shù)學(xué)圖像繪制[D];廣州大學(xué);2013年

10 江文;異構(gòu)計(jì)算環(huán)境下任務(wù)調(diào)度算法的研究[D];湖南大學(xué);2010年



本文編號(hào):2558968

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/wulilw/2558968.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶e8772***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com