天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

EFG法及其拓?fù)鋬?yōu)化的GPU并行計(jì)算研究

發(fā)布時(shí)間:2017-09-29 20:33

  本文關(guān)鍵詞:EFG法及其拓?fù)鋬?yōu)化的GPU并行計(jì)算研究


  更多相關(guān)文章: EFG法 拓?fù)鋬?yōu)化 GPU CUDA 并行加速 PCG法 交叉節(jié)點(diǎn)對(duì)


【摘要】:EFG(Element-Free Galerkin)法不僅擺脫了網(wǎng)格的束縛,而且具有計(jì)算穩(wěn)定性好、收斂速度快以及精度高等優(yōu)點(diǎn),另EFG法拓?fù)鋬?yōu)化可有效解決有限元法拓?fù)鋬?yōu)化中出現(xiàn)的重構(gòu)網(wǎng)格等問(wèn)題,并可有效消除棋盤(pán)格現(xiàn)象,所以EFG法及其拓?fù)鋬?yōu)化吸引了越來(lái)越多學(xué)者們的關(guān)注。不過(guò)由于EFG法具有計(jì)算效率低的缺點(diǎn),嚴(yán)重束縛了它們?cè)诖笠?guī)模問(wèn)題中的研究及應(yīng)用。與此同時(shí),隨著GPU(Graphic Processing Unit)并行計(jì)算的迅速發(fā)展,其現(xiàn)已被廣泛應(yīng)用于眾多領(lǐng)域。因此,本文針對(duì)EFG法計(jì)算效率低和耗時(shí)長(zhǎng)等缺點(diǎn),開(kāi)展EFG法及其拓?fù)鋬?yōu)化的GPU并行計(jì)算研究,主要內(nèi)容有:(1)三維EFG結(jié)構(gòu)分析方法的研究及應(yīng)用。引入三角形單元(2D)或四面體單元(3D)代替EFG法傳統(tǒng)算法中的四邊形單元(2D)或六面體單元(3D)作為背景積分網(wǎng)格,并采用Hammer積分取代傳統(tǒng)算法中的Gauss積分實(shí)現(xiàn)EFG中的積分計(jì)算,推導(dǎo)出相關(guān)公式且通過(guò)數(shù)值算例驗(yàn)證了該方案的可行性。(2)EFG法的GPU并行計(jì)算研究。首先基于交叉節(jié)點(diǎn)對(duì)思想,提出了一種總體剛度矩陣、總體懲罰剛度矩陣和預(yù)處理矩陣的聯(lián)合組裝方案及其GPU并行算法;其次提出了一種耦合GPU和PCG(Preconditioned Conjugate Gradient)法的EFG法加速算法,并給出了該加速算法的相關(guān)公式推導(dǎo)過(guò)程及流程圖;而后通過(guò)數(shù)值算例,研究了PCG法求解EFG法總體離散控制方程的收斂速度及計(jì)算耗時(shí),并探討了求解域離散節(jié)點(diǎn)數(shù)及GPU線(xiàn)程塊大小對(duì)加速比的影響。(3)EFG法拓?fù)鋬?yōu)化的GPU并行計(jì)算研究。首先基于交叉節(jié)點(diǎn)對(duì)思想,提出了一種目標(biāo)函數(shù)靈敏度的并行算法,并結(jié)合CUDA架構(gòu)(Compute Unified Device Architecture)設(shè)計(jì)了目標(biāo)函數(shù)靈敏度和OC(Optimization Criterion)法的GPU并行算法;然后提出了一種EFG法拓?fù)鋬?yōu)化的GPU并行算法并給出了該算法流程圖。通過(guò)數(shù)值算例驗(yàn)證了上述算法的可行性及有效性,獲得了24倍的加速比,且探討了設(shè)計(jì)域離散節(jié)點(diǎn)數(shù)對(duì)加速比及優(yōu)化結(jié)果的影響。本文利用GPU并行計(jì)算顯著縮短了EFG法及其拓?fù)鋬?yōu)化的計(jì)算時(shí)間,提高了其計(jì)算效率,該研究對(duì)EFG法及其拓?fù)鋬?yōu)化應(yīng)用于工程問(wèn)題具有重要的理論參考價(jià)值和工程實(shí)際意義。
【關(guān)鍵詞】:EFG法 拓?fù)鋬?yōu)化 GPU CUDA 并行加速 PCG法 交叉節(jié)點(diǎn)對(duì)
【學(xué)位授予單位】:湘潭大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類(lèi)號(hào)】:TP338.6
【目錄】:
  • 摘要4-5
  • Abstract5-9
  • 主要符號(hào)對(duì)照表9-10
  • 第1章 緒論10-17
  • 1.1 研究背景及意義10-11
  • 1.2 GPU并行計(jì)算研究現(xiàn)狀11-12
  • 1.3 EFG法及其拓?fù)鋬?yōu)化研究現(xiàn)狀12-15
  • 1.4 主要研究?jī)?nèi)容15-17
  • 第2章 EFG法算法改進(jìn)及CUDA架構(gòu)17-29
  • 2.1 EFG法17-18
  • 2.2 算法改進(jìn)18-24
  • 2.2.0 積分方案18-20
  • 2.2.1 節(jié)點(diǎn)影響域計(jì)算20-21
  • 2.2.2 局部搜索格子法21-23
  • 2.2.3 稀疏矩陣的壓縮存儲(chǔ)23-24
  • 2.3 CUDA架構(gòu)24-28
  • 2.3.1 編程模型24-25
  • 2.3.2 線(xiàn)程結(jié)構(gòu)25-26
  • 2.3.3 存儲(chǔ)器模型26-27
  • 2.3.4 程序優(yōu)化27-28
  • 2.4 本章小結(jié)28-29
  • 第3章 EFG法的GPU并行計(jì)算研究29-46
  • 3.1 系數(shù)矩陣組裝29-32
  • 3.1.1 逐節(jié)點(diǎn)對(duì)法29-31
  • 3.1.2 總體懲罰剛度矩陣31-32
  • 3.1.3 系數(shù)矩陣的GPU并行組裝32
  • 3.2 總體離散系統(tǒng)方程求解32-37
  • 3.2.1 CG法33-34
  • 3.2.2 PCG法34-37
  • 3.3 計(jì)算流程37
  • 3.4 數(shù)值算例37-42
  • 3.5 PCG法求解EFG法42-43
  • 3.6 加速比及其影響因素43-44
  • 3.7 本章小結(jié)44-46
  • 第4章 EFG法拓?fù)鋬?yōu)化的GPU并行計(jì)算研究46-63
  • 4.1 EFG法拓?fù)鋬?yōu)化46-50
  • 4.1.1 數(shù)學(xué)模型46-47
  • 4.1.2 0C準(zhǔn)則47-49
  • 4.1.3 靈敏度分析49-50
  • 4.2 目標(biāo)函數(shù)靈敏度的并行算法50-54
  • 4.2.1 算法改進(jìn)50-52
  • 4.2.2 GPU并行算法52-54
  • 4.3 OC法的GPU并行算法54-55
  • 4.4 并行流程55-56
  • 4.5 數(shù)值算例56-59
  • 4.6 節(jié)點(diǎn)數(shù)對(duì)加速比的影響59
  • 4.7 節(jié)點(diǎn)數(shù)對(duì)優(yōu)化結(jié)果的影響59-61
  • 4.8 本章小結(jié)61-63
  • 總結(jié)與展望63-65
  • 參考文獻(xiàn)65-71
  • 致謝71-72
  • 附錄(攻讀碩士學(xué)位期間已發(fā)表論文及參與項(xiàng)目)72

【參考文獻(xiàn)】

中國(guó)期刊全文數(shù)據(jù)庫(kù) 前1條

1 蔡新;李洪煊;武穎利;朱杰;;工程結(jié)構(gòu)優(yōu)化設(shè)計(jì)研究進(jìn)展[J];河海大學(xué)學(xué)報(bào)(自然科學(xué)版);2011年03期

,

本文編號(hào):944119

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/jisuanjikexuelunwen/944119.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶(hù)b54a1***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com