天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 信息工程論文 >

SAR成像的GPU并行計(jì)算技術(shù)研究

發(fā)布時(shí)間:2017-07-04 22:01

  本文關(guān)鍵詞:SAR成像的GPU并行計(jì)算技術(shù)研究


  更多相關(guān)文章: SAR成像 CUDA 多GPU 多節(jié)點(diǎn) RD CS和ωK算法


【摘要】:合成孔徑雷達(dá)(SAR)在軍事和民用領(lǐng)域具有很大的實(shí)用價(jià)值,但是SAR系統(tǒng)產(chǎn)生的數(shù)據(jù)量大,成像算法計(jì)算復(fù)雜,實(shí)際應(yīng)用對成像速度要求較高,而傳統(tǒng)的CPU集群處理方法效率較低,成本較高。GPU通用計(jì)算憑借其強(qiáng)勁的浮點(diǎn)計(jì)算性能和高速帶寬成為SAR系統(tǒng)高速成像處理的有效手段。目前基于GPU的SAR成像處理的研究還不夠深入,主要集中在單個(gè)GPU上的一些特定算法實(shí)現(xiàn)。本文主要開展了GPU集群上大規(guī)模SAR數(shù)據(jù)成像技術(shù)的系統(tǒng)架構(gòu)設(shè)計(jì)與實(shí)現(xiàn)的相關(guān)研究,具體工作包括以下幾個(gè)方面:第一,在深入分析頻域SAR成像算法并行特征的基礎(chǔ)上,結(jié)合GPU高性能計(jì)算平臺(tái)的特點(diǎn),設(shè)計(jì)了基于CPU+GPU異構(gòu)集群的主從模式的SAR成像處理框架?蚣馨ㄖ骺啬K和計(jì)算模塊,主控模塊負(fù)責(zé)主節(jié)點(diǎn)控制邏輯和任務(wù)分配,計(jì)算模塊負(fù)責(zé)計(jì)算節(jié)點(diǎn)控制邏輯和GPU處理邏輯。在該框架下,本文詳細(xì)設(shè)計(jì)了單節(jié)點(diǎn)多GPU實(shí)現(xiàn)方案和多節(jié)點(diǎn)多GPU實(shí)現(xiàn)方案。同時(shí)深入分析了條帶模式下的SAR原始回波數(shù)據(jù)特點(diǎn),在保證負(fù)載均衡的前提下設(shè)計(jì)了多節(jié)點(diǎn)多GPU環(huán)境下的SAR任務(wù)并行粒度選擇方案,包括節(jié)點(diǎn)間并行粒度選擇方案和節(jié)點(diǎn)內(nèi)并行粒度選擇方案。第二,在節(jié)點(diǎn)內(nèi)進(jìn)行GPU成像計(jì)算時(shí),利用CUDA共享存儲(chǔ)器和寄存器對成像算法的主要kernel函數(shù)進(jìn)行了優(yōu)化;針對數(shù)據(jù)分塊帶來的多次CPU和GPU之間數(shù)據(jù)拷貝問題,利用CUDA流和異步并行技術(shù)設(shè)計(jì)了拷貝時(shí)間隱藏方法。針對多節(jié)點(diǎn)之間SAR任務(wù)傳輸帶來的通信延遲問題,設(shè)計(jì)了多線程流水處理方法,隱藏了節(jié)點(diǎn)間SAR數(shù)據(jù)傳輸時(shí)間。第三,研究條帶模式下的頻域成像算法,選擇了典型的頻域算法RD、CS和ωK對方案進(jìn)行了驗(yàn)證,并分析三種算法在效果上的差異。實(shí)驗(yàn)結(jié)果表明,單節(jié)點(diǎn)多GPU方案相較于單GPU成像計(jì)算具有明顯的加速效果和較高的并行效率,多節(jié)點(diǎn)多GPU方案具有良好的擴(kuò)展性,并且方案滿足實(shí)時(shí)性。本文工作面向?qū)嶋H應(yīng)用,研究GPU環(huán)境下的高速成像方法,對SAR成像算法研究和SAR成像應(yīng)用具有較大的現(xiàn)實(shí)意義。
【關(guān)鍵詞】:SAR成像 CUDA 多GPU 多節(jié)點(diǎn) RD CS和ωK算法
【學(xué)位授予單位】:南京航空航天大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:TN957.52
【目錄】:
  • 摘要4-5
  • ABSTRACT5-12
  • 注釋表12-13
  • 縮略詞13-14
  • 第一章 緒論14-21
  • 1.1 研究背景及意義14-15
  • 1.2 國內(nèi)外研究現(xiàn)狀15-19
  • 1.2.1 SAR成像算法在單GPU上的研究現(xiàn)狀16-17
  • 1.2.2 SAR成像算法在單節(jié)點(diǎn)多GPU上的研究現(xiàn)狀17-18
  • 1.2.3 SAR成像算法在多節(jié)點(diǎn)上的研究現(xiàn)狀18-19
  • 1.3 主要研究內(nèi)容19
  • 1.4 論文組織結(jié)構(gòu)19-21
  • 第二章 SAR成像算法及GPU并行計(jì)算相關(guān)研究21-27
  • 2.1 SAR成像算法21-23
  • 2.1.1 SAR成像模型21
  • 2.1.2 SAR成像算法流程21-23
  • 2.2 GPU并行計(jì)算23-26
  • 2.2.1 CUDA編程模型24-25
  • 2.2.2 CUDA存儲(chǔ)器模型25-26
  • 2.3 本章小結(jié)26-27
  • 第三章 GPU高性能平臺(tái)下SAR成像總體框架設(shè)計(jì)27-36
  • 3.1 GPU高性能計(jì)算平臺(tái)總體設(shè)計(jì)27-30
  • 3.1.1 設(shè)計(jì)原則及目標(biāo)27-28
  • 3.1.2 總體框架設(shè)計(jì)28-30
  • 3.2 SAR成像并行粒度選擇方案30-32
  • 3.2.1 集群節(jié)點(diǎn)間并行粒度選擇30-32
  • 3.2.2 節(jié)點(diǎn)內(nèi)并行粒度選擇32
  • 3.3 具體設(shè)計(jì)及主要工作流程32-35
  • 3.3.1 主控模塊設(shè)計(jì)及工作流程33-34
  • 3.3.2 計(jì)算模塊設(shè)計(jì)及工作流程34-35
  • 3.4 本章小結(jié)35-36
  • 第四章 單節(jié)點(diǎn)多GPU的SAR成像算法設(shè)計(jì)與優(yōu)化36-51
  • 4.1 相關(guān)CUDA編程技巧36-38
  • 4.1.1 多GPU并行計(jì)算36
  • 4.1.2 CUDA異步并行技術(shù)與流技術(shù)36-37
  • 4.1.3 SAR轉(zhuǎn)置處理與CUDA內(nèi)存分段拷貝37-38
  • 4.2 存儲(chǔ)空間分配策略38-39
  • 4.2.1 內(nèi)存分配38
  • 4.2.2 顯存分配38-39
  • 4.3 SAR成像的多GPU處理算法設(shè)計(jì)39-41
  • 4.4 kernel函數(shù)的設(shè)計(jì)及優(yōu)化41-44
  • 4.4.1 kernel函數(shù)優(yōu)化方法41-42
  • 4.4.2 矩陣轉(zhuǎn)置kernel42-43
  • 4.4.3 FFTshift kernel43
  • 4.4.4 RCMC kernel43-44
  • 4.5 實(shí)驗(yàn)驗(yàn)證及結(jié)果分析44-50
  • 4.5.1 實(shí)驗(yàn)環(huán)境44
  • 4.5.2 成像效果分析44-45
  • 4.5.3 并行效果分析45-46
  • 4.5.4 執(zhí)行時(shí)間和加速比分析46-48
  • 4.5.5 并行效率分析48-49
  • 4.5.6 實(shí)時(shí)性分析49-50
  • 4.6 本章小結(jié)50-51
  • 第五章 多節(jié)點(diǎn)多GPU的SAR成像算法設(shè)計(jì)與實(shí)現(xiàn)51-63
  • 5.1 多CPU+多GPU協(xié)同計(jì)算方法51-52
  • 5.1.1 硬件平臺(tái)和軟件架構(gòu)51-52
  • 5.1.2 負(fù)載均衡設(shè)計(jì)52
  • 5.2 多節(jié)點(diǎn)多GPU的SAR成像方案52-56
  • 5.2.1 多節(jié)點(diǎn)控制邏輯53
  • 5.2.2 SAR任務(wù)分配方案53
  • 5.2.3 SAR數(shù)據(jù)調(diào)度方法53-55
  • 5.2.4 批量SAR任務(wù)優(yōu)化設(shè)計(jì)55-56
  • 5.3 實(shí)驗(yàn)驗(yàn)證及結(jié)果分析56-62
  • 5.3.1 實(shí)驗(yàn)環(huán)境56
  • 5.3.2 多節(jié)點(diǎn)執(zhí)行時(shí)間測試56-58
  • 5.3.3 網(wǎng)絡(luò)通信影響測試58-60
  • 5.3.4 可擴(kuò)展性測試60-62
  • 5.3.5 并行架構(gòu)綜合分析62
  • 5.4 本章小結(jié)62-63
  • 第六章 總結(jié)與展望63-65
  • 6.1 研究工作總結(jié)63-64
  • 6.2 下一步工作展望64-65
  • 參考文獻(xiàn)65-69
  • 致謝69-70
  • 在學(xué)期間的研究成果及發(fā)表的學(xué)術(shù)論文70

【相似文獻(xiàn)】

中國期刊全文數(shù)據(jù)庫 前10條

1 馬伯寧;王晨昊;湯曉安;匡綱要;;基于GPU的二維離散小波變換快速計(jì)算[J];國防科技大學(xué)學(xué)報(bào);2011年03期

2 ZW;;3D游戲利器 主流嵌入式處理器GPU逐個(gè)看[J];電腦迷;2011年19期

3 王志國;王貴錦;施陳博;苗權(quán);林行剛;;積分圖像的快速GPU計(jì)算[J];計(jì)算機(jī)應(yīng)用研究;2011年10期

4 盧永菁;王東;;基于GPU的高速網(wǎng)絡(luò)入侵檢測系統(tǒng)設(shè)計(jì)[J];計(jì)算機(jī)工程與應(yīng)用;2011年33期

5 儲(chǔ)t熆,

本文編號(hào):519432


資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/xinxigongchenglunwen/519432.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶042db***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請E-mail郵箱bigeng88@qq.com