SAR成像的GPU并行計(jì)算技術(shù)研究
發(fā)布時(shí)間:2017-07-04 22:01
本文關(guān)鍵詞:SAR成像的GPU并行計(jì)算技術(shù)研究
更多相關(guān)文章: SAR成像 CUDA 多GPU 多節(jié)點(diǎn) RD CS和ωK算法
【摘要】:合成孔徑雷達(dá)(SAR)在軍事和民用領(lǐng)域具有很大的實(shí)用價(jià)值,但是SAR系統(tǒng)產(chǎn)生的數(shù)據(jù)量大,成像算法計(jì)算復(fù)雜,實(shí)際應(yīng)用對成像速度要求較高,而傳統(tǒng)的CPU集群處理方法效率較低,成本較高。GPU通用計(jì)算憑借其強(qiáng)勁的浮點(diǎn)計(jì)算性能和高速帶寬成為SAR系統(tǒng)高速成像處理的有效手段。目前基于GPU的SAR成像處理的研究還不夠深入,主要集中在單個(gè)GPU上的一些特定算法實(shí)現(xiàn)。本文主要開展了GPU集群上大規(guī)模SAR數(shù)據(jù)成像技術(shù)的系統(tǒng)架構(gòu)設(shè)計(jì)與實(shí)現(xiàn)的相關(guān)研究,具體工作包括以下幾個(gè)方面:第一,在深入分析頻域SAR成像算法并行特征的基礎(chǔ)上,結(jié)合GPU高性能計(jì)算平臺(tái)的特點(diǎn),設(shè)計(jì)了基于CPU+GPU異構(gòu)集群的主從模式的SAR成像處理框架?蚣馨ㄖ骺啬K和計(jì)算模塊,主控模塊負(fù)責(zé)主節(jié)點(diǎn)控制邏輯和任務(wù)分配,計(jì)算模塊負(fù)責(zé)計(jì)算節(jié)點(diǎn)控制邏輯和GPU處理邏輯。在該框架下,本文詳細(xì)設(shè)計(jì)了單節(jié)點(diǎn)多GPU實(shí)現(xiàn)方案和多節(jié)點(diǎn)多GPU實(shí)現(xiàn)方案。同時(shí)深入分析了條帶模式下的SAR原始回波數(shù)據(jù)特點(diǎn),在保證負(fù)載均衡的前提下設(shè)計(jì)了多節(jié)點(diǎn)多GPU環(huán)境下的SAR任務(wù)并行粒度選擇方案,包括節(jié)點(diǎn)間并行粒度選擇方案和節(jié)點(diǎn)內(nèi)并行粒度選擇方案。第二,在節(jié)點(diǎn)內(nèi)進(jìn)行GPU成像計(jì)算時(shí),利用CUDA共享存儲(chǔ)器和寄存器對成像算法的主要kernel函數(shù)進(jìn)行了優(yōu)化;針對數(shù)據(jù)分塊帶來的多次CPU和GPU之間數(shù)據(jù)拷貝問題,利用CUDA流和異步并行技術(shù)設(shè)計(jì)了拷貝時(shí)間隱藏方法。針對多節(jié)點(diǎn)之間SAR任務(wù)傳輸帶來的通信延遲問題,設(shè)計(jì)了多線程流水處理方法,隱藏了節(jié)點(diǎn)間SAR數(shù)據(jù)傳輸時(shí)間。第三,研究條帶模式下的頻域成像算法,選擇了典型的頻域算法RD、CS和ωK對方案進(jìn)行了驗(yàn)證,并分析三種算法在效果上的差異。實(shí)驗(yàn)結(jié)果表明,單節(jié)點(diǎn)多GPU方案相較于單GPU成像計(jì)算具有明顯的加速效果和較高的并行效率,多節(jié)點(diǎn)多GPU方案具有良好的擴(kuò)展性,并且方案滿足實(shí)時(shí)性。本文工作面向?qū)嶋H應(yīng)用,研究GPU環(huán)境下的高速成像方法,對SAR成像算法研究和SAR成像應(yīng)用具有較大的現(xiàn)實(shí)意義。
【關(guān)鍵詞】:SAR成像 CUDA 多GPU 多節(jié)點(diǎn) RD CS和ωK算法
【學(xué)位授予單位】:南京航空航天大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:TN957.52
【目錄】:
- 摘要4-5
- ABSTRACT5-12
- 注釋表12-13
- 縮略詞13-14
- 第一章 緒論14-21
- 1.1 研究背景及意義14-15
- 1.2 國內(nèi)外研究現(xiàn)狀15-19
- 1.2.1 SAR成像算法在單GPU上的研究現(xiàn)狀16-17
- 1.2.2 SAR成像算法在單節(jié)點(diǎn)多GPU上的研究現(xiàn)狀17-18
- 1.2.3 SAR成像算法在多節(jié)點(diǎn)上的研究現(xiàn)狀18-19
- 1.3 主要研究內(nèi)容19
- 1.4 論文組織結(jié)構(gòu)19-21
- 第二章 SAR成像算法及GPU并行計(jì)算相關(guān)研究21-27
- 2.1 SAR成像算法21-23
- 2.1.1 SAR成像模型21
- 2.1.2 SAR成像算法流程21-23
- 2.2 GPU并行計(jì)算23-26
- 2.2.1 CUDA編程模型24-25
- 2.2.2 CUDA存儲(chǔ)器模型25-26
- 2.3 本章小結(jié)26-27
- 第三章 GPU高性能平臺(tái)下SAR成像總體框架設(shè)計(jì)27-36
- 3.1 GPU高性能計(jì)算平臺(tái)總體設(shè)計(jì)27-30
- 3.1.1 設(shè)計(jì)原則及目標(biāo)27-28
- 3.1.2 總體框架設(shè)計(jì)28-30
- 3.2 SAR成像并行粒度選擇方案30-32
- 3.2.1 集群節(jié)點(diǎn)間并行粒度選擇30-32
- 3.2.2 節(jié)點(diǎn)內(nèi)并行粒度選擇32
- 3.3 具體設(shè)計(jì)及主要工作流程32-35
- 3.3.1 主控模塊設(shè)計(jì)及工作流程33-34
- 3.3.2 計(jì)算模塊設(shè)計(jì)及工作流程34-35
- 3.4 本章小結(jié)35-36
- 第四章 單節(jié)點(diǎn)多GPU的SAR成像算法設(shè)計(jì)與優(yōu)化36-51
- 4.1 相關(guān)CUDA編程技巧36-38
- 4.1.1 多GPU并行計(jì)算36
- 4.1.2 CUDA異步并行技術(shù)與流技術(shù)36-37
- 4.1.3 SAR轉(zhuǎn)置處理與CUDA內(nèi)存分段拷貝37-38
- 4.2 存儲(chǔ)空間分配策略38-39
- 4.2.1 內(nèi)存分配38
- 4.2.2 顯存分配38-39
- 4.3 SAR成像的多GPU處理算法設(shè)計(jì)39-41
- 4.4 kernel函數(shù)的設(shè)計(jì)及優(yōu)化41-44
- 4.4.1 kernel函數(shù)優(yōu)化方法41-42
- 4.4.2 矩陣轉(zhuǎn)置kernel42-43
- 4.4.3 FFTshift kernel43
- 4.4.4 RCMC kernel43-44
- 4.5 實(shí)驗(yàn)驗(yàn)證及結(jié)果分析44-50
- 4.5.1 實(shí)驗(yàn)環(huán)境44
- 4.5.2 成像效果分析44-45
- 4.5.3 并行效果分析45-46
- 4.5.4 執(zhí)行時(shí)間和加速比分析46-48
- 4.5.5 并行效率分析48-49
- 4.5.6 實(shí)時(shí)性分析49-50
- 4.6 本章小結(jié)50-51
- 第五章 多節(jié)點(diǎn)多GPU的SAR成像算法設(shè)計(jì)與實(shí)現(xiàn)51-63
- 5.1 多CPU+多GPU協(xié)同計(jì)算方法51-52
- 5.1.1 硬件平臺(tái)和軟件架構(gòu)51-52
- 5.1.2 負(fù)載均衡設(shè)計(jì)52
- 5.2 多節(jié)點(diǎn)多GPU的SAR成像方案52-56
- 5.2.1 多節(jié)點(diǎn)控制邏輯53
- 5.2.2 SAR任務(wù)分配方案53
- 5.2.3 SAR數(shù)據(jù)調(diào)度方法53-55
- 5.2.4 批量SAR任務(wù)優(yōu)化設(shè)計(jì)55-56
- 5.3 實(shí)驗(yàn)驗(yàn)證及結(jié)果分析56-62
- 5.3.1 實(shí)驗(yàn)環(huán)境56
- 5.3.2 多節(jié)點(diǎn)執(zhí)行時(shí)間測試56-58
- 5.3.3 網(wǎng)絡(luò)通信影響測試58-60
- 5.3.4 可擴(kuò)展性測試60-62
- 5.3.5 并行架構(gòu)綜合分析62
- 5.4 本章小結(jié)62-63
- 第六章 總結(jié)與展望63-65
- 6.1 研究工作總結(jié)63-64
- 6.2 下一步工作展望64-65
- 參考文獻(xiàn)65-69
- 致謝69-70
- 在學(xué)期間的研究成果及發(fā)表的學(xué)術(shù)論文70
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 馬伯寧;王晨昊;湯曉安;匡綱要;;基于GPU的二維離散小波變換快速計(jì)算[J];國防科技大學(xué)學(xué)報(bào);2011年03期
2 ZW;;3D游戲利器 主流嵌入式處理器GPU逐個(gè)看[J];電腦迷;2011年19期
3 王志國;王貴錦;施陳博;苗權(quán);林行剛;;積分圖像的快速GPU計(jì)算[J];計(jì)算機(jī)應(yīng)用研究;2011年10期
4 盧永菁;王東;;基于GPU的高速網(wǎng)絡(luò)入侵檢測系統(tǒng)設(shè)計(jì)[J];計(jì)算機(jī)工程與應(yīng)用;2011年33期
5 儲(chǔ)t熆,
本文編號(hào):519432
本文鏈接:http://www.sikaile.net/kejilunwen/xinxigongchenglunwen/519432.html
最近更新
教材專著