統(tǒng)一計(jì)算設(shè)備架構(gòu)的D8算法并行化研究
發(fā)布時(shí)間:2021-07-25 01:24
針對(duì)空間遙感技術(shù)的快速發(fā)展導(dǎo)致地理空間數(shù)據(jù)呈幾何級(jí)數(shù)增長,傳統(tǒng)GIS空間分析面臨巨大的計(jì)算實(shí)時(shí)性需求的問題,該文為提高GIS數(shù)字地形分析算法在處理海量高分辨率DEM數(shù)據(jù)時(shí)的計(jì)算效率,基于CUDA眾核流處理器并行編程模型,采用不同數(shù)據(jù)劃分方法、紋理內(nèi)存及異步數(shù)據(jù)傳輸機(jī)制等技術(shù),對(duì)串行D8算法進(jìn)行了并行化設(shè)計(jì)及算法優(yōu)化,探索并分析了D8并行算法的數(shù)據(jù)拷貝與算法執(zhí)行等環(huán)節(jié)的計(jì)算效率變化。實(shí)驗(yàn)結(jié)果表明,CUDA并行編程能夠?qū)8算法實(shí)現(xiàn)較為明顯的加速,在按5個(gè)行子塊進(jìn)行劃分、調(diào)用1 344個(gè)線程時(shí)并行加速效果達(dá)到最佳,加速比為19.5。并且,在不同行子塊劃分方式下且調(diào)用線程數(shù)不超過1 344個(gè)時(shí),加速比隨調(diào)用線程數(shù)的增加而增長,計(jì)算時(shí)間占比隨線程數(shù)的增加呈遞減趨勢(shì)。
【文章來源】:測(cè)繪科學(xué). 2020,45(03)北大核心CSCD
【文章頁數(shù)】:7 頁
【部分圖文】:
部分DEM高程值與方向編碼值
1)數(shù)據(jù)并行。數(shù)據(jù)并行的關(guān)鍵是數(shù)據(jù)劃分,優(yōu)秀的數(shù)據(jù)劃分方法能夠有效提升算法的計(jì)算效率,在串行算法并行化中極為重要。本文所用DEM數(shù)據(jù)為m行、m列的規(guī)則矩陣形式,在設(shè)備端使用二維CUDA數(shù)組進(jìn)行存儲(chǔ)。一般說來,數(shù)據(jù)劃分有規(guī)則劃分和不規(guī)則劃分兩類方法[22]。規(guī)則劃分包括按行、按列以及二維塊劃分,不規(guī)則劃分是根據(jù)DEM中地貌地形特征來劃分的,本文根據(jù)D8算法的特點(diǎn)采用規(guī)則格網(wǎng)劃分方法,運(yùn)用基于行模式的GDAL庫對(duì)數(shù)據(jù)進(jìn)行讀寫,由于其在行方向上讀寫效率高,研究選取行為單位的條帶式劃分方法,如圖2所示。2)異步傳輸。GPU擁有大量的流處理器單元,使其在密集型計(jì)算方面有著顯著的優(yōu)勢(shì),計(jì)算效率較高。然而GPU本身無法直接獲取數(shù)據(jù),需要從主機(jī)端接收,受主機(jī)內(nèi)存與GPU顯存之間的帶寬的限制,兩者之間數(shù)據(jù)拷貝速度遠(yuǎn)低于GPU的計(jì)算速度,這在一定程度上限制了D8算法計(jì)算的加速比的上升。因此,為了進(jìn)一步提升D8算法的整體效率,引入了異步傳輸模式[23],以降低數(shù)據(jù)復(fù)制與核函數(shù)執(zhí)行之間的相互等待時(shí)間。
3)紋理內(nèi)存。紋理內(nèi)存是CUDA編程模型獨(dú)有的一種只讀內(nèi)存,針對(duì)二維空間的局部性訪問會(huì)獲得加速,且適用于大量數(shù)據(jù)的隨機(jī)和非對(duì)齊訪問。DEM柵格數(shù)據(jù)由CUDA數(shù)組進(jìn)行存儲(chǔ),使用紋理參考實(shí)現(xiàn)紋理坐標(biāo)與格網(wǎng)柵格數(shù)據(jù)數(shù)組的映射綁定。流向計(jì)算過程中只需通過紋理拾取訪問不同紋理坐標(biāo)值,即可讀取到對(duì)應(yīng)不同柵格單元及其鄰接?xùn)鸥駭?shù)據(jù),無需進(jìn)行多個(gè)存儲(chǔ)器之間的數(shù)據(jù)交換,降低額外時(shí)間開銷,提高計(jì)算效率。如圖4所示,數(shù)據(jù)已進(jìn)行紋理綁定,右側(cè)中間4個(gè)地址不連續(xù),但通過紋理拾取進(jìn)行訪問會(huì)獲得一定的加速效果。在為核函數(shù)分配線程數(shù)目時(shí),根據(jù)DEM數(shù)據(jù)的數(shù)據(jù)量大小及GPU流處理器核心的數(shù)目來確定。并行算法的流程設(shè)計(jì)如圖5所示。
【參考文獻(xiàn)】:
期刊論文
[1]CUDA環(huán)境下地形因子的并行計(jì)算[J]. 陳亮,趙磊,李珂. 北京測(cè)繪. 2017(04)
[2]多種數(shù)據(jù)劃分方法下D8算法的多核并行化實(shí)驗(yàn)對(duì)比[J]. 高琪,范俊甫,何惠馨,孔維華,周玉科. 地理與地理信息科學(xué). 2017(02)
[3]基于GPU的RFT算法并行化[J]. 商哲然,譚賢四,曲智國,王紅,豐驍. 雷達(dá)科學(xué)與技術(shù). 2016(05)
[4]CPU/GPU異構(gòu)混合并行的柵格數(shù)據(jù)空間分析研究——以地形因子計(jì)算為例[J]. 盧敏,王金茵,盧剛,陶偉東,王結(jié)臣. 計(jì)算機(jī)工程與應(yīng)用. 2017(01)
[5]基于GPU的二維矢量場(chǎng)LIC算法研究[J]. 陳丁,萬剛,王龍,趙宸立. 測(cè)繪工程. 2015(03)
[6]格網(wǎng)DEM水系提取并行算法研究[J]. 江嶺,劉學(xué)軍,陽建逸,劉凱,宋效東. 地理與地理信息科學(xué). 2013(04)
[7]地形分析中坡度坡向算法并行化方法研究[J]. 江嶺,劉學(xué)軍,湯國安,宋效東. 計(jì)算機(jī)工程與科學(xué). 2013(04)
[8]DEM與地形分析的并行計(jì)算[J]. 宋效東,劉學(xué)軍,湯國安,王永君,田劍,竇萬峰. 地理與地理信息科學(xué). 2012(04)
[9]一個(gè)基于DEM的數(shù)字河網(wǎng)體系提取算法的應(yīng)用[J]. 崔青春,吳孟泉,孔祥生,張麗. 計(jì)算機(jī)技術(shù)與發(fā)展. 2011(06)
[10]利用CUDA的地圖代數(shù)局部算子優(yōu)化[J]. 張劍波,楊文鑫,周斯波,張帥. 測(cè)繪科學(xué). 2012(02)
博士論文
[1]基于DEM的流域地形分析并行算法關(guān)鍵技術(shù)研究[D]. 江嶺.南京師范大學(xué) 2014
碩士論文
[1]并行數(shù)字地形分析數(shù)據(jù)劃分方法研究[D]. 張剛.南京師范大學(xué) 2014
本文編號(hào):3301821
【文章來源】:測(cè)繪科學(xué). 2020,45(03)北大核心CSCD
【文章頁數(shù)】:7 頁
【部分圖文】:
部分DEM高程值與方向編碼值
1)數(shù)據(jù)并行。數(shù)據(jù)并行的關(guān)鍵是數(shù)據(jù)劃分,優(yōu)秀的數(shù)據(jù)劃分方法能夠有效提升算法的計(jì)算效率,在串行算法并行化中極為重要。本文所用DEM數(shù)據(jù)為m行、m列的規(guī)則矩陣形式,在設(shè)備端使用二維CUDA數(shù)組進(jìn)行存儲(chǔ)。一般說來,數(shù)據(jù)劃分有規(guī)則劃分和不規(guī)則劃分兩類方法[22]。規(guī)則劃分包括按行、按列以及二維塊劃分,不規(guī)則劃分是根據(jù)DEM中地貌地形特征來劃分的,本文根據(jù)D8算法的特點(diǎn)采用規(guī)則格網(wǎng)劃分方法,運(yùn)用基于行模式的GDAL庫對(duì)數(shù)據(jù)進(jìn)行讀寫,由于其在行方向上讀寫效率高,研究選取行為單位的條帶式劃分方法,如圖2所示。2)異步傳輸。GPU擁有大量的流處理器單元,使其在密集型計(jì)算方面有著顯著的優(yōu)勢(shì),計(jì)算效率較高。然而GPU本身無法直接獲取數(shù)據(jù),需要從主機(jī)端接收,受主機(jī)內(nèi)存與GPU顯存之間的帶寬的限制,兩者之間數(shù)據(jù)拷貝速度遠(yuǎn)低于GPU的計(jì)算速度,這在一定程度上限制了D8算法計(jì)算的加速比的上升。因此,為了進(jìn)一步提升D8算法的整體效率,引入了異步傳輸模式[23],以降低數(shù)據(jù)復(fù)制與核函數(shù)執(zhí)行之間的相互等待時(shí)間。
3)紋理內(nèi)存。紋理內(nèi)存是CUDA編程模型獨(dú)有的一種只讀內(nèi)存,針對(duì)二維空間的局部性訪問會(huì)獲得加速,且適用于大量數(shù)據(jù)的隨機(jī)和非對(duì)齊訪問。DEM柵格數(shù)據(jù)由CUDA數(shù)組進(jìn)行存儲(chǔ),使用紋理參考實(shí)現(xiàn)紋理坐標(biāo)與格網(wǎng)柵格數(shù)據(jù)數(shù)組的映射綁定。流向計(jì)算過程中只需通過紋理拾取訪問不同紋理坐標(biāo)值,即可讀取到對(duì)應(yīng)不同柵格單元及其鄰接?xùn)鸥駭?shù)據(jù),無需進(jìn)行多個(gè)存儲(chǔ)器之間的數(shù)據(jù)交換,降低額外時(shí)間開銷,提高計(jì)算效率。如圖4所示,數(shù)據(jù)已進(jìn)行紋理綁定,右側(cè)中間4個(gè)地址不連續(xù),但通過紋理拾取進(jìn)行訪問會(huì)獲得一定的加速效果。在為核函數(shù)分配線程數(shù)目時(shí),根據(jù)DEM數(shù)據(jù)的數(shù)據(jù)量大小及GPU流處理器核心的數(shù)目來確定。并行算法的流程設(shè)計(jì)如圖5所示。
【參考文獻(xiàn)】:
期刊論文
[1]CUDA環(huán)境下地形因子的并行計(jì)算[J]. 陳亮,趙磊,李珂. 北京測(cè)繪. 2017(04)
[2]多種數(shù)據(jù)劃分方法下D8算法的多核并行化實(shí)驗(yàn)對(duì)比[J]. 高琪,范俊甫,何惠馨,孔維華,周玉科. 地理與地理信息科學(xué). 2017(02)
[3]基于GPU的RFT算法并行化[J]. 商哲然,譚賢四,曲智國,王紅,豐驍. 雷達(dá)科學(xué)與技術(shù). 2016(05)
[4]CPU/GPU異構(gòu)混合并行的柵格數(shù)據(jù)空間分析研究——以地形因子計(jì)算為例[J]. 盧敏,王金茵,盧剛,陶偉東,王結(jié)臣. 計(jì)算機(jī)工程與應(yīng)用. 2017(01)
[5]基于GPU的二維矢量場(chǎng)LIC算法研究[J]. 陳丁,萬剛,王龍,趙宸立. 測(cè)繪工程. 2015(03)
[6]格網(wǎng)DEM水系提取并行算法研究[J]. 江嶺,劉學(xué)軍,陽建逸,劉凱,宋效東. 地理與地理信息科學(xué). 2013(04)
[7]地形分析中坡度坡向算法并行化方法研究[J]. 江嶺,劉學(xué)軍,湯國安,宋效東. 計(jì)算機(jī)工程與科學(xué). 2013(04)
[8]DEM與地形分析的并行計(jì)算[J]. 宋效東,劉學(xué)軍,湯國安,王永君,田劍,竇萬峰. 地理與地理信息科學(xué). 2012(04)
[9]一個(gè)基于DEM的數(shù)字河網(wǎng)體系提取算法的應(yīng)用[J]. 崔青春,吳孟泉,孔祥生,張麗. 計(jì)算機(jī)技術(shù)與發(fā)展. 2011(06)
[10]利用CUDA的地圖代數(shù)局部算子優(yōu)化[J]. 張劍波,楊文鑫,周斯波,張帥. 測(cè)繪科學(xué). 2012(02)
博士論文
[1]基于DEM的流域地形分析并行算法關(guān)鍵技術(shù)研究[D]. 江嶺.南京師范大學(xué) 2014
碩士論文
[1]并行數(shù)字地形分析數(shù)據(jù)劃分方法研究[D]. 張剛.南京師范大學(xué) 2014
本文編號(hào):3301821
本文鏈接:http://www.sikaile.net/kejilunwen/dizhicehuilunwen/3301821.html
最近更新
教材專著