CPU-GPU異構(gòu)計算環(huán)境下的Cube CNN模型設(shè)計與應(yīng)用研究
發(fā)布時間:2020-06-30 02:48
【摘要】:高光譜圖像分類是遙感領(lǐng)域的研究熱點之一。隨著光譜信息的不斷豐富和光譜波段數(shù)的迅速增加,傳統(tǒng)分類器如支持向量機(jī)、隨機(jī)森林等,在處理高光譜分類應(yīng)用時,往往由于輸入數(shù)據(jù)的維度高而遭遇性能瓶頸。近年來,深度學(xué)習(xí)方法發(fā)展迅速,深度卷積神經(jīng)網(wǎng)絡(luò)(CNN)能夠有效地從原始圖像中提取具有代表性的特征,因此在圖像分類領(lǐng)域應(yīng)用廣泛。由于高光譜圖像分類是像素級別分類,因此,設(shè)計專用于高光譜圖像分類應(yīng)用的深度CNN網(wǎng)絡(luò),一直是高光譜圖像分類領(lǐng)域研究的關(guān)鍵。圖形處理器(Graphic Processing Unit,GPU)作為最通用的加速芯片之一,被廣泛應(yīng)用于高性能計算領(lǐng)域。由于深度神經(jīng)網(wǎng)絡(luò)的訓(xùn)練耗時嚴(yán)重,越來越多的研究人員致力于將GPU應(yīng)用于深度學(xué)習(xí)領(lǐng)域,以加速模型的訓(xùn)練過程。本文將高光譜圖像近鄰像素策略與CNN相結(jié)合,提出一種面向高光譜圖像分類應(yīng)用的Cube CNN模型。針對該模型的訓(xùn)練特點,提出基于GPU平臺的GCN并行加速框架:首先,本文為GCN框架設(shè)計了一種高光譜圖像數(shù)據(jù)集預(yù)處理算法——PNPE(Parallel Neighbor Pixel Extraction)算法,該算法能夠并行地從原始高光譜圖像數(shù)據(jù)集中提取樣本并保存在GPU的Global Memory中,用于后續(xù)模型的訓(xùn)練。其次,結(jié)合Cube CNN各層的數(shù)據(jù)運算特點和GPU的軟硬件體系結(jié)構(gòu)特點,本文在GCN框架中引入了Cube CNN-To-GPU的映射機(jī)制,該機(jī)制能夠?qū)ube CNN各層的訓(xùn)練映射到GPU端的CUDA kernel,為模型訓(xùn)練的GPU并行加速奠定基礎(chǔ)。最后,本文設(shè)計了GPU端具體的數(shù)據(jù)存儲模式和同步機(jī)制,并將Multiple CUDA Streams技術(shù)與小批量梯度下降(MBGD)算法相結(jié)合,進(jìn)一步提高了該算法的執(zhí)行效率。實驗證明,在保證Cube CNN模型精度的前提下,GCN框架能有效提升模型的訓(xùn)練速度,與常用并行加速平臺Caffe和Theano相比,最多分別能縮短85%+和90%+的模型訓(xùn)練時間。最后,本文通過設(shè)計跨平臺GPU上的模型訓(xùn)練時間對比實驗,驗證了GCN框架具有良好的可移植性。
【學(xué)位授予單位】:南開大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2018
【分類號】:TP751;TP183
【圖文】:
與傳統(tǒng)的中央處理器 CPU 相比,GPU 已演化成為擁有高并發(fā)性多核處理器。無論是計算能力和內(nèi)存帶寬都遠(yuǎn)超 CPU,以 GPU 為代通用加速器迅速發(fā)展成為并行與高性能領(lǐng)域的主流技術(shù),并被廣泛應(yīng)通個人電腦到 Top500 中的超級計算機(jī)中[16]。CPU 和 GPU 的計算能力對比如圖 1-1 所示,從 2011 年開始,與 Int圖 1-1 CPU 與 GPU 浮點計算能力對比[49]
與傳統(tǒng)的中央處理器 CPU 相比,GPU 已演化成為擁有高并發(fā)性、多線程的多核處理器。無論是計算能力和內(nèi)存帶寬都遠(yuǎn)超 CPU,以 GPU 為代表的眾核通用加速器迅速發(fā)展成為并行與高性能領(lǐng)域的主流技術(shù),并被廣泛應(yīng)用于從普通個人電腦到 Top500 中的超級計算機(jī)中[16]。CPU 和 GPU 的計算能力對比如圖 1-1 所示,從 2011 年開始,與 Intel CPU圖 1-1 CPU 與 GPU 浮點計算能力對比[49]
本文編號:2734743
【學(xué)位授予單位】:南開大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2018
【分類號】:TP751;TP183
【圖文】:
與傳統(tǒng)的中央處理器 CPU 相比,GPU 已演化成為擁有高并發(fā)性多核處理器。無論是計算能力和內(nèi)存帶寬都遠(yuǎn)超 CPU,以 GPU 為代通用加速器迅速發(fā)展成為并行與高性能領(lǐng)域的主流技術(shù),并被廣泛應(yīng)通個人電腦到 Top500 中的超級計算機(jī)中[16]。CPU 和 GPU 的計算能力對比如圖 1-1 所示,從 2011 年開始,與 Int圖 1-1 CPU 與 GPU 浮點計算能力對比[49]
與傳統(tǒng)的中央處理器 CPU 相比,GPU 已演化成為擁有高并發(fā)性、多線程的多核處理器。無論是計算能力和內(nèi)存帶寬都遠(yuǎn)超 CPU,以 GPU 為代表的眾核通用加速器迅速發(fā)展成為并行與高性能領(lǐng)域的主流技術(shù),并被廣泛應(yīng)用于從普通個人電腦到 Top500 中的超級計算機(jī)中[16]。CPU 和 GPU 的計算能力對比如圖 1-1 所示,從 2011 年開始,與 Intel CPU圖 1-1 CPU 與 GPU 浮點計算能力對比[49]
【參考文獻(xiàn)】
相關(guān)期刊論文 前1條
1 孫志軍;薛磊;許陽明;王正;;深度學(xué)習(xí)研究綜述[J];計算機(jī)應(yīng)用研究;2012年08期
本文編號:2734743
本文鏈接:http://www.sikaile.net/guanlilunwen/gongchengguanli/2734743.html
最近更新
教材專著