面向高光譜圖像異常檢測的GPU加速器設計
發(fā)布時間:2020-10-29 07:20
堆疊自編碼器(Stacked Autoencoder,SAE)作為一種非監(jiān)督深度學習方法,以其優(yōu)秀的非線性擬合能力在高光譜圖像異常檢測應用研究中獲得較好檢測精度。然而SAE龐大的計算量帶來長計算耗時成為其在高光譜圖像異常檢測實際應用的主要瓶頸。為解決該問題,依托目前高性能計算主流處理器平臺GPU(Grapgic Processing Unit)的大規(guī)模并行計算能力和高訪存帶寬的優(yōu)勢,開展面向高光譜圖像異常檢測的GPU加速器設計。課題工作可為高光譜圖像異常目標實時檢測方法的應用提供一種可行的解決方案,同時也可為其他機器學習算法的GPU加速器設計提供參考。本課題從SAE模型訓練和模型推理兩個過程開展工作,針對模型訓練過程計算量大和計算耗時長的問題,采用GPU服務器開展訓練加速器的設計;針對算法推理過程低延遲的需求,以及計算平臺體積和功耗受限的矛盾,采用嵌入式GPU開展推理加速器的設計。論文的主要工作包括以下內容:首先,對基于SAE的高光譜圖像異常檢測的原理進行分析,設計基于SAE的檢測器,并采用兩幅真實高光譜圖像數(shù)據(jù)進行模型的性能驗證,其AUC值分別可達0.8569和0.9248,優(yōu)于基準檢測器RXD,表明了本文設計基于SAE的高光譜圖像異常檢測器的合理性和正確性。其次,針對基于SAE的高光譜圖像異常檢測模型訓練過程計算量龐大和耗時長的問題,開展基于CPU+GPU異構系統(tǒng)的訓練加速器的設計。為提高計算效率,采用主機計算和設備計算重疊、數(shù)據(jù)傳輸和設備計算重疊、設備計算和設備計算重疊三種策略實現(xiàn)粗粒度并行計算。基于真實高光譜圖像數(shù)據(jù)的計算效率測試實驗結果表明:本文提出的GPU訓練加速器在模型最快收斂速度情況下相比于單核CPU可達到27倍加速,具有顯著的加速效果。最后,針對高光譜圖像異常檢測過程的實時性需求與計算平臺體積功耗約束之間的矛盾問題,開展基于嵌入式GPU計算平臺的推理加速器設計。通過模型計算圖化簡及GPU核函數(shù)合并的設計降低計算延遲;谡鎸嵏吖庾V圖像數(shù)據(jù)進行計算效率和功耗的綜合實驗結果表明:本文所提出的推理加速器的相比于ARM處理器最高可以獲得157倍加速比和113倍的能效比,相比于八核DSP最高可以獲得71倍的加速比和119倍的能效比。
【學位單位】:哈爾濱工業(yè)大學
【學位級別】:碩士
【學位年份】:2018
【中圖分類】:TP751
【部分圖文】:
輸入圖像重建圖像二值化后的重建誤差圖 2-1 SAE 異常目標檢測器計算過程基于 SAE 的高光譜圖像異常檢測在進行異常目標檢測之前需要利用高光像數(shù)據(jù)進行 SAE 模型參數(shù)優(yōu)化以及超參數(shù)的尋優(yōu),在下文中對 SAE 的基本、模型參數(shù)優(yōu)化以及超參數(shù)尋優(yōu)過程進行介紹。.2.1 SAE 的原理SAE 是由自編碼器(Autoencoder,AE)演化而來,SAE 是由多個 AE 組成,故本小節(jié)將介紹一下 AE 的原理。AE 是一種單隱藏層的神經網絡模型絡呈對稱結構,如圖 2-2 所示。AE 由一個編碼器和一個解碼器組合而成。器將輸入數(shù)據(jù)轉換成一種不同的表示,而解碼器將這個新的表示轉換到原形式。AE的目的是期望輸入數(shù)據(jù)經過編碼器和解碼器之后盡可能多被重建 AE 組合而成的 SAE 同樣具備對輸入數(shù)據(jù)進行重建的能力。本課題基于 S高光譜圖像異常檢測的主要思想就是希望 SAE 的輸出能夠盡可能多地對背元進行重建。
圖 2-1 SAE 異常目標檢測器計算過程譜圖像異常檢測在進行異常目標檢測型參數(shù)優(yōu)化以及超參數(shù)的尋優(yōu),在下文及超參數(shù)尋優(yōu)過程進行介紹。器(Autoencoder,AE)演化而來,SA紹一下 AE 的原理。AE 是一種單隱藏圖 2-2 所示。AE 由一個編碼器和一個成一種不同的表示,而解碼器將這個期望輸入數(shù)據(jù)經過編碼器和解碼器之E 同樣具備對輸入數(shù)據(jù)進行重建的能測的主要思想就是希望 SAE 的輸出能z重建數(shù)據(jù)
( )z z=z δW y + b中 y 為解碼器的輸入,zW 為解碼器的權重,zb 為編碼器的偏置,活函數(shù), z 為解碼器的輸出且是整個自編碼器的輸出。首先,將作為解碼器的輸入和解碼器的權重zW 進行矩陣乘法運算;然后將的結果和解碼器的偏置zb 進行矩陣加法;最后將矩陣加法的結果函數(shù)δ 進行非線性變化得到解碼器每一個神經元的輸出,同時也輸出。E 是僅包含一層隱藏層的全連接神經網絡,對于高光譜圖像光譜信征的表達能力十分有限。深度神經網絡包含了三層或三層以上的夠提取更為復雜的輸入特征,SAE 就是一個包含三層或三層及以經網絡。SAE 是由輸入層和多個 AE 的隱藏層依次連接構成的深隨著網絡隱藏層層數(shù)的增加,網絡能夠以更加緊湊簡潔的方式來像像元的光譜信息之間的非線性關系,一個具有 3 層隱藏層的 S-3 所示:輸入層 隱藏層0 隱藏層1 隱藏層2 輸出層
【參考文獻】
本文編號:2860573
【學位單位】:哈爾濱工業(yè)大學
【學位級別】:碩士
【學位年份】:2018
【中圖分類】:TP751
【部分圖文】:
輸入圖像重建圖像二值化后的重建誤差圖 2-1 SAE 異常目標檢測器計算過程基于 SAE 的高光譜圖像異常檢測在進行異常目標檢測之前需要利用高光像數(shù)據(jù)進行 SAE 模型參數(shù)優(yōu)化以及超參數(shù)的尋優(yōu),在下文中對 SAE 的基本、模型參數(shù)優(yōu)化以及超參數(shù)尋優(yōu)過程進行介紹。.2.1 SAE 的原理SAE 是由自編碼器(Autoencoder,AE)演化而來,SAE 是由多個 AE 組成,故本小節(jié)將介紹一下 AE 的原理。AE 是一種單隱藏層的神經網絡模型絡呈對稱結構,如圖 2-2 所示。AE 由一個編碼器和一個解碼器組合而成。器將輸入數(shù)據(jù)轉換成一種不同的表示,而解碼器將這個新的表示轉換到原形式。AE的目的是期望輸入數(shù)據(jù)經過編碼器和解碼器之后盡可能多被重建 AE 組合而成的 SAE 同樣具備對輸入數(shù)據(jù)進行重建的能力。本課題基于 S高光譜圖像異常檢測的主要思想就是希望 SAE 的輸出能夠盡可能多地對背元進行重建。
圖 2-1 SAE 異常目標檢測器計算過程譜圖像異常檢測在進行異常目標檢測型參數(shù)優(yōu)化以及超參數(shù)的尋優(yōu),在下文及超參數(shù)尋優(yōu)過程進行介紹。器(Autoencoder,AE)演化而來,SA紹一下 AE 的原理。AE 是一種單隱藏圖 2-2 所示。AE 由一個編碼器和一個成一種不同的表示,而解碼器將這個期望輸入數(shù)據(jù)經過編碼器和解碼器之E 同樣具備對輸入數(shù)據(jù)進行重建的能測的主要思想就是希望 SAE 的輸出能z重建數(shù)據(jù)
( )z z=z δW y + b中 y 為解碼器的輸入,zW 為解碼器的權重,zb 為編碼器的偏置,活函數(shù), z 為解碼器的輸出且是整個自編碼器的輸出。首先,將作為解碼器的輸入和解碼器的權重zW 進行矩陣乘法運算;然后將的結果和解碼器的偏置zb 進行矩陣加法;最后將矩陣加法的結果函數(shù)δ 進行非線性變化得到解碼器每一個神經元的輸出,同時也輸出。E 是僅包含一層隱藏層的全連接神經網絡,對于高光譜圖像光譜信征的表達能力十分有限。深度神經網絡包含了三層或三層以上的夠提取更為復雜的輸入特征,SAE 就是一個包含三層或三層及以經網絡。SAE 是由輸入層和多個 AE 的隱藏層依次連接構成的深隨著網絡隱藏層層數(shù)的增加,網絡能夠以更加緊湊簡潔的方式來像像元的光譜信息之間的非線性關系,一個具有 3 層隱藏層的 S-3 所示:輸入層 隱藏層0 隱藏層1 隱藏層2 輸出層
【參考文獻】
相關期刊論文 前4條
1 韓繼國;;摩爾定律失效后的芯片走向[J];集成電路應用;2015年10期
2 董代潔;全成斌;田淑珍;趙有健;;微型計算機系統(tǒng)接口技術課程實驗探索[J];計算機教育;2013年18期
3 徐衛(wèi)志;宋風龍;劉志勇;范東睿;余磊;張帥;;眾核處理器片上同步機制和評估方法研究[J];計算機學報;2010年10期
4 賀霖;潘泉;邸韡;李遠清;;高光譜圖像目標檢測研究進展[J];電子學報;2009年09期
相關博士學位論文 前2條
1 張濤;高性能低能耗GPGPU計算技術研究[D];上海交通大學;2015年
2 梅鋒;基于核機器學習的高光譜異常目標檢測算法研究[D];哈爾濱工程大學;2009年
相關碩士學位論文 前6條
1 陳宇佳;高光譜遙感影像亞像元定位技術研究[D];中國地質大學(北京);2017年
2 趙洋洋;基于FPGA的深度信念網絡加速系統(tǒng)研究[D];中國科學技術大學;2017年
3 彭倩;基于非負矩陣分解的高光譜圖像解混研究[D];中國科學院大學(中國科學院遙感與數(shù)字地球研究所);2017年
4 羅建華;深度學習在高光譜圖像的降維及分類中的應用[D];電子科技大學;2017年
5 武繼瑞;圖像增強在FPGA上的高性能實現(xiàn)[D];中國科學院研究生院(光電技術研究所);2016年
6 王曉璐;基于Zynq的LS-SVM算法加速器設計[D];哈爾濱工業(yè)大學;2015年
本文編號:2860573
本文鏈接:http://www.sikaile.net/guanlilunwen/gongchengguanli/2860573.html