基于FPGA加速器的SSD目標(biāo)檢測技術(shù)研究與實現(xiàn)
發(fā)布時間:2021-02-17 19:02
近年來眾多的研究工作已經(jīng)表明神經(jīng)網(wǎng)絡(luò)(Neural Network,NN)相較于傳統(tǒng)算法有著顯著的優(yōu)勢,其已經(jīng)被廣泛應(yīng)用于圖像、語音和視頻識別等領(lǐng)域。但是由于神經(jīng)網(wǎng)絡(luò)對硬件平臺的算力和存儲需求巨大,導(dǎo)致實際應(yīng)用存在困難,F(xiàn)有的CPU平臺無法提供足夠的算力支持,而GPU平臺由于有著很高的計算力和易用的開發(fā)框架成為神經(jīng)網(wǎng)絡(luò)的首選平臺。同時,基于FPGA的神經(jīng)網(wǎng)絡(luò)加速器也是目前研究的熱點,經(jīng)過特定的硬件設(shè)計,FPGA往往可以擁有超過GPU的處理速度,同時兼顧能效比。本文在此背景下,以自動駕駛領(lǐng)域?qū)囕v、行人的實時檢測需求為切入點,探索和研究了神經(jīng)網(wǎng)絡(luò)目標(biāo)檢測算法在FPGA上的并行加速方法。本文首先研究了神經(jīng)網(wǎng)絡(luò)目標(biāo)檢測算法和基于FPGA的神經(jīng)網(wǎng)絡(luò)加速器。然后以SSD(Single Shot MultiBox Detector)目標(biāo)檢測算法和ResNet(Deep Residual Network)網(wǎng)絡(luò)為基礎(chǔ),設(shè)計了ResNet18-SSD模型,該模型既保持了VGG-SSD模型準(zhǔn)確度,也有效降低了計算和儲存復(fù)雜度。針對該模型的推理(Inference)過程,本文設(shè)計了基于兩片Xilinx VU...
【文章來源】:西安電子科技大學(xué)陜西省 211工程院校 教育部直屬院校
【文章頁數(shù)】:95 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
縮略語對照表
第一章 緒論
1.1 選題背景及意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 基于卷積神經(jīng)網(wǎng)絡(luò)的目標(biāo)檢測算法發(fā)展現(xiàn)狀
1.2.2 神經(jīng)網(wǎng)絡(luò)硬件加速器發(fā)展現(xiàn)狀
1.3 論文主要研究內(nèi)容和組織結(jié)構(gòu)
第二章 Res Net18-SSD算法分析和FPGA硬件加速方法
2.1 Res Net18-SSD算法分析
2.1.1 Res Net網(wǎng)絡(luò)
2.1.2 SSD目標(biāo)檢測算法
2.1.3 Res Net18-SSD算法拓撲結(jié)構(gòu)
2.2 基于FPGA的神經(jīng)網(wǎng)絡(luò)加速方法
2.2.1 數(shù)據(jù)量化
2.2.2 基本計算單元設(shè)計
2.2.3 循環(huán)展開方式
2.2.4 系統(tǒng)級設(shè)計和優(yōu)化
2.3 本章小結(jié)
第三章 基于FPGA的Res Net18-SSD算法加速方案
3.1 加速方案整體設(shè)計思路
3.2 數(shù)據(jù)的INT8量化
3.3 單層卷積硬件設(shè)計
3.3.1 基本計算單元的硬件實現(xiàn)
3.3.2 循環(huán)展開和數(shù)據(jù)復(fù)用
3.3.3 數(shù)據(jù)流計算及量化方式
3.4 Res Net旁路層硬件設(shè)計
3.5 pooling層硬件設(shè)計
3.6 sum層硬件設(shè)計
3.7 priorbox層和decodeBBoxes層硬件設(shè)計
3.8 本章小結(jié)
第四章 基于FPGA的加速方案實現(xiàn)與系統(tǒng)驗證
4.1 開發(fā)平臺搭建
4.1.1 硬件平臺
4.1.2 軟件平臺
4.2 FPGA加速方案整體實現(xiàn)
4.2.1 PCIe模塊實現(xiàn)
4.2.2 核心算法實現(xiàn)
4.2.3 QSFP模塊實現(xiàn)
4.2.4 上位機程序?qū)崿F(xiàn)
4.2.5 實際系統(tǒng)展示
4.3 整體系統(tǒng)驗證與分析
4.3.1 正確性驗證
4.3.2 檢測效果
4.3.3 檢測速度
4.3.4 時序分析和資源占用率
4.3.5 功耗
4.3.6 與其他工作對比
4.4 本章小結(jié)
第五章 總結(jié)與展望
5.1 工作總結(jié)
5.2 研究展望
參考文獻
致謝
作者簡介
【參考文獻】:
碩士論文
[1]基于FPGA的卷積神經(jīng)網(wǎng)絡(luò)并行加速體系架構(gòu)的研究[D]. 殷偉.西安電子科技大學(xué) 2018
本文編號:3038392
【文章來源】:西安電子科技大學(xué)陜西省 211工程院校 教育部直屬院校
【文章頁數(shù)】:95 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
縮略語對照表
第一章 緒論
1.1 選題背景及意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 基于卷積神經(jīng)網(wǎng)絡(luò)的目標(biāo)檢測算法發(fā)展現(xiàn)狀
1.2.2 神經(jīng)網(wǎng)絡(luò)硬件加速器發(fā)展現(xiàn)狀
1.3 論文主要研究內(nèi)容和組織結(jié)構(gòu)
第二章 Res Net18-SSD算法分析和FPGA硬件加速方法
2.1 Res Net18-SSD算法分析
2.1.1 Res Net網(wǎng)絡(luò)
2.1.2 SSD目標(biāo)檢測算法
2.1.3 Res Net18-SSD算法拓撲結(jié)構(gòu)
2.2 基于FPGA的神經(jīng)網(wǎng)絡(luò)加速方法
2.2.1 數(shù)據(jù)量化
2.2.2 基本計算單元設(shè)計
2.2.3 循環(huán)展開方式
2.2.4 系統(tǒng)級設(shè)計和優(yōu)化
2.3 本章小結(jié)
第三章 基于FPGA的Res Net18-SSD算法加速方案
3.1 加速方案整體設(shè)計思路
3.2 數(shù)據(jù)的INT8量化
3.3 單層卷積硬件設(shè)計
3.3.1 基本計算單元的硬件實現(xiàn)
3.3.2 循環(huán)展開和數(shù)據(jù)復(fù)用
3.3.3 數(shù)據(jù)流計算及量化方式
3.4 Res Net旁路層硬件設(shè)計
3.5 pooling層硬件設(shè)計
3.6 sum層硬件設(shè)計
3.7 priorbox層和decodeBBoxes層硬件設(shè)計
3.8 本章小結(jié)
第四章 基于FPGA的加速方案實現(xiàn)與系統(tǒng)驗證
4.1 開發(fā)平臺搭建
4.1.1 硬件平臺
4.1.2 軟件平臺
4.2 FPGA加速方案整體實現(xiàn)
4.2.1 PCIe模塊實現(xiàn)
4.2.2 核心算法實現(xiàn)
4.2.3 QSFP模塊實現(xiàn)
4.2.4 上位機程序?qū)崿F(xiàn)
4.2.5 實際系統(tǒng)展示
4.3 整體系統(tǒng)驗證與分析
4.3.1 正確性驗證
4.3.2 檢測效果
4.3.3 檢測速度
4.3.4 時序分析和資源占用率
4.3.5 功耗
4.3.6 與其他工作對比
4.4 本章小結(jié)
第五章 總結(jié)與展望
5.1 工作總結(jié)
5.2 研究展望
參考文獻
致謝
作者簡介
【參考文獻】:
碩士論文
[1]基于FPGA的卷積神經(jīng)網(wǎng)絡(luò)并行加速體系架構(gòu)的研究[D]. 殷偉.西安電子科技大學(xué) 2018
本文編號:3038392
本文鏈接:http://www.sikaile.net/kejilunwen/dianzigongchenglunwen/3038392.html
最近更新
教材專著