天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 自動化論文 >

基于深度學習的目標檢測算法FPGA實現(xiàn)

發(fā)布時間:2021-06-01 22:49
  目標檢測在人工智能、醫(yī)療研究和國防安全等民用和軍用領域等都應用廣泛,基于深度學習的目標檢測算法是利用卷積神經(jīng)網(wǎng)絡CNN(Convolutional Neural Network)提取特征并完成圖像分類和定位,精度和速度相較于傳統(tǒng)算法都大幅度提升,但卷積神經(jīng)網(wǎng)絡往往存在龐大的參數(shù)量和計算量,并且網(wǎng)絡層參數(shù)和結構多變,這導致目標檢測算法很難應用在資源有限、要求高處理速度和低功耗的嵌入式場合。相較于GPU和ASIC嵌入式平臺,FPGA具有低成本、可重構、能效比高等優(yōu)勢,本文在FPGA硬件平臺上完成基于深度學習的目標檢測算法硬件加速實現(xiàn),主要的研究工作如下:1.本文針對采用的ZYNQ 7100異構硬件平臺,結合以CNN為核心的目標檢測算法可硬件加速的分析結果,在一定的設計要求下,完成了基于軟硬件協(xié)同設計思想的研究任務劃分和總體架構設計。2.基于總體架構設計,本文借助Roofline模型評估了一系列典型的基于深度學習的目標檢測算法在ZYNQ 7100硬件平臺實現(xiàn)時能達到的理論性能上限,同時考慮算法檢測準確率、模型復雜度等因素,最終選擇了最適合部署在該平臺上的目標檢測算法Mobilenet-SSD... 

【文章來源】:哈爾濱工業(yè)大學黑龍江省 211工程院校 985工程院校

【文章頁數(shù)】:81 頁

【學位級別】:碩士

【部分圖文】:

基于深度學習的目標檢測算法FPGA實現(xiàn)


目標檢測算法性能概況

軟硬件協(xié)同設計,開發(fā)板,時鐘,目標檢測


哈爾濱工業(yè)大學工程碩士學位論文PL 端 DSP:2020 個;PS 和 PL 通信接口:AXI_ACP,AXI_HP(64bit)x4,A時鐘資源: 可編程 LVDS 時鐘,可用于 MGT 接口; 200 MHz LVDS oscillator (system clock); 33.333MHz PS 端系統(tǒng)時鐘;兩個 USB 轉 UART 串口,分別連接 PS 和 PL 端;SFP+ 接口 x2,QSFP+接口,USB Host 接口 x4, HDMI I2C EEPROM:容量 8Kbit。

模型圖,模型,系統(tǒng)時鐘,硬件平臺


Zynq7100的Roofline模型

【參考文獻】:
期刊論文
[1]基于Zynq7000 FPGA異構平臺的YOLOv2加速器設計與實現(xiàn)[J]. 陳辰,柴志雷,夏珺.  計算機科學與探索. 2019(10)
[2]基于FPGA的卷積神經(jīng)網(wǎng)絡加速器[J]. 余子健,馬德,嚴曉浪,沈君成.  計算機工程. 2017(01)
[3]深度學習研究綜述[J]. 孫志軍,薛磊,許陽明,王正.  計算機應用研究. 2012(08)
[4]SoPC與嵌入式系統(tǒng)軟硬件協(xié)同設計[J]. 唐思章,黃勇.  單片機與嵌入式系統(tǒng)應用. 2005(12)

博士論文
[1]基于GPU的高性能并行算法研究[D]. 白洪濤.吉林大學 2010

碩士論文
[1]基于FPGA的目標檢測算法加速與實現(xiàn)[D]. 吳晉.北京交通大學 2018
[2]深度學習的硬件實現(xiàn)與優(yōu)化技術研究[D]. 林楗軍.哈爾濱工業(yè)大學 2017
[3]基于FPGA的深度學習加速器設計與實現(xiàn)[D]. 余奇.中國科學技術大學 2016



本文編號:3210308

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/zidonghuakongzhilunwen/3210308.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶ed9e8***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com