基于深度學(xué)習(xí)的目標(biāo)檢測優(yōu)化算法研究及嵌入式計(jì)算平臺(tái)應(yīng)用
發(fā)布時(shí)間:2022-04-23 09:50
近十年來,深度學(xué)習(xí)在理論和工程上都取得了顯著的成果,如圖像識(shí)別、目標(biāo)檢測、自然語言處理等。而在深度學(xué)習(xí)應(yīng)用到目標(biāo)檢測之前,傳統(tǒng)目標(biāo)檢測的特征提取部分需要人工設(shè)計(jì)特征,但在面臨目標(biāo)特征多樣繁雜的場景時(shí),人工設(shè)計(jì)特征的難度會(huì)變得很大;谏疃葘W(xué)習(xí)的目標(biāo)檢測則不需要人工設(shè)計(jì)特征,而是通過卷積神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)特征。它從基于區(qū)域提名的R-CNN、SPP-Net、Fast R-CNN、Faster R-CNN、R-FCN到端到端的YOLO、SSD,識(shí)別精度和識(shí)別速率都已經(jīng)遠(yuǎn)遠(yuǎn)超過傳統(tǒng)目標(biāo)檢測方法。如今已應(yīng)用在無人駕駛、車輛檢測和行人檢測等領(lǐng)域。目前,大多數(shù)基于深度學(xué)習(xí)的目標(biāo)檢測模型由于體積太大,無法在嵌入式計(jì)算平臺(tái)上直接實(shí)現(xiàn)前向推理,并且通常的工作模式是“嵌入式計(jì)算平臺(tái)-云計(jì)算-嵌入式計(jì)算平臺(tái)”,即先在嵌入式計(jì)算平臺(tái)上采集需要檢測的圖像或視頻;然后通過網(wǎng)絡(luò)傳送到云端服務(wù)器,利用基于深度學(xué)習(xí)的目標(biāo)檢測模型對圖像或視頻進(jìn)行檢測;最后檢測結(jié)果被傳輸回嵌入式計(jì)算平臺(tái)。這種工作模式不僅會(huì)導(dǎo)致整體對網(wǎng)絡(luò)的依賴過大,而且會(huì)造成結(jié)果顯示的延時(shí)。針對這一問題,本文對基于深度學(xué)習(xí)的目標(biāo)檢測優(yōu)化算法進(jìn)行研究。本文主要研究內(nèi)...
【文章頁數(shù)】:71 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖1.1?ImageNet圖像分類競賽成績??
ResNet等,模型性能不斷提高。下面主要介紹LeNet、AlexNet、??GoogLeNet?和?ResNet。??2.1.1?LeNet??LeNet模型是YanLeCun在1998年提出的,它主要用于識(shí)別手寫數(shù)字。最??初的LeNet-5模型主要由卷積層、池化層和全連接層構(gòu)成。??其中卷積層主要操作是將多個(gè)濾波器作用在輸入圖像上,提取圖像中不同特??征,其中的濾波器被稱為卷積核,而通過卷積操作后輸出的圖像稱為特征圖。以??二維卷積層為例:假設(shè)輸入是高和寬都為3的二維數(shù)組,如圖2.1中的輸入所示;??其對應(yīng)的卷積核是高和寬均為2的數(shù)組,如圖2.1中的卷積核所示。??輸入?卷積核?輸出??圓冊國??圖2.1卷積操作??假設(shè)每做一次卷積,當(dāng)卷積步長為1?(即卷積核移動(dòng)一個(gè)像素)時(shí),卷積核??會(huì)從輸入數(shù)組的最左上方開始,按從左往右、從上往下的順序,依次在輸入數(shù)組??上滑動(dòng)。卷積核每滑動(dòng)一個(gè)位置,相對應(yīng)的輸入子數(shù)組與卷積核按元素會(huì)相乘并??相加,最后得到輸出數(shù)組相對應(yīng)的值。當(dāng)卷積核移動(dòng)到輸入數(shù)組的左上方時(shí),如??圖2.1中的藍(lán)色部分所示,輸出數(shù)組的值為1X0+2X1+4X2+5X3=25,卷積操??作的整體輸出如圖2.1中的輸出所示。??二維卷積層是在圖2.1中的輸出上加一個(gè)標(biāo)量偏差(bias)。卷積層的模型參數(shù)??8??
圖2.3最大池化與平均池化??
【參考文獻(xiàn)】:
期刊論文
[1]基于YOLO2和ResNet算法的監(jiān)控視頻中的人臉檢測與識(shí)別[J]. 朱超平,楊藝. 重慶理工大學(xué)學(xué)報(bào)(自然科學(xué)). 2018(08)
[2]基于Haar特性的改進(jìn)HOG的人臉特征提取算法[J]. 蔣政,程春玲. 計(jì)算機(jī)科學(xué). 2017(01)
[3]基于視覺的目標(biāo)檢測與跟蹤綜述[J]. 尹宏鵬,陳波,柴毅,劉兆棟. 自動(dòng)化學(xué)報(bào). 2016(10)
[4]LBP和HOG的分層特征融合的人臉識(shí)別[J]. 萬源,李歡歡,吳克風(fēng),童恒慶. 計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào). 2015(04)
[5]基于樹莓派的網(wǎng)絡(luò)監(jiān)控系統(tǒng)的研究與實(shí)現(xiàn)[J]. 汪鑫,彭雨薇. 硅谷. 2014(14)
[6]AdaBoost算法研究進(jìn)展與展望[J]. 曹瑩,苗啟廣,劉家辰,高琳. 自動(dòng)化學(xué)報(bào). 2013(06)
[7]深度學(xué)習(xí)研究綜述[J]. 孫志軍,薛磊,許陽明,王正. 計(jì)算機(jī)應(yīng)用研究. 2012(08)
[8]基于單類SVM的遙感圖像目標(biāo)檢測[J]. 王凱峰,秦前清. 計(jì)算機(jī)工程與應(yīng)用. 2005(32)
碩士論文
[1]基于輕量級(jí)計(jì)算平臺(tái)的卷積神經(jīng)網(wǎng)絡(luò)研究[D]. 王磊.電子科技大學(xué) 2018
[2]智能車牌識(shí)別系統(tǒng)的實(shí)現(xiàn)與優(yōu)化[D]. 姜曉.東華大學(xué) 2017
[3]基于FPGA的Adaboost人臉檢測算法設(shè)計(jì)與驗(yàn)證[D]. 龐偉.東南大學(xué) 2017
[4]基于深度神經(jīng)網(wǎng)絡(luò)的肌電信號(hào)降維與分類方法[D]. 陳波.東華大學(xué) 2017
[5]基于Adaboost算法和膚色分割的人臉檢測算法[D]. 劉丹利.西北師范大學(xué) 2014
[6]基于HOG和Haar-like融合特征的車輛檢測[D]. 楊慧.南京郵電大學(xué) 2013
本文編號(hào):3646945
【文章頁數(shù)】:71 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖1.1?ImageNet圖像分類競賽成績??
ResNet等,模型性能不斷提高。下面主要介紹LeNet、AlexNet、??GoogLeNet?和?ResNet。??2.1.1?LeNet??LeNet模型是YanLeCun在1998年提出的,它主要用于識(shí)別手寫數(shù)字。最??初的LeNet-5模型主要由卷積層、池化層和全連接層構(gòu)成。??其中卷積層主要操作是將多個(gè)濾波器作用在輸入圖像上,提取圖像中不同特??征,其中的濾波器被稱為卷積核,而通過卷積操作后輸出的圖像稱為特征圖。以??二維卷積層為例:假設(shè)輸入是高和寬都為3的二維數(shù)組,如圖2.1中的輸入所示;??其對應(yīng)的卷積核是高和寬均為2的數(shù)組,如圖2.1中的卷積核所示。??輸入?卷積核?輸出??圓冊國??圖2.1卷積操作??假設(shè)每做一次卷積,當(dāng)卷積步長為1?(即卷積核移動(dòng)一個(gè)像素)時(shí),卷積核??會(huì)從輸入數(shù)組的最左上方開始,按從左往右、從上往下的順序,依次在輸入數(shù)組??上滑動(dòng)。卷積核每滑動(dòng)一個(gè)位置,相對應(yīng)的輸入子數(shù)組與卷積核按元素會(huì)相乘并??相加,最后得到輸出數(shù)組相對應(yīng)的值。當(dāng)卷積核移動(dòng)到輸入數(shù)組的左上方時(shí),如??圖2.1中的藍(lán)色部分所示,輸出數(shù)組的值為1X0+2X1+4X2+5X3=25,卷積操??作的整體輸出如圖2.1中的輸出所示。??二維卷積層是在圖2.1中的輸出上加一個(gè)標(biāo)量偏差(bias)。卷積層的模型參數(shù)??8??
圖2.3最大池化與平均池化??
【參考文獻(xiàn)】:
期刊論文
[1]基于YOLO2和ResNet算法的監(jiān)控視頻中的人臉檢測與識(shí)別[J]. 朱超平,楊藝. 重慶理工大學(xué)學(xué)報(bào)(自然科學(xué)). 2018(08)
[2]基于Haar特性的改進(jìn)HOG的人臉特征提取算法[J]. 蔣政,程春玲. 計(jì)算機(jī)科學(xué). 2017(01)
[3]基于視覺的目標(biāo)檢測與跟蹤綜述[J]. 尹宏鵬,陳波,柴毅,劉兆棟. 自動(dòng)化學(xué)報(bào). 2016(10)
[4]LBP和HOG的分層特征融合的人臉識(shí)別[J]. 萬源,李歡歡,吳克風(fēng),童恒慶. 計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào). 2015(04)
[5]基于樹莓派的網(wǎng)絡(luò)監(jiān)控系統(tǒng)的研究與實(shí)現(xiàn)[J]. 汪鑫,彭雨薇. 硅谷. 2014(14)
[6]AdaBoost算法研究進(jìn)展與展望[J]. 曹瑩,苗啟廣,劉家辰,高琳. 自動(dòng)化學(xué)報(bào). 2013(06)
[7]深度學(xué)習(xí)研究綜述[J]. 孫志軍,薛磊,許陽明,王正. 計(jì)算機(jī)應(yīng)用研究. 2012(08)
[8]基于單類SVM的遙感圖像目標(biāo)檢測[J]. 王凱峰,秦前清. 計(jì)算機(jī)工程與應(yīng)用. 2005(32)
碩士論文
[1]基于輕量級(jí)計(jì)算平臺(tái)的卷積神經(jīng)網(wǎng)絡(luò)研究[D]. 王磊.電子科技大學(xué) 2018
[2]智能車牌識(shí)別系統(tǒng)的實(shí)現(xiàn)與優(yōu)化[D]. 姜曉.東華大學(xué) 2017
[3]基于FPGA的Adaboost人臉檢測算法設(shè)計(jì)與驗(yàn)證[D]. 龐偉.東南大學(xué) 2017
[4]基于深度神經(jīng)網(wǎng)絡(luò)的肌電信號(hào)降維與分類方法[D]. 陳波.東華大學(xué) 2017
[5]基于Adaboost算法和膚色分割的人臉檢測算法[D]. 劉丹利.西北師范大學(xué) 2014
[6]基于HOG和Haar-like融合特征的車輛檢測[D]. 楊慧.南京郵電大學(xué) 2013
本文編號(hào):3646945
本文鏈接:http://www.sikaile.net/kejilunwen/shengwushengchang/3646945.html
最近更新
教材專著