基于改進YOLOv3-tiny的田間行人與農機障礙物檢測
發(fā)布時間:2021-11-21 17:41
為實現(xiàn)農機自主作業(yè)中的避障需求,本文針對室外田間自然場景中因植被遮擋、背景干擾而導致障礙物難以檢測的問題,基于嵌入式平臺應用設備,提出了農機田間作業(yè)時行人和農機障礙物檢測的改進模型,更好地平衡了模型的檢測速度與檢測精度。該改進模型以You only look once version 3-tiny(YOLOv3-tiny)為基礎框架,融合其淺層特征與第2 YOLO預測層特征作為第3預測層,通過更小的預選框增加小目標表征能力;在網絡關鍵位置的特征圖中混合使用注意力機制中的擠壓激勵注意模塊(Squeeze and excitation attention module,SEAM)與卷積塊注意模塊(Convolutional block attention module,CBAM),通過強化檢測目標關注以提高抗背景干擾能力。建立了室外環(huán)境下含農機與行人的共9 405幅圖像的原始數(shù)據(jù)集。其中訓練集7 054幅,測試集2 351幅。測試表明本文模型的內存約為YOLOv3與單次多重檢測器(Single shot multibox detector,SSD)模型內存的1/3和2/3;與YOLOv3-...
【文章來源】:農業(yè)機械學報. 2020,51(S1)北大核心EICSCD
【文章頁數(shù)】:9 頁
【部分圖文】:
YOLOv3? tiny的漏檢現(xiàn)象
不同于常規(guī)YOLOv3應用中需用比較深的網絡來擬合幾十甚至上百個目標,本文檢測任務只包含行人和農機兩類障礙物,YOLOv3 tiny中殘差模塊的缺位與大量卷積層的減少并不會對本文檢測任務的檢測準確率有顯著影響。但為了克服YOLOv3tiny中淺層低維特征在網絡深層丟失并因此產生的漏檢,本文構建融合淺層信息的YOLO預測層y3。如圖2所示,將YOLOv3 tiny的淺層網絡與y2預測層之前的拼接層進行融合構建一個新的尺寸為52×52的y3預測層。y3預測層的特征信息來自淺層信息與y2結構路線拼接前的特征圖。融合了淺層特征圖的y3包含了更多的圖像低維特征信息。如圖3所示,y1小尺度YOLO層13×13的每個網格生成的預測框比較大,y2其次,而遠距離行人、農機,需要更小的預測框在y3預測層預測。在本文構建的預測層y3中,輸入原圖像被劃分為52×52個網格,每個網格與y3預測層的每個通道一一對應。每個網格根據(jù)對應通道信息生成3個尺寸預先設置好的預選框,在訓練時不斷調整大小并優(yōu)選出合適的預選框作為輸出結果[12]。各個預測層通道包含了每個網格最終的預測參數(shù)。如圖3中以y1預測層為例,每個通道分別由預測框中心坐標(tx,ty)、預測框長寬尺寸(tw,th)、預選框的預測置信度p0、農機的預測得分s1和行人的預測得分s2組成。每個網格生成3個預選框,每個預選框包含以上7個參數(shù),故y1、y2、y3預測層預測輸出通道維數(shù)均為21。
如圖3所示,y1小尺度YOLO層13×13的每個網格生成的預測框比較大,y2其次,而遠距離行人、農機,需要更小的預測框在y3預測層預測。在本文構建的預測層y3中,輸入原圖像被劃分為52×52個網格,每個網格與y3預測層的每個通道一一對應。每個網格根據(jù)對應通道信息生成3個尺寸預先設置好的預選框,在訓練時不斷調整大小并優(yōu)選出合適的預選框作為輸出結果[12]。各個預測層通道包含了每個網格最終的預測參數(shù)。如圖3中以y1預測層為例,每個通道分別由預測框中心坐標(tx,ty)、預測框長寬尺寸(tw,th)、預選框的預測置信度p0、農機的預測得分s1和行人的預測得分s2組成。每個網格生成3個預選框,每個預選框包含以上7個參數(shù),故y1、y2、y3預測層預測輸出通道維數(shù)均為21。1.3 先空間后通道的混合注意力機制
【參考文獻】:
期刊論文
[1]基于毫米波雷達的植保無人機避障系統(tǒng)研究[J]. 孫柯,吳開華,王亞濤,邵振程. 傳感器與微系統(tǒng). 2020(06)
[2]自然場景下的挖掘機實時監(jiān)測方法[J]. 毛亮,薛月菊,朱婷婷,魏穎慧,何俊樂,朱勛沐. 農業(yè)工程學報. 2020(09)
[3]基于改進型YOLO的復雜環(huán)境下番茄果實快速識別方法[J]. 劉芳,劉玉坤,林森,郭文忠,徐凡,張白. 農業(yè)機械學報. 2020(06)
[4]Tiny YOLOV3目標檢測改進[J]. 馬立,鞏笑天,歐陽航空. 光學精密工程. 2020(04)
[5]基于毫米波雷達和攝像頭的農用車輛障礙物檢測[J]. 宋正根,彭竟德,肖璨. 現(xiàn)代信息科技. 2019(14)
[6]基于激光雷達的農田環(huán)境點云采集系統(tǒng)設計[J]. 季宇寒,徐弘禎,張漫,李世超,曹如月,李寒. 農業(yè)機械學報. 2019(S1)
[7]基于增強Tiny YOLOV3算法的車輛實時檢測與跟蹤[J]. 劉軍,后士浩,張凱,張睿,胡超超. 農業(yè)工程學報. 2019(08)
[8]水田田埂邊界支持向量機檢測方法[J]. 蔡道清,李彥明,覃程錦,劉成良. 農業(yè)機械學報. 2019(06)
[9]基于改進SSD的果園行人實時檢測方法[J]. 劉慧,張禮帥,沈躍,張健,吳邊. 農業(yè)機械學報. 2019(04)
[10]多類農田障礙物卷積神經網絡分類識別方法[J]. 薛金林,閆嘉,范博文. 農業(yè)機械學報. 2018(S1)
本文編號:3509947
【文章來源】:農業(yè)機械學報. 2020,51(S1)北大核心EICSCD
【文章頁數(shù)】:9 頁
【部分圖文】:
YOLOv3? tiny的漏檢現(xiàn)象
不同于常規(guī)YOLOv3應用中需用比較深的網絡來擬合幾十甚至上百個目標,本文檢測任務只包含行人和農機兩類障礙物,YOLOv3 tiny中殘差模塊的缺位與大量卷積層的減少并不會對本文檢測任務的檢測準確率有顯著影響。但為了克服YOLOv3tiny中淺層低維特征在網絡深層丟失并因此產生的漏檢,本文構建融合淺層信息的YOLO預測層y3。如圖2所示,將YOLOv3 tiny的淺層網絡與y2預測層之前的拼接層進行融合構建一個新的尺寸為52×52的y3預測層。y3預測層的特征信息來自淺層信息與y2結構路線拼接前的特征圖。融合了淺層特征圖的y3包含了更多的圖像低維特征信息。如圖3所示,y1小尺度YOLO層13×13的每個網格生成的預測框比較大,y2其次,而遠距離行人、農機,需要更小的預測框在y3預測層預測。在本文構建的預測層y3中,輸入原圖像被劃分為52×52個網格,每個網格與y3預測層的每個通道一一對應。每個網格根據(jù)對應通道信息生成3個尺寸預先設置好的預選框,在訓練時不斷調整大小并優(yōu)選出合適的預選框作為輸出結果[12]。各個預測層通道包含了每個網格最終的預測參數(shù)。如圖3中以y1預測層為例,每個通道分別由預測框中心坐標(tx,ty)、預測框長寬尺寸(tw,th)、預選框的預測置信度p0、農機的預測得分s1和行人的預測得分s2組成。每個網格生成3個預選框,每個預選框包含以上7個參數(shù),故y1、y2、y3預測層預測輸出通道維數(shù)均為21。
如圖3所示,y1小尺度YOLO層13×13的每個網格生成的預測框比較大,y2其次,而遠距離行人、農機,需要更小的預測框在y3預測層預測。在本文構建的預測層y3中,輸入原圖像被劃分為52×52個網格,每個網格與y3預測層的每個通道一一對應。每個網格根據(jù)對應通道信息生成3個尺寸預先設置好的預選框,在訓練時不斷調整大小并優(yōu)選出合適的預選框作為輸出結果[12]。各個預測層通道包含了每個網格最終的預測參數(shù)。如圖3中以y1預測層為例,每個通道分別由預測框中心坐標(tx,ty)、預測框長寬尺寸(tw,th)、預選框的預測置信度p0、農機的預測得分s1和行人的預測得分s2組成。每個網格生成3個預選框,每個預選框包含以上7個參數(shù),故y1、y2、y3預測層預測輸出通道維數(shù)均為21。1.3 先空間后通道的混合注意力機制
【參考文獻】:
期刊論文
[1]基于毫米波雷達的植保無人機避障系統(tǒng)研究[J]. 孫柯,吳開華,王亞濤,邵振程. 傳感器與微系統(tǒng). 2020(06)
[2]自然場景下的挖掘機實時監(jiān)測方法[J]. 毛亮,薛月菊,朱婷婷,魏穎慧,何俊樂,朱勛沐. 農業(yè)工程學報. 2020(09)
[3]基于改進型YOLO的復雜環(huán)境下番茄果實快速識別方法[J]. 劉芳,劉玉坤,林森,郭文忠,徐凡,張白. 農業(yè)機械學報. 2020(06)
[4]Tiny YOLOV3目標檢測改進[J]. 馬立,鞏笑天,歐陽航空. 光學精密工程. 2020(04)
[5]基于毫米波雷達和攝像頭的農用車輛障礙物檢測[J]. 宋正根,彭竟德,肖璨. 現(xiàn)代信息科技. 2019(14)
[6]基于激光雷達的農田環(huán)境點云采集系統(tǒng)設計[J]. 季宇寒,徐弘禎,張漫,李世超,曹如月,李寒. 農業(yè)機械學報. 2019(S1)
[7]基于增強Tiny YOLOV3算法的車輛實時檢測與跟蹤[J]. 劉軍,后士浩,張凱,張睿,胡超超. 農業(yè)工程學報. 2019(08)
[8]水田田埂邊界支持向量機檢測方法[J]. 蔡道清,李彥明,覃程錦,劉成良. 農業(yè)機械學報. 2019(06)
[9]基于改進SSD的果園行人實時檢測方法[J]. 劉慧,張禮帥,沈躍,張健,吳邊. 農業(yè)機械學報. 2019(04)
[10]多類農田障礙物卷積神經網絡分類識別方法[J]. 薛金林,閆嘉,范博文. 農業(yè)機械學報. 2018(S1)
本文編號:3509947
本文鏈接:http://www.sikaile.net/nykjlw/nygclw/3509947.html
教材專著