基于YOLOv3的施工場景安全帽佩戴的圖像描述
發(fā)布時間:2021-02-12 19:50
近年來,因工人未佩戴安全帽而造成的施工事故頻繁發(fā)生,為降低事故發(fā)生率,對工人安全帽佩戴情況進行圖像描述的研究。當前基于神經網絡的圖像描述方法缺乏可解釋性且細節(jié)描述不充分,施工場景圖像描述的研究較為匱乏,針對該問題,提出采用YOLOv3(You Only Look Once)的檢測算法,以及基于語義規(guī)則和語句模板相結合的方法遞進式地生成安全帽佩戴的描述語句。首先,采集數據,制作安全帽佩戴檢測數據集和圖像字幕數據集;其次,使用K-means算法確定適用于該數據集的錨框參數值,用以YOLOv3網絡的訓練與檢測;再次,預定義一個語義規(guī)則,結合目標檢測結果來提取視覺概念;最后,將提取出的視覺概念填充進由圖像字幕標注生成的語句模板,以生成關于施工場景中工人安全帽佩戴的圖像描述語句。使用Ubuntu16.04系統(tǒng)和Keras深度學習框架搭建實驗環(huán)境,在自制的安全帽佩戴數據集上進行不同算法的對比實驗。實驗結果表明,所提方法不僅能夠有效界定安全帽佩戴者和未佩戴者的數量,而且在BLEU-1和CIDEr評價指標上的得分分別達到了0.722和0.957,相比其他方法分別提高了6.9%和14.8%,證明了該方法...
【文章來源】:計算機科學. 2020,47(08)北大核心
【文章頁數】:8 頁
【部分圖文】:
本文算法的流程
YOLOv3網絡結構如圖3所示。其中CBR是YOLOv3的一個基本組件,表示卷積后進行批標準化操作,用ReLU作為激活函數。另一個基本組件resn殘差塊組件,由Res_unit殘差單元所構成。CBR模塊可細分為CBR_1和CBR_3,它們主要的區(qū)別在于卷積核的大小,CBR_1所使用的卷積核的尺寸為1×1,CBR_3所使用的卷積核的尺寸則為3×3。圖3 YOLOv3網絡結構
YOLOv3網絡結構
【參考文獻】:
期刊論文
[1]基于機器視覺的安全帽自動識別技術研究[J]. 馮國臣,陳艷艷,陳寧,李鑫,宋程程. 機械設計與制造工程. 2015(10)
本文編號:3031350
【文章來源】:計算機科學. 2020,47(08)北大核心
【文章頁數】:8 頁
【部分圖文】:
本文算法的流程
YOLOv3網絡結構如圖3所示。其中CBR是YOLOv3的一個基本組件,表示卷積后進行批標準化操作,用ReLU作為激活函數。另一個基本組件resn殘差塊組件,由Res_unit殘差單元所構成。CBR模塊可細分為CBR_1和CBR_3,它們主要的區(qū)別在于卷積核的大小,CBR_1所使用的卷積核的尺寸為1×1,CBR_3所使用的卷積核的尺寸則為3×3。圖3 YOLOv3網絡結構
YOLOv3網絡結構
【參考文獻】:
期刊論文
[1]基于機器視覺的安全帽自動識別技術研究[J]. 馮國臣,陳艷艷,陳寧,李鑫,宋程程. 機械設計與制造工程. 2015(10)
本文編號:3031350
本文鏈接:http://www.sikaile.net/guanlilunwen/chengjian/3031350.html