面向互動展示的深度學習檢測識別系統(tǒng)設(shè)計與實現(xiàn)
發(fā)布時間:2020-05-30 11:04
【摘要】:隨著科技的發(fā)展,融入科技元素的藝術(shù)形式越來越熱門,將深度學習和計算機視覺技術(shù)融入之中,具有巨大研究潛力和應(yīng)用價值。數(shù)字互動展示平臺主要由目標檢測識別系統(tǒng)和數(shù)字動畫投影系統(tǒng)組成,其中目標檢測識別系統(tǒng)是核心部分。本文針對復雜環(huán)境條件下互動展示平臺目標物塊實時識別定位問題,提出一種基于YOLO v2算法模型的快速識別定位方法,結(jié)合目標在樣本圖像中的尺寸差異,采用聚類算法提取更匹配樣本目標對象尺寸的先驗框尺度,設(shè)計并搭建了面向互動展示的深度學習檢測識別系統(tǒng)。為保證目標樣本圖像的復雜性和多樣性,采用數(shù)據(jù)增強擴充物塊訓練樣本。最后通過試驗分析驗證系統(tǒng)性能,實現(xiàn)了端到端的目標物塊檢測識別。論文的主要工作包括:針對此次項目構(gòu)建了特定項目數(shù)據(jù)集HUSTC605,數(shù)據(jù)集樣本圖像充分考慮了目標所處背景、光照強度、光照顏色等外部環(huán)境因素和拍攝角度因素,使用數(shù)據(jù)增廣方法對數(shù)據(jù)集進行擴充,擴充時對數(shù)據(jù)樣本隨機進行鏡像變換、高階插值、增加Gaussian噪聲、椒鹽噪聲和周期性噪聲;赮OLO v2模型設(shè)計了物塊實時檢測識別系統(tǒng),發(fā)展了基于卷積神經(jīng)網(wǎng)絡(luò)的物塊檢測識別算法,并基于Qt的UI圖形化界面設(shè)計了針對本文的實時檢測識別系統(tǒng)軟件用于測試系統(tǒng)的性能,軟件功能界面具體包含界面顯示控件、相機標定控件、參數(shù)設(shè)置控件等元素。分別在靜態(tài)測試集和動態(tài)隨機實時目標物塊兩個層次進行了系統(tǒng)檢測識別性能驗證,對處于若干個不同典型場景下的目標物塊進行了測試研究。試驗結(jié)果表明:在6個具有代表性的典型場景下,兩個層次的檢測識別精度結(jié)果均趨向于1;召回率均基本保持在0.95以上,單個目標具有較高的定位精度?傮w上,檢測識別系統(tǒng)檢測識別性能優(yōu)越,且具有很好的魯棒性。
【圖文】:
1 緒 論1.1 研究背景與意義隨著科技的高速發(fā)展,融入科技元素的藝術(shù)項目越來越熱門。在此背景下,將深度學習和計算機視覺技術(shù)融入之中,具有巨大的研究潛力和應(yīng)用價值。數(shù)字藝術(shù)互動展示平臺由目標檢測識別系統(tǒng)和數(shù)字動畫投影系統(tǒng)組成。通過擺放不同形狀的物塊,檢測識別系統(tǒng)檢測出目標物塊的位置,識別出目標物塊的形狀種類,并返回出位置坐標,,然后數(shù)字動畫投影系統(tǒng)根據(jù)檢測識別系統(tǒng)返回的目標類別和位置信息,在對應(yīng)的目標之間投影出道路、橋梁或車輛等動畫景觀,讓觀眾充分感受光影變化的神奇。
圖 1.3 Faster R-CNN 原理示意圖 YOLO[32],直接在輸出層輸出預測邊框的的輸入,把目標識別問題轉(zhuǎn)化為回歸問 45 幀/秒,在 VOC2007 數(shù)據(jù)集上的測現(xiàn)了改進版本 YOLO v2[33]和 v3[34],性圖 1.4 YOLO v2 算法原理示意圖分析
【學位授予單位】:華中科技大學
【學位級別】:碩士
【學位授予年份】:2019
【分類號】:TP391.41;TP18
本文編號:2688039
【圖文】:
1 緒 論1.1 研究背景與意義隨著科技的高速發(fā)展,融入科技元素的藝術(shù)項目越來越熱門。在此背景下,將深度學習和計算機視覺技術(shù)融入之中,具有巨大的研究潛力和應(yīng)用價值。數(shù)字藝術(shù)互動展示平臺由目標檢測識別系統(tǒng)和數(shù)字動畫投影系統(tǒng)組成。通過擺放不同形狀的物塊,檢測識別系統(tǒng)檢測出目標物塊的位置,識別出目標物塊的形狀種類,并返回出位置坐標,,然后數(shù)字動畫投影系統(tǒng)根據(jù)檢測識別系統(tǒng)返回的目標類別和位置信息,在對應(yīng)的目標之間投影出道路、橋梁或車輛等動畫景觀,讓觀眾充分感受光影變化的神奇。
圖 1.3 Faster R-CNN 原理示意圖 YOLO[32],直接在輸出層輸出預測邊框的的輸入,把目標識別問題轉(zhuǎn)化為回歸問 45 幀/秒,在 VOC2007 數(shù)據(jù)集上的測現(xiàn)了改進版本 YOLO v2[33]和 v3[34],性圖 1.4 YOLO v2 算法原理示意圖分析
【學位授予單位】:華中科技大學
【學位級別】:碩士
【學位授予年份】:2019
【分類號】:TP391.41;TP18
【參考文獻】
相關(guān)期刊論文 前3條
1 梁琳;何衛(wèi)平;雷蕾;張維;王紅霄;;光照不均圖像增強方法綜述[J];計算機應(yīng)用研究;2010年05期
2 梁吉業(yè);高嘉偉;常瑜;;半監(jiān)督學習研究進展[J];山西大學學報(自然科學版);2009年04期
3 李宗坤,鄭晶星,周晶;誤差反向傳播神經(jīng)網(wǎng)絡(luò)模型的改進及其應(yīng)用[J];水利學報;2003年07期
相關(guān)博士學位論文 前6條
1 林高華;基于動態(tài)紋理和卷積神經(jīng)網(wǎng)絡(luò)的視頻煙霧探測方法研究[D];中國科學技術(shù)大學;2018年
2 劉寶龍;基于圖像分析和深度學習的船名標識字符檢測與識別研究[D];浙江大學;2018年
3 高震宇;基于深度卷積神經(jīng)網(wǎng)絡(luò)的圖像分類方法研究及應(yīng)用[D];中國科學技術(shù)大學;2018年
4 陳凱;深度學習模型的高效訓練算法研究[D];中國科學技術(shù)大學;2016年
5 姚明臣;機器學習和神經(jīng)網(wǎng)絡(luò)學習中的若干問題研究[D];大連理工大學;2016年
6 駱濤;面向大數(shù)據(jù)處理的并行計算模型及性能優(yōu)化[D];中國科學技術(shù)大學;2015年
本文編號:2688039
本文鏈接:http://www.sikaile.net/kejilunwen/zidonghuakongzhilunwen/2688039.html
最近更新
教材專著