基于深度學(xué)習(xí)的交通標(biāo)志檢測與識別方法研究
發(fā)布時間:2020-12-17 07:30
交通標(biāo)志作為一項按照嚴(yán)格標(biāo)準(zhǔn)制定的道路設(shè)施,對反映當(dāng)?shù)芈窙r、疏散交通、保障安全有序的行車環(huán)境都具有重要的作用。隨著現(xiàn)代智能駕駛技術(shù)的提高,交通標(biāo)志的自動檢測與識別愈發(fā)成為無人駕駛領(lǐng)域的熱門探討課題。傳統(tǒng)的機器學(xué)習(xí)算法往往只能捕捉到交通標(biāo)志單一的特征,且大都依賴于先驗處理和經(jīng)驗判定,不具有普適性。基于深度學(xué)習(xí)的方法則通過構(gòu)造深度卷積神經(jīng)網(wǎng)絡(luò)(Deep Convolution Neural Network,DCNN)模型,能夠挖掘到交通標(biāo)志更多層次、更加豐富的語義信息,在實現(xiàn)智能檢測與識別的同時適應(yīng)了實時性和精準(zhǔn)度的要求。本文在充分研究單階和雙階目標(biāo)檢測網(wǎng)絡(luò)的優(yōu)勢和劣勢,以及各種多尺度檢測方法的基礎(chǔ)上,提出了兩種基于深度學(xué)習(xí)的交通標(biāo)志牌檢測與識別方法。一種方法通過構(gòu)建殘差SSD(Single Shot Multibox Detector)網(wǎng)絡(luò),并采用由粗到細(xì)的多尺度分塊策略完成交通標(biāo)志的檢測與識別。首先對高分辨率的交通圖像進(jìn)行多尺度分塊,然后對中等尺度下的圖像塊進(jìn)行粗檢,接著將與粗檢結(jié)果相關(guān)的其他尺度下的圖像塊放入殘差網(wǎng)絡(luò)進(jìn)行精檢。訓(xùn)練模型時利用難例挖掘方法保持正負(fù)樣本比例平衡,測試時通過...
【文章來源】:天津大學(xué)天津市 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:64 頁
【學(xué)位級別】:碩士
【部分圖文】:
不同尺寸的交通標(biāo)志實例數(shù)量分布圖
天津大學(xué)碩士學(xué)位論文6交通圖像,其中600張圖像用于訓(xùn)練,300張圖像用于測試評估。BelgiumTS數(shù)據(jù)集包含62種類別的交通標(biāo)志,每個類別包含幾百張交通標(biāo)志圖像,圖上的文字通常為荷蘭語和法語,每張圖像拍攝角度和光線條件各有不同,圖像的尺寸大約在128×128左右。中國相對大型的公開交通標(biāo)志數(shù)據(jù)集則當(dāng)屬清華大學(xué)與騰訊聯(lián)合實驗室在2016年分布的Tsinghua-Tencent-100k。與GTSRB等數(shù)據(jù)集從視頻中提取交通標(biāo)志圖像序列的方式不同,該數(shù)據(jù)集中的圖像是由6臺單反相機拍攝的全景圖像裁剪而來,并做了一些曝光調(diào)整。場景取自中國5個城市10個不同地區(qū)的真實街景,在亮度、對比度等方面都存在較大差異。裁剪圖像的數(shù)量達(dá)到了100000張,其中有10000張包含標(biāo)志牌,涵蓋了30000個交通標(biāo)志實例。圖像分辨率為2048×2048,約為GTSDB數(shù)據(jù)集的32倍。交通標(biāo)志在圖像中占比很小,大多數(shù)只有個位數(shù)百分比,如圖1-1所示[52]。此外,標(biāo)志牌各類別實例數(shù)量差異也很大,存在較嚴(yán)重的類別不平衡的問題,如圖1-2所示[52]。相比于GTSDB只能檢測四類標(biāo)志、GTSRB和BelgiumTS中的交通標(biāo)志在整幅圖像中占比超過80%,Tsinghua-Tencent-100k更能反映真實的路況信息,具有較高的研究價值,這也意味著相關(guān)研究面臨著艱巨的挑戰(zhàn)。圖1-1不同類別的交通標(biāo)志實例數(shù)量分布圖圖1-2不同尺寸的交通標(biāo)志實例數(shù)量分布圖
第2章多尺度檢測方法研究112.3多特征層提取方法多特征層提取方法即利用卷積神經(jīng)網(wǎng)絡(luò)的多尺度特性,將不同層的網(wǎng)絡(luò)特征圖進(jìn)行融合,提取多尺度特征。現(xiàn)有主流的目標(biāo)檢測網(wǎng)絡(luò),可以分為單階檢測網(wǎng)絡(luò)和雙階檢測網(wǎng)絡(luò)兩種,接下來本文將分別對它們的多特征層提取方法進(jìn)行介紹。2.3.1單階檢測網(wǎng)絡(luò)單階檢測網(wǎng)絡(luò)是指不需要區(qū)域建議,直接產(chǎn)生物體的類別概率和預(yù)測坐標(biāo)值,單次檢測即可直接得到最終檢測結(jié)果的網(wǎng)絡(luò)。單階檢測網(wǎng)絡(luò)把目標(biāo)檢測看作一個回歸問題,通過一個回歸分支由整張圖片的所有像素得到目標(biāo)包圍框(boundingbox,bbox)的坐標(biāo);把目標(biāo)識別看作是一個分類問題,通過一個分類分支得到包圍框中包含目標(biāo)的置信度和類別概率,從而得到目標(biāo)類別。由于不需要額外的特征提取過程和階段網(wǎng)絡(luò),實現(xiàn)了end-to-end的檢測,速度上十分快。比較經(jīng)典的網(wǎng)絡(luò)有YOLO、SSD、RetinaNet等。最初的YOLO網(wǎng)絡(luò)通過將最后一層特征圖劃分為S×S個格子,分別以每個小格為中心在整個特征圖范圍內(nèi)圈定2個不同的候選框進(jìn)行預(yù)測。設(shè)定的候選框具有不同的尺寸,從而達(dá)到多尺度檢測的目的。YOLO分格與候選框預(yù)測如圖2-1所示[28]。圖2-1YOLO分格與候選框預(yù)測示意圖
本文編號:2921650
【文章來源】:天津大學(xué)天津市 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:64 頁
【學(xué)位級別】:碩士
【部分圖文】:
不同尺寸的交通標(biāo)志實例數(shù)量分布圖
天津大學(xué)碩士學(xué)位論文6交通圖像,其中600張圖像用于訓(xùn)練,300張圖像用于測試評估。BelgiumTS數(shù)據(jù)集包含62種類別的交通標(biāo)志,每個類別包含幾百張交通標(biāo)志圖像,圖上的文字通常為荷蘭語和法語,每張圖像拍攝角度和光線條件各有不同,圖像的尺寸大約在128×128左右。中國相對大型的公開交通標(biāo)志數(shù)據(jù)集則當(dāng)屬清華大學(xué)與騰訊聯(lián)合實驗室在2016年分布的Tsinghua-Tencent-100k。與GTSRB等數(shù)據(jù)集從視頻中提取交通標(biāo)志圖像序列的方式不同,該數(shù)據(jù)集中的圖像是由6臺單反相機拍攝的全景圖像裁剪而來,并做了一些曝光調(diào)整。場景取自中國5個城市10個不同地區(qū)的真實街景,在亮度、對比度等方面都存在較大差異。裁剪圖像的數(shù)量達(dá)到了100000張,其中有10000張包含標(biāo)志牌,涵蓋了30000個交通標(biāo)志實例。圖像分辨率為2048×2048,約為GTSDB數(shù)據(jù)集的32倍。交通標(biāo)志在圖像中占比很小,大多數(shù)只有個位數(shù)百分比,如圖1-1所示[52]。此外,標(biāo)志牌各類別實例數(shù)量差異也很大,存在較嚴(yán)重的類別不平衡的問題,如圖1-2所示[52]。相比于GTSDB只能檢測四類標(biāo)志、GTSRB和BelgiumTS中的交通標(biāo)志在整幅圖像中占比超過80%,Tsinghua-Tencent-100k更能反映真實的路況信息,具有較高的研究價值,這也意味著相關(guān)研究面臨著艱巨的挑戰(zhàn)。圖1-1不同類別的交通標(biāo)志實例數(shù)量分布圖圖1-2不同尺寸的交通標(biāo)志實例數(shù)量分布圖
第2章多尺度檢測方法研究112.3多特征層提取方法多特征層提取方法即利用卷積神經(jīng)網(wǎng)絡(luò)的多尺度特性,將不同層的網(wǎng)絡(luò)特征圖進(jìn)行融合,提取多尺度特征。現(xiàn)有主流的目標(biāo)檢測網(wǎng)絡(luò),可以分為單階檢測網(wǎng)絡(luò)和雙階檢測網(wǎng)絡(luò)兩種,接下來本文將分別對它們的多特征層提取方法進(jìn)行介紹。2.3.1單階檢測網(wǎng)絡(luò)單階檢測網(wǎng)絡(luò)是指不需要區(qū)域建議,直接產(chǎn)生物體的類別概率和預(yù)測坐標(biāo)值,單次檢測即可直接得到最終檢測結(jié)果的網(wǎng)絡(luò)。單階檢測網(wǎng)絡(luò)把目標(biāo)檢測看作一個回歸問題,通過一個回歸分支由整張圖片的所有像素得到目標(biāo)包圍框(boundingbox,bbox)的坐標(biāo);把目標(biāo)識別看作是一個分類問題,通過一個分類分支得到包圍框中包含目標(biāo)的置信度和類別概率,從而得到目標(biāo)類別。由于不需要額外的特征提取過程和階段網(wǎng)絡(luò),實現(xiàn)了end-to-end的檢測,速度上十分快。比較經(jīng)典的網(wǎng)絡(luò)有YOLO、SSD、RetinaNet等。最初的YOLO網(wǎng)絡(luò)通過將最后一層特征圖劃分為S×S個格子,分別以每個小格為中心在整個特征圖范圍內(nèi)圈定2個不同的候選框進(jìn)行預(yù)測。設(shè)定的候選框具有不同的尺寸,從而達(dá)到多尺度檢測的目的。YOLO分格與候選框預(yù)測如圖2-1所示[28]。圖2-1YOLO分格與候選框預(yù)測示意圖
本文編號:2921650
本文鏈接:http://www.sikaile.net/kejilunwen/zidonghuakongzhilunwen/2921650.html
最近更新
教材專著