面向車聯(lián)網(wǎng)的多路視頻人臉檢測及識別技術(shù)的研究
發(fā)布時間:2021-11-18 17:31
近些年,隨著深度學(xué)習(xí)技術(shù)的快速發(fā)展,人臉檢測與識別技術(shù)在諸多重要場景下得到了廣泛應(yīng)用。本文主要面向自動駕駛場景與未來車聯(lián)網(wǎng)設(shè)計,充分考慮了邊緣節(jié)點的計算資源受限性與實時處理等現(xiàn)實挑戰(zhàn),重點研究了輕量級的實時人臉檢測及識別相關(guān)算法,并完成嵌入式系統(tǒng)設(shè)計與實現(xiàn)。本文研究將有助于提升車聯(lián)網(wǎng)的智能監(jiān)控與目標(biāo)發(fā)現(xiàn)能力,具有重要的理論意義和實踐應(yīng)用價值。本文的主要工作如下:本文研究了復(fù)雜采集環(huán)境下的可靠檢測問題。充分考慮了車聯(lián)網(wǎng)場景下,由于非理想的圖像獲取視角和復(fù)雜的采集環(huán)境而導(dǎo)致的人臉檢測漏檢/誤檢問題,深入研究了MTCNN(Multi-task Cascaded Convolutional Networks)人臉檢測算法,提出了改進(jìn)的非極大值抑制算法,降低人臉漏檢率和誤檢率。融合了基于上下文信息訓(xùn)練的小臉(Tiny face)檢測網(wǎng)絡(luò),構(gòu)成多分支級聯(lián)神經(jīng)網(wǎng)絡(luò),提高了小臉的檢測準(zhǔn)確率。經(jīng)過實驗分析,本文中設(shè)計的人臉檢測算法有效地提高了復(fù)雜車聯(lián)網(wǎng)環(huán)境下人臉檢測準(zhǔn)確率。本文基于人臉深度特征設(shè)計了人臉識別算法。為了應(yīng)對車聯(lián)網(wǎng)邊緣終端的計算資源嚴(yán)重限制的難題,本文優(yōu)化設(shè)計了人臉深度特征提取的輕量級網(wǎng)絡(luò)模...
【文章來源】:北京工業(yè)大學(xué)北京市 211工程院校
【文章頁數(shù)】:83 頁
【學(xué)位級別】:碩士
【部分圖文】:
深度學(xué)習(xí)發(fā)展史Figure2-1HistoryofDeepLearning
采樣層一般稱為池化層。像素范圍為1* 2s s 的區(qū)域采樣過程2-4)所示:1 21 21 1* , *0 01 21( )s smn m s i n s ji jy xs s + + x 是二維輸入向量,mny 是采樣后的輸出。池化層可以減小網(wǎng)絡(luò)的計算網(wǎng)絡(luò)模型在圖像處理過程的穩(wěn)定性,如公式(2-5)所示為帶參數(shù)的池化層的表示:'( )mn mny f ay + b( a , b )是網(wǎng)絡(luò)參數(shù), f 是激活函數(shù)。卷積是圖像提取邊緣特征的過程,集圖像特征的過程,共同構(gòu)成卷積神經(jīng)網(wǎng)絡(luò)的識別單元模型,是構(gòu)建卷絡(luò)的基礎(chǔ)。卷積神經(jīng)網(wǎng)絡(luò)中的最早應(yīng)用是利用 LeNet-5[41]網(wǎng)絡(luò)模型識別手寫字符,如圖 2-2 所示,圖中1 3 5C , C ,C 是卷積層,2 4S ,S 是池化層,6F 是全連模型的輸入是 32*32 像素的手寫字符圖像。
網(wǎng)絡(luò)發(fā)展中提出了大量優(yōu)秀的網(wǎng)絡(luò)模型,這些不但是也有一定的局限性和適用場景。為了能更好高網(wǎng)絡(luò)模型的整體性能,級聯(lián)神經(jīng)網(wǎng)絡(luò)[42]的結(jié)構(gòu)多個網(wǎng)絡(luò)子系統(tǒng)。優(yōu)秀的級聯(lián)神經(jīng)網(wǎng)絡(luò)需要滿足該互相獨立,互相補(bǔ)充。(2)級聯(lián)神經(jīng)網(wǎng)絡(luò)中網(wǎng)性能的目的。同的神經(jīng)網(wǎng)絡(luò)進(jìn)行級聯(lián),可以很大程度上提升網(wǎng)雜程度,如圖 2-3 為級聯(lián)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖,從圖網(wǎng)絡(luò) 2 傳遞兩種結(jié)果值:(1)神經(jīng)網(wǎng)絡(luò) 1 傳遞訓(xùn)置到神經(jīng)網(wǎng)絡(luò) 2 中,神經(jīng)網(wǎng)絡(luò) 2 基于神經(jīng)網(wǎng)絡(luò) 1出的目標(biāo)變量更準(zhǔn)確。(2)神經(jīng)網(wǎng)絡(luò) 1 傳遞預(yù)測 2 基于預(yù)測結(jié)果值繼續(xù)學(xué)習(xí)優(yōu)化,同時傳遞初始證信息獲取的全面性。
【參考文獻(xiàn)】:
期刊論文
[1]車載信息交互系統(tǒng)信息安全[J]. 王文揚(yáng),陳正,高夕冉,胡寧,張東偉. 信息技術(shù)與信息化. 2018(12)
[2]車聯(lián)網(wǎng)生態(tài)圈的競爭力[J]. 施雪松,韋東,辛克鐸,張毅,黃亮,李繼存,劉宇,蘇雨農(nóng). 經(jīng)營者(汽車商業(yè)評論). 2018(06)
[3]適于人臉檢測的模板匹配快速算法[J]. 邵平,楊路明,黃海濱,曾耀榮. 計算機(jī)應(yīng)用. 2006(07)
本文編號:3503311
【文章來源】:北京工業(yè)大學(xué)北京市 211工程院校
【文章頁數(shù)】:83 頁
【學(xué)位級別】:碩士
【部分圖文】:
深度學(xué)習(xí)發(fā)展史Figure2-1HistoryofDeepLearning
采樣層一般稱為池化層。像素范圍為1* 2s s 的區(qū)域采樣過程2-4)所示:1 21 21 1* , *0 01 21( )s smn m s i n s ji jy xs s + + x 是二維輸入向量,mny 是采樣后的輸出。池化層可以減小網(wǎng)絡(luò)的計算網(wǎng)絡(luò)模型在圖像處理過程的穩(wěn)定性,如公式(2-5)所示為帶參數(shù)的池化層的表示:'( )mn mny f ay + b( a , b )是網(wǎng)絡(luò)參數(shù), f 是激活函數(shù)。卷積是圖像提取邊緣特征的過程,集圖像特征的過程,共同構(gòu)成卷積神經(jīng)網(wǎng)絡(luò)的識別單元模型,是構(gòu)建卷絡(luò)的基礎(chǔ)。卷積神經(jīng)網(wǎng)絡(luò)中的最早應(yīng)用是利用 LeNet-5[41]網(wǎng)絡(luò)模型識別手寫字符,如圖 2-2 所示,圖中1 3 5C , C ,C 是卷積層,2 4S ,S 是池化層,6F 是全連模型的輸入是 32*32 像素的手寫字符圖像。
網(wǎng)絡(luò)發(fā)展中提出了大量優(yōu)秀的網(wǎng)絡(luò)模型,這些不但是也有一定的局限性和適用場景。為了能更好高網(wǎng)絡(luò)模型的整體性能,級聯(lián)神經(jīng)網(wǎng)絡(luò)[42]的結(jié)構(gòu)多個網(wǎng)絡(luò)子系統(tǒng)。優(yōu)秀的級聯(lián)神經(jīng)網(wǎng)絡(luò)需要滿足該互相獨立,互相補(bǔ)充。(2)級聯(lián)神經(jīng)網(wǎng)絡(luò)中網(wǎng)性能的目的。同的神經(jīng)網(wǎng)絡(luò)進(jìn)行級聯(lián),可以很大程度上提升網(wǎng)雜程度,如圖 2-3 為級聯(lián)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖,從圖網(wǎng)絡(luò) 2 傳遞兩種結(jié)果值:(1)神經(jīng)網(wǎng)絡(luò) 1 傳遞訓(xùn)置到神經(jīng)網(wǎng)絡(luò) 2 中,神經(jīng)網(wǎng)絡(luò) 2 基于神經(jīng)網(wǎng)絡(luò) 1出的目標(biāo)變量更準(zhǔn)確。(2)神經(jīng)網(wǎng)絡(luò) 1 傳遞預(yù)測 2 基于預(yù)測結(jié)果值繼續(xù)學(xué)習(xí)優(yōu)化,同時傳遞初始證信息獲取的全面性。
【參考文獻(xiàn)】:
期刊論文
[1]車載信息交互系統(tǒng)信息安全[J]. 王文揚(yáng),陳正,高夕冉,胡寧,張東偉. 信息技術(shù)與信息化. 2018(12)
[2]車聯(lián)網(wǎng)生態(tài)圈的競爭力[J]. 施雪松,韋東,辛克鐸,張毅,黃亮,李繼存,劉宇,蘇雨農(nóng). 經(jīng)營者(汽車商業(yè)評論). 2018(06)
[3]適于人臉檢測的模板匹配快速算法[J]. 邵平,楊路明,黃海濱,曾耀榮. 計算機(jī)應(yīng)用. 2006(07)
本文編號:3503311
本文鏈接:http://www.sikaile.net/kejilunwen/daoluqiaoliang/3503311.html
教材專著