基于級聯(lián)卷積神經(jīng)網(wǎng)絡(luò)的高密度人臉檢測算法研究
發(fā)布時間:2021-11-20 02:12
隨著計算機(jī)視覺技術(shù)的不斷發(fā)展,人們對于圖像處理的需求已經(jīng)逐漸從拍攝、錄影、播放等記錄性需求,發(fā)展為分類、檢測、識別、分割等智能化的需求。在這個基礎(chǔ)上,大量的計算機(jī)視覺任務(wù)和功能被不斷的提升和拓展。人臉作為近年來最為火熱的計算機(jī)視覺研究對象,吸引了大量相關(guān)的研究和工作,包括:人臉檢測、人臉識別、3D人臉重建、人臉合成、人臉跟蹤等。其中,作為人臉相關(guān)應(yīng)用的前置步驟,人臉檢測更是其中最受重視的問題之一。盡管人臉的檢測與分析等技術(shù)已經(jīng)發(fā)展多年,但仍然是計算機(jī)視覺領(lǐng)域中一個極具挑戰(zhàn)性的問題。其中最主要的原因在于,隨著人臉相關(guān)的應(yīng)用逐漸的從配合式的方案轉(zhuǎn)移到非配合式的方案,從單一人臉的串行方案轉(zhuǎn)移到高密度人臉的并行方案,對于人臉檢測技術(shù)的要求也逐漸增加。受制于環(huán)境、光照、遮擋、姿態(tài)等因素,在高密度的場景下,人臉檢測的難度大大的提升了。此外,移動便攜設(shè)備對人臉檢測的需求日趨增加,受制于移動便攜設(shè)備計算資源的局限性,這就要求人臉檢測模型盡可能的輕量化。相較于單一復(fù)雜網(wǎng)絡(luò),級聯(lián)卷積神經(jīng)網(wǎng)絡(luò)能夠高效的解決人臉檢測正負(fù)樣本不平衡問題,通過前期輕量化網(wǎng)絡(luò)快速剔除背景,大大縮短檢測用時。但其在高密度無約束場景下...
【文章來源】:華中師范大學(xué)湖北省 211工程院校 教育部直屬院校
【文章頁數(shù)】:61 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖2.1人類神經(jīng)元模型與神經(jīng)網(wǎng)絡(luò)模型??8??
?碩士學(xué)位論文??MASTER’S?THESIS??一般的,對于如圖2.1右側(cè)所展示的典型神經(jīng)網(wǎng)路模型,取其第一個隱藏層的??第一個節(jié)點(diǎn)分析,其輸入輸出可表示為:??n??y,=SC^^,x,+b\)?公式(2.1)??/=1??此處,q為對于每個輸入的權(quán)重,h為整個節(jié)點(diǎn)的偏置項,5為非線性激活??函數(shù)。通過這樣的一個個非線性單元,隨著網(wǎng)絡(luò)層數(shù)的加深,其網(wǎng)絡(luò)的擬合能力??逐漸增強(qiáng),并通過反向傳播算法進(jìn)行參數(shù)的優(yōu)化,使得網(wǎng)絡(luò)能夠通過不斷的迭代??達(dá)到一個較優(yōu)的擬合函數(shù)來處理復(fù)雜的情景變化。??上述的模型中,每一個隱藏層的節(jié)點(diǎn)都需要和上一層的所有節(jié)點(diǎn)相連接,這??樣的隱藏層被稱為全連接層。全連接層的結(jié)構(gòu)在網(wǎng)絡(luò)不斷加深時,計算量的增長??是極大地,使得這種完全的全連接方案很難被使用到網(wǎng)絡(luò)的設(shè)計中。另一方面,??在如分類、檢測等任務(wù)中,我們的目標(biāo)對象在整個圖像中往往只占據(jù)圖像中的一??小部分。因此,基于全連接式的網(wǎng)絡(luò)搭建方式就顯得有些過于冗余。基于這種現(xiàn)??象,卷積神經(jīng)網(wǎng)絡(luò)被提出用以取代全連接神經(jīng)網(wǎng)絡(luò)被用在大量的計算機(jī)視覺問題??中。如圖2-2所示,左側(cè)的全連接模式的神經(jīng)網(wǎng)絡(luò)在處理圖像的部分問題時,存在??著大量的冗余計算,而卷積神經(jīng)網(wǎng)絡(luò)通過局部連接的方式,顯著降低的所需要的??計算量。通過網(wǎng)絡(luò)層數(shù)的加深和池化層的加入,來實(shí)現(xiàn)感受野的增大,實(shí)現(xiàn)了對??圖像中的特征進(jìn)行提齲此外,卷積神經(jīng)網(wǎng)絡(luò)的另外一個特點(diǎn)就是權(quán)值共享。對??于每一個特定的卷積核,都會在整張圖像中進(jìn)行特征提取,不因為位置的變化而??變換卷積核的參數(shù),這種方式不但顯著降低了計算量,大大降低了網(wǎng)絡(luò)的訓(xùn)練難??度,也為卷積神經(jīng)網(wǎng)絡(luò)帶來了一定的平移不變性。??全
?碩士學(xué)位論文??MASTER'S?THESIS??圖2-3是由LeCun等人在1998年提出的-?個經(jīng)典的卷積神經(jīng)網(wǎng)絡(luò)模型LeNet-??5。LeNet-5作為神經(jīng)網(wǎng)絡(luò)設(shè)計最為經(jīng)典的范式之一,通過卷積神經(jīng)網(wǎng)絡(luò)來進(jìn)行特征??提取,然后通過全連接層進(jìn)行分類,在MN1ST數(shù)據(jù)集上實(shí)現(xiàn)了?98%的準(zhǔn)確率,并??因此被廣泛是用在了支票識別的領(lǐng)域中。??Cj?S|?Ci?S:?ci)?*;??(rm?t?iemsc?amp%?Umxite?outjmt??^?—一?H?H、¥?、??convoluftoo?、?&丨?con%x>h?tK??*—-J?2x2?、、?\??\?cc^atcif^?、??feanuc?extraction?classification??額Zli取?分銳弓。??圖2-3?LeNet-5卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖??2.3人臉檢測的相關(guān)算法??(1)級聯(lián)式人臉檢測算法??24-net??12-net???*?????*-???Input?Convolutional?Max-pooling?Fully-connected?Labels??Input?Convolutional?Max-pooling?Fully-connected?.?Image?layer?門??:lmag??layer?layer?layer?。撸?:?:? ̄?^?^?V?^?:??i?aL>ri^^^[X?^?-I?;??YX?txJ?;?3?channels?64?5x5?filter*?3x3?kernel?128?output*?f?〇?/nwvfac??:??:3?ch
本文編號:3506354
【文章來源】:華中師范大學(xué)湖北省 211工程院校 教育部直屬院校
【文章頁數(shù)】:61 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖2.1人類神經(jīng)元模型與神經(jīng)網(wǎng)絡(luò)模型??8??
?碩士學(xué)位論文??MASTER’S?THESIS??一般的,對于如圖2.1右側(cè)所展示的典型神經(jīng)網(wǎng)路模型,取其第一個隱藏層的??第一個節(jié)點(diǎn)分析,其輸入輸出可表示為:??n??y,=SC^^,x,+b\)?公式(2.1)??/=1??此處,q為對于每個輸入的權(quán)重,h為整個節(jié)點(diǎn)的偏置項,5為非線性激活??函數(shù)。通過這樣的一個個非線性單元,隨著網(wǎng)絡(luò)層數(shù)的加深,其網(wǎng)絡(luò)的擬合能力??逐漸增強(qiáng),并通過反向傳播算法進(jìn)行參數(shù)的優(yōu)化,使得網(wǎng)絡(luò)能夠通過不斷的迭代??達(dá)到一個較優(yōu)的擬合函數(shù)來處理復(fù)雜的情景變化。??上述的模型中,每一個隱藏層的節(jié)點(diǎn)都需要和上一層的所有節(jié)點(diǎn)相連接,這??樣的隱藏層被稱為全連接層。全連接層的結(jié)構(gòu)在網(wǎng)絡(luò)不斷加深時,計算量的增長??是極大地,使得這種完全的全連接方案很難被使用到網(wǎng)絡(luò)的設(shè)計中。另一方面,??在如分類、檢測等任務(wù)中,我們的目標(biāo)對象在整個圖像中往往只占據(jù)圖像中的一??小部分。因此,基于全連接式的網(wǎng)絡(luò)搭建方式就顯得有些過于冗余。基于這種現(xiàn)??象,卷積神經(jīng)網(wǎng)絡(luò)被提出用以取代全連接神經(jīng)網(wǎng)絡(luò)被用在大量的計算機(jī)視覺問題??中。如圖2-2所示,左側(cè)的全連接模式的神經(jīng)網(wǎng)絡(luò)在處理圖像的部分問題時,存在??著大量的冗余計算,而卷積神經(jīng)網(wǎng)絡(luò)通過局部連接的方式,顯著降低的所需要的??計算量。通過網(wǎng)絡(luò)層數(shù)的加深和池化層的加入,來實(shí)現(xiàn)感受野的增大,實(shí)現(xiàn)了對??圖像中的特征進(jìn)行提齲此外,卷積神經(jīng)網(wǎng)絡(luò)的另外一個特點(diǎn)就是權(quán)值共享。對??于每一個特定的卷積核,都會在整張圖像中進(jìn)行特征提取,不因為位置的變化而??變換卷積核的參數(shù),這種方式不但顯著降低了計算量,大大降低了網(wǎng)絡(luò)的訓(xùn)練難??度,也為卷積神經(jīng)網(wǎng)絡(luò)帶來了一定的平移不變性。??全
?碩士學(xué)位論文??MASTER'S?THESIS??圖2-3是由LeCun等人在1998年提出的-?個經(jīng)典的卷積神經(jīng)網(wǎng)絡(luò)模型LeNet-??5。LeNet-5作為神經(jīng)網(wǎng)絡(luò)設(shè)計最為經(jīng)典的范式之一,通過卷積神經(jīng)網(wǎng)絡(luò)來進(jìn)行特征??提取,然后通過全連接層進(jìn)行分類,在MN1ST數(shù)據(jù)集上實(shí)現(xiàn)了?98%的準(zhǔn)確率,并??因此被廣泛是用在了支票識別的領(lǐng)域中。??Cj?S|?Ci?S:?ci)?*;??(rm?t?iemsc?amp%?Umxite?outjmt??^?—一?H?H、¥?、??convoluftoo?、?&丨?con%x>h?tK??*—-J?2x2?、、?\??\?cc^atcif^?、??feanuc?extraction?classification??額Zli取?分銳弓。??圖2-3?LeNet-5卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖??2.3人臉檢測的相關(guān)算法??(1)級聯(lián)式人臉檢測算法??24-net??12-net???*?????*-???Input?Convolutional?Max-pooling?Fully-connected?Labels??Input?Convolutional?Max-pooling?Fully-connected?.?Image?layer?門??:lmag??layer?layer?layer?。撸?:?:? ̄?^?^?V?^?:??i?aL>ri^^^[X?^?-I?;??YX?txJ?;?3?channels?64?5x5?filter*?3x3?kernel?128?output*?f?〇?/nwvfac??:??:3?ch
本文編號:3506354
本文鏈接:http://www.sikaile.net/kejilunwen/zidonghuakongzhilunwen/3506354.html
最近更新
教材專著