自然場(chǎng)景下基于卷積神經(jīng)網(wǎng)絡(luò)的人臉檢測(cè)與人臉性別識(shí)別研究
發(fā)布時(shí)間:2020-12-20 07:50
人臉特征因其所包含的性別、表情、身份及年齡等大量信息,在公共安全、智能服務(wù)、人機(jī)交互等領(lǐng)域顯得至關(guān)重要;谌四樚卣鞯娜四槞z測(cè)及人臉性別識(shí)別如今已是計(jì)算機(jī)視覺領(lǐng)域的研究重點(diǎn),但因自然場(chǎng)景下的人臉圖像會(huì)受到光照、姿態(tài)、表情、遮擋、尺寸等因素影響,從而影響人臉檢測(cè)與人臉性別識(shí)別效果。本文在卷積神經(jīng)網(wǎng)絡(luò)理論框架下,就自然場(chǎng)景下的人臉檢測(cè)與人臉性別識(shí)別問題開展研究,主要研究?jī)?nèi)容如下:(1)基于四級(jí)級(jí)聯(lián)全卷積神經(jīng)網(wǎng)絡(luò)的人臉檢測(cè)研究傳統(tǒng)的人臉檢測(cè)存在提取特征表征能力較差,以及特征與分類器匹配程度不高等問題。針對(duì)上述情況,本文設(shè)計(jì)了一種基于四級(jí)級(jí)聯(lián)全卷積神經(jīng)網(wǎng)絡(luò)的人臉檢測(cè)算法;舅悸肥峭ㄟ^構(gòu)建四級(jí)級(jí)聯(lián)網(wǎng)絡(luò),采用級(jí)聯(lián)分級(jí)訓(xùn)練來(lái)代替端到端訓(xùn)練,以避免只共享一個(gè)網(wǎng)絡(luò)權(quán)值的局限,進(jìn)而獲得有區(qū)分性功能的深度網(wǎng)絡(luò),提高檢測(cè)精度;另外每級(jí)網(wǎng)絡(luò)均設(shè)計(jì)為全卷積結(jié)構(gòu),用于提升檢測(cè)速率;采用自舉法進(jìn)行網(wǎng)絡(luò)模型的優(yōu)化訓(xùn)練;最后通過前三級(jí)網(wǎng)絡(luò)逐步檢測(cè)過濾,同時(shí)借助最后一級(jí)網(wǎng)絡(luò)矯正輸出來(lái)得到人臉檢測(cè)結(jié)果。實(shí)驗(yàn)結(jié)果表明,本文算法對(duì)于自然場(chǎng)景下的多姿態(tài)、遮擋、不同膚色人臉等均具有良好的魯棒性,同時(shí)檢測(cè)速度達(dá)到單張86ms,在人臉...
【文章來(lái)源】:河北工業(yè)大學(xué)天津市 211工程院校
【文章頁(yè)數(shù)】:81 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
神經(jīng)元結(jié)構(gòu)示意圖
自然場(chǎng)景下基于卷積神經(jīng)網(wǎng)絡(luò)的人臉檢測(cè)與人臉性別識(shí)別研究-10-niiixw1(2.2)則激活函數(shù)f變?yōu)槿缦露x:0,001,fy(2.3)即如果0,此時(shí)這個(gè)神經(jīng)元被激活,處于興奮狀態(tài),f1;當(dāng)0時(shí),該神經(jīng)元被抑制,f0。2.1.2前向傳播算法前向傳播算法(ForwardPropagation,FP)指在卷積神經(jīng)網(wǎng)絡(luò)中由前向后依次進(jìn)行的推導(dǎo)算法。以簡(jiǎn)單的三層神經(jīng)網(wǎng)絡(luò)為例,如圖2.2所示,三層網(wǎng)絡(luò)由輸入層、輸出層及隱藏層組成。前向傳播為首先將數(shù)據(jù)從輸入層傳遞給中間的隱藏層,之后再將隱藏層的輸出傳給輸出層,經(jīng)輸出層得到最后的輸出結(jié)果,整個(gè)前向傳播過程中每一層神經(jīng)元狀態(tài)只會(huì)對(duì)下一層的神經(jīng)元產(chǎn)生影響。圖2.2三層網(wǎng)絡(luò)結(jié)構(gòu)示意圖假定輸入層存在s個(gè)神經(jīng)元,此層神經(jīng)元用i表示;中間隱藏層有t個(gè)神經(jīng)元,用j表示;最后的輸出層有o個(gè)神經(jīng)元,用k來(lái)表示。jiv表示i與j連接時(shí)對(duì)應(yīng)的權(quán)值,kjw表示j與k連接時(shí)對(duì)應(yīng)ix的權(quán)值。用.1f表示中間隱藏層的激活函數(shù),.2f為輸出層對(duì)應(yīng)的激活函數(shù)。若輸入值為ix,其中si,,...,0那么對(duì)于隱藏層的每個(gè)神經(jīng)元輸出的值可表示為:t,...,2,1,01jxvfzsiijik(2.4)輸出層的每個(gè)神經(jīng)元輸出的值為:o,...,2,1,02kzwfyqjkkjj(2.5)
自然場(chǎng)景下基于卷積神經(jīng)網(wǎng)絡(luò)的人臉檢測(cè)與人臉性別識(shí)別研究-12-"tyufnnll)((2.12)最后,通過采用靈敏度值對(duì)每個(gè)神經(jīng)元進(jìn)行權(quán)值更新。其中第l層的誤差對(duì)于該層每一個(gè)權(quán)值的導(dǎo)數(shù)值,即該網(wǎng)絡(luò)層對(duì)應(yīng)的輸入與該層的靈敏度的叉乘值。最終神經(jīng)元權(quán)值的更新就是前面得到的偏導(dǎo)數(shù)再乘上一個(gè)負(fù)的學(xué)習(xí)率:TlllxWE1(2.13)llWEW(2.14)2.2卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)卷積神經(jīng)網(wǎng)絡(luò)是一種含有多個(gè)卷積層的深度網(wǎng)絡(luò),其中每層又由多個(gè)二維平面組成,另外二維平面又由多個(gè)神經(jīng)元組成,如圖2.3所示,其基本網(wǎng)絡(luò)結(jié)構(gòu)由卷積層、池化層、全連接層、輸出層組成。圖2.3卷積神經(jīng)網(wǎng)絡(luò)的基本網(wǎng)絡(luò)結(jié)構(gòu)卷積層可看作由許多卷積核組成的一組平行的平面,其輸出為一組平行的映射特征圖,圖像的卷積過程可以看作為原始圖像中的像素與卷積核進(jìn)行加權(quán)求和的過程。此過程是通過在輸入圖像上滑動(dòng)不同的卷積核并執(zhí)行卷積操作,其中,在每一次滑動(dòng)的位置上,輸入圖像的每個(gè)像素點(diǎn)會(huì)與卷積核完成一次乘積并求和的運(yùn)算,最終將感受野的信息投影到特征圖中。其每張?zhí)卣鲌D中的所有元素都是由一個(gè)卷積核計(jì)算得到的,即每張?zhí)卣鲌D共享了相同的權(quán)重和偏置。一般卷積核的尺寸要遠(yuǎn)小于輸入圖像的大小,然而過小的卷積核將會(huì)出現(xiàn)不完全覆蓋卷積的問題,一般使用圖像四周填補(bǔ)0像素操作來(lái)控制圖像大校設(shè)輸入圖像的尺寸為,,CWH,卷積核的維度為,,ckk21,則經(jīng)過卷積層得到的特征圖為:DSPSPWHDimHkZDW,1/2,1/2),,(KZkZZ21111(2.15)其中1H、1W、1D分別表示一張?zhí)卣鲌D的高度、寬度和深度,pZ為周邊補(bǔ)0的P填補(bǔ)
【參考文獻(xiàn)】:
期刊論文
[1]基于級(jí)聯(lián)Adaboost和神經(jīng)網(wǎng)絡(luò)主元分析算法的人臉檢測(cè)系統(tǒng)[J]. 李振雨,王好臣,王功亮,李家鵬. 科學(xué)技術(shù)與工程. 2018(01)
[2]Recent advances in efficient computation of deep convolutional neural networks[J]. Jian CHENG,Pei-song WANG,Gang LI,Qing-hao HU,Han-qing LU. Frontiers of Information Technology & Electronic Engineering. 2018(01)
[3]基于跨連卷積神經(jīng)網(wǎng)絡(luò)的性別分類模型[J]. 張婷,李玉鑑,胡海鶴,張亞紅. 自動(dòng)化學(xué)報(bào). 2016(06)
[4]基于卷積神經(jīng)網(wǎng)絡(luò)的人臉性別識(shí)別[J]. 汪濟(jì)民,陸建峰. 現(xiàn)代電子技術(shù). 2015(07)
[5]一種基于卷積神經(jīng)網(wǎng)絡(luò)的性別識(shí)別方法[J]. 蔡詩(shī)威,郭太良,姚劍敏. 電視技術(shù). 2014(19)
[6]人臉檢測(cè)技術(shù)現(xiàn)狀與發(fā)展研究[J]. 霍鵬. 科技信息. 2012(24)
[7]基于改進(jìn)BP網(wǎng)絡(luò)的人臉檢測(cè)與定位[J]. 周彩霞,易江義. 科學(xué)技術(shù)與工程. 2008(06)
[8]基于局部二元模式算子的人臉性別分類方法[J]. 孫寧,冀貞海,鄒采榮,趙力. 華中科技大學(xué)學(xué)報(bào)(自然科學(xué)版). 2007(S1)
[9]融合AdaBoost和啟發(fā)式特征搜索的人臉性別分類[J]. 朱文球,劉強(qiáng). 計(jì)算機(jī)工程. 2007(02)
[10]基于支持向量AAM迭代學(xué)習(xí)的性別分類算法[J]. 陳華杰,韋巍. 浙江大學(xué)學(xué)報(bào)(工學(xué)版). 2005(12)
本文編號(hào):2927502
【文章來(lái)源】:河北工業(yè)大學(xué)天津市 211工程院校
【文章頁(yè)數(shù)】:81 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
神經(jīng)元結(jié)構(gòu)示意圖
自然場(chǎng)景下基于卷積神經(jīng)網(wǎng)絡(luò)的人臉檢測(cè)與人臉性別識(shí)別研究-10-niiixw1(2.2)則激活函數(shù)f變?yōu)槿缦露x:0,001,fy(2.3)即如果0,此時(shí)這個(gè)神經(jīng)元被激活,處于興奮狀態(tài),f1;當(dāng)0時(shí),該神經(jīng)元被抑制,f0。2.1.2前向傳播算法前向傳播算法(ForwardPropagation,FP)指在卷積神經(jīng)網(wǎng)絡(luò)中由前向后依次進(jìn)行的推導(dǎo)算法。以簡(jiǎn)單的三層神經(jīng)網(wǎng)絡(luò)為例,如圖2.2所示,三層網(wǎng)絡(luò)由輸入層、輸出層及隱藏層組成。前向傳播為首先將數(shù)據(jù)從輸入層傳遞給中間的隱藏層,之后再將隱藏層的輸出傳給輸出層,經(jīng)輸出層得到最后的輸出結(jié)果,整個(gè)前向傳播過程中每一層神經(jīng)元狀態(tài)只會(huì)對(duì)下一層的神經(jīng)元產(chǎn)生影響。圖2.2三層網(wǎng)絡(luò)結(jié)構(gòu)示意圖假定輸入層存在s個(gè)神經(jīng)元,此層神經(jīng)元用i表示;中間隱藏層有t個(gè)神經(jīng)元,用j表示;最后的輸出層有o個(gè)神經(jīng)元,用k來(lái)表示。jiv表示i與j連接時(shí)對(duì)應(yīng)的權(quán)值,kjw表示j與k連接時(shí)對(duì)應(yīng)ix的權(quán)值。用.1f表示中間隱藏層的激活函數(shù),.2f為輸出層對(duì)應(yīng)的激活函數(shù)。若輸入值為ix,其中si,,...,0那么對(duì)于隱藏層的每個(gè)神經(jīng)元輸出的值可表示為:t,...,2,1,01jxvfzsiijik(2.4)輸出層的每個(gè)神經(jīng)元輸出的值為:o,...,2,1,02kzwfyqjkkjj(2.5)
自然場(chǎng)景下基于卷積神經(jīng)網(wǎng)絡(luò)的人臉檢測(cè)與人臉性別識(shí)別研究-12-"tyufnnll)((2.12)最后,通過采用靈敏度值對(duì)每個(gè)神經(jīng)元進(jìn)行權(quán)值更新。其中第l層的誤差對(duì)于該層每一個(gè)權(quán)值的導(dǎo)數(shù)值,即該網(wǎng)絡(luò)層對(duì)應(yīng)的輸入與該層的靈敏度的叉乘值。最終神經(jīng)元權(quán)值的更新就是前面得到的偏導(dǎo)數(shù)再乘上一個(gè)負(fù)的學(xué)習(xí)率:TlllxWE1(2.13)llWEW(2.14)2.2卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)卷積神經(jīng)網(wǎng)絡(luò)是一種含有多個(gè)卷積層的深度網(wǎng)絡(luò),其中每層又由多個(gè)二維平面組成,另外二維平面又由多個(gè)神經(jīng)元組成,如圖2.3所示,其基本網(wǎng)絡(luò)結(jié)構(gòu)由卷積層、池化層、全連接層、輸出層組成。圖2.3卷積神經(jīng)網(wǎng)絡(luò)的基本網(wǎng)絡(luò)結(jié)構(gòu)卷積層可看作由許多卷積核組成的一組平行的平面,其輸出為一組平行的映射特征圖,圖像的卷積過程可以看作為原始圖像中的像素與卷積核進(jìn)行加權(quán)求和的過程。此過程是通過在輸入圖像上滑動(dòng)不同的卷積核并執(zhí)行卷積操作,其中,在每一次滑動(dòng)的位置上,輸入圖像的每個(gè)像素點(diǎn)會(huì)與卷積核完成一次乘積并求和的運(yùn)算,最終將感受野的信息投影到特征圖中。其每張?zhí)卣鲌D中的所有元素都是由一個(gè)卷積核計(jì)算得到的,即每張?zhí)卣鲌D共享了相同的權(quán)重和偏置。一般卷積核的尺寸要遠(yuǎn)小于輸入圖像的大小,然而過小的卷積核將會(huì)出現(xiàn)不完全覆蓋卷積的問題,一般使用圖像四周填補(bǔ)0像素操作來(lái)控制圖像大校設(shè)輸入圖像的尺寸為,,CWH,卷積核的維度為,,ckk21,則經(jīng)過卷積層得到的特征圖為:DSPSPWHDimHkZDW,1/2,1/2),,(KZkZZ21111(2.15)其中1H、1W、1D分別表示一張?zhí)卣鲌D的高度、寬度和深度,pZ為周邊補(bǔ)0的P填補(bǔ)
【參考文獻(xiàn)】:
期刊論文
[1]基于級(jí)聯(lián)Adaboost和神經(jīng)網(wǎng)絡(luò)主元分析算法的人臉檢測(cè)系統(tǒng)[J]. 李振雨,王好臣,王功亮,李家鵬. 科學(xué)技術(shù)與工程. 2018(01)
[2]Recent advances in efficient computation of deep convolutional neural networks[J]. Jian CHENG,Pei-song WANG,Gang LI,Qing-hao HU,Han-qing LU. Frontiers of Information Technology & Electronic Engineering. 2018(01)
[3]基于跨連卷積神經(jīng)網(wǎng)絡(luò)的性別分類模型[J]. 張婷,李玉鑑,胡海鶴,張亞紅. 自動(dòng)化學(xué)報(bào). 2016(06)
[4]基于卷積神經(jīng)網(wǎng)絡(luò)的人臉性別識(shí)別[J]. 汪濟(jì)民,陸建峰. 現(xiàn)代電子技術(shù). 2015(07)
[5]一種基于卷積神經(jīng)網(wǎng)絡(luò)的性別識(shí)別方法[J]. 蔡詩(shī)威,郭太良,姚劍敏. 電視技術(shù). 2014(19)
[6]人臉檢測(cè)技術(shù)現(xiàn)狀與發(fā)展研究[J]. 霍鵬. 科技信息. 2012(24)
[7]基于改進(jìn)BP網(wǎng)絡(luò)的人臉檢測(cè)與定位[J]. 周彩霞,易江義. 科學(xué)技術(shù)與工程. 2008(06)
[8]基于局部二元模式算子的人臉性別分類方法[J]. 孫寧,冀貞海,鄒采榮,趙力. 華中科技大學(xué)學(xué)報(bào)(自然科學(xué)版). 2007(S1)
[9]融合AdaBoost和啟發(fā)式特征搜索的人臉性別分類[J]. 朱文球,劉強(qiáng). 計(jì)算機(jī)工程. 2007(02)
[10]基于支持向量AAM迭代學(xué)習(xí)的性別分類算法[J]. 陳華杰,韋巍. 浙江大學(xué)學(xué)報(bào)(工學(xué)版). 2005(12)
本文編號(hào):2927502
本文鏈接:http://www.sikaile.net/kejilunwen/zidonghuakongzhilunwen/2927502.html
最近更新
教材專著