基于深度學(xué)習(xí)的臉耳多模態(tài)身份驗(yàn)證研究與系統(tǒng)設(shè)計(jì)
發(fā)布時(shí)間:2020-12-14 07:56
隨著人工智能技術(shù)的快速發(fā)展,生物特征識(shí)別技術(shù)在教育、醫(yī)療、軍事、金融等各個(gè)領(lǐng)域得到廣泛應(yīng)用。盡管如此,在實(shí)際應(yīng)用場(chǎng)合中,基于單一生物特征的生物特征識(shí)別系統(tǒng)常受到噪聲干擾、非普遍性和抗哄騙能力差等諸多因素的制約,而利用多種生物特征信息的多模態(tài)生物特征識(shí)別系統(tǒng)可在一定程度上緩解單模態(tài)生物特征識(shí)別系統(tǒng)的部分缺陷,并且通過(guò)多模態(tài)生物特征融合顯著提高系統(tǒng)識(shí)別性能。人臉識(shí)別采用非接觸式圖像采集,符合人類視覺(jué)識(shí)別習(xí)慣,并可隱蔽操作,應(yīng)用場(chǎng)景和范圍比指紋、虹膜識(shí)別等更加豐富和廣泛。但人臉易受光照、姿態(tài)、表情、化妝和年齡等因素影響,人耳位于人臉附近,耳形狀穩(wěn)定,幾乎不受表情和年齡的影響,結(jié)合人臉與人耳進(jìn)行多模態(tài)識(shí)別,可提高系統(tǒng)的準(zhǔn)確性和抗干擾能力,并增加可識(shí)別的角度范圍。本文著重研究基于深度學(xué)習(xí)的人臉人耳檢測(cè)技術(shù)和多模態(tài)融合識(shí)別,并設(shè)計(jì)和實(shí)現(xiàn)了一個(gè)基于臉耳多模態(tài)識(shí)別的考生簽到系統(tǒng)。在人臉人耳檢測(cè)方面,本文將頭部圖像劃分和定義為人臉區(qū)域、人耳區(qū)域和頭部區(qū)域,標(biāo)注三類目標(biāo)訓(xùn)練樣本,采用Mask Scoring R-CNN檢測(cè)技術(shù)框架進(jìn)行訓(xùn)練和檢測(cè)。由于人耳目標(biāo)較小,訓(xùn)練樣本有限,誤檢率較高。針對(duì)該問(wèn)題,提出...
【文章來(lái)源】:西華大學(xué)四川省
【文章頁(yè)數(shù)】:75 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
常見(jiàn)的用于生物特征識(shí)別的生物特征示例
西華大學(xué)碩士學(xué)位論文13圖2.1MaskScoringR-CNN流程圖Fig.2.1FlowchartofMaskScoringR-CNN2.1.1主干網(wǎng)絡(luò)在目標(biāo)檢測(cè)中,特征提取至關(guān)重要,在MaskScoringR-CNN中主干網(wǎng)絡(luò)(Backbonenetwork)一般選用深度卷積神經(jīng)網(wǎng)絡(luò)提取圖像特征,現(xiàn)在卷積神經(jīng)網(wǎng)絡(luò)的發(fā)展趨勢(shì)就是:足夠深、足夠廣。足夠深就是網(wǎng)絡(luò)層數(shù)足夠深,深層網(wǎng)絡(luò)大多數(shù)情況下較淺層網(wǎng)絡(luò)性能都會(huì)有足夠的提升。足夠廣就意味著要從多尺度(Multi-Scale)的特征進(jìn)行,多尺度可以很好地解決不同分辨率大小的目標(biāo)。然而網(wǎng)絡(luò)模型深度的加深,帶來(lái)的不一定是性能的提升,梯度消失和網(wǎng)絡(luò)退化隨之而來(lái),訓(xùn)練難度加大。為了處理上述問(wèn)題,訓(xùn)練網(wǎng)絡(luò)時(shí)加速收斂,引入了殘差神經(jīng)網(wǎng)絡(luò)(ResNet)。圖2.2是ResNet的18層網(wǎng)絡(luò)的結(jié)構(gòu)示意圖。
基于深度學(xué)習(xí)的臉耳多模態(tài)身份驗(yàn)證研究與系統(tǒng)設(shè)計(jì)16公式(2.1)所示。H)()x(xxF(2.1)除此之外,殘差網(wǎng)絡(luò)關(guān)注特征矩陣維度的變化,殘差網(wǎng)絡(luò)利用11卷積和BatchNormalization層沒(méi)有增加新的學(xué)習(xí)參數(shù)的情況下,加速訓(xùn)練過(guò)程中網(wǎng)絡(luò)的收斂。2.1.2特征金字塔(FPN)多尺度問(wèn)題常用的解決方案就是構(gòu)造多尺度金字塔。特征金字塔網(wǎng)絡(luò)(FPN)是2017年由Facebook提出的用于多尺度檢測(cè)的算法[50],通過(guò)自上而下和自上而下的網(wǎng)絡(luò)連接方式,計(jì)算量沒(méi)有明顯的增加,實(shí)時(shí)性基本不受影響,大幅提升對(duì)小尺度目標(biāo)的檢測(cè)性能。由此本文采用的MaskScoringR-CNN中引入了多尺度的特征金字塔網(wǎng)絡(luò)(FeaturePyramidNetwork,F(xiàn)PN),網(wǎng)絡(luò)可以分為由自下而上和自上而下兩條通道側(cè)向連接,如圖2.3所示。圖2.3特征金字塔網(wǎng)絡(luò)結(jié)構(gòu)圖Fig.2.3StructurechartofFeaturizedPyramidNetwork(1)自下而上(Bottom-up)的過(guò)程就是卷積神經(jīng)網(wǎng)絡(luò)的正向傳播過(guò)程,將處理后的圖片送入特征網(wǎng)絡(luò)經(jīng)過(guò)卷積運(yùn)算后,隨著層數(shù)的增多,空間分辨率減少,從圖像中挖掘到更多的語(yǔ)義信息。(2)自上而下(Top-down)和側(cè)向連接的過(guò)程是得到的深層特征圖通過(guò)上采樣操作一步步還原回去,保留特征圖的語(yǔ)義信息,同時(shí)增大了特征圖的尺寸。通過(guò)側(cè)向連接將自下而上和自上而下的通道進(jìn)行側(cè)向連接,側(cè)向連接的時(shí)候按照逐元素相加的規(guī)則進(jìn)
本文編號(hào):2916103
【文章來(lái)源】:西華大學(xué)四川省
【文章頁(yè)數(shù)】:75 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
常見(jiàn)的用于生物特征識(shí)別的生物特征示例
西華大學(xué)碩士學(xué)位論文13圖2.1MaskScoringR-CNN流程圖Fig.2.1FlowchartofMaskScoringR-CNN2.1.1主干網(wǎng)絡(luò)在目標(biāo)檢測(cè)中,特征提取至關(guān)重要,在MaskScoringR-CNN中主干網(wǎng)絡(luò)(Backbonenetwork)一般選用深度卷積神經(jīng)網(wǎng)絡(luò)提取圖像特征,現(xiàn)在卷積神經(jīng)網(wǎng)絡(luò)的發(fā)展趨勢(shì)就是:足夠深、足夠廣。足夠深就是網(wǎng)絡(luò)層數(shù)足夠深,深層網(wǎng)絡(luò)大多數(shù)情況下較淺層網(wǎng)絡(luò)性能都會(huì)有足夠的提升。足夠廣就意味著要從多尺度(Multi-Scale)的特征進(jìn)行,多尺度可以很好地解決不同分辨率大小的目標(biāo)。然而網(wǎng)絡(luò)模型深度的加深,帶來(lái)的不一定是性能的提升,梯度消失和網(wǎng)絡(luò)退化隨之而來(lái),訓(xùn)練難度加大。為了處理上述問(wèn)題,訓(xùn)練網(wǎng)絡(luò)時(shí)加速收斂,引入了殘差神經(jīng)網(wǎng)絡(luò)(ResNet)。圖2.2是ResNet的18層網(wǎng)絡(luò)的結(jié)構(gòu)示意圖。
基于深度學(xué)習(xí)的臉耳多模態(tài)身份驗(yàn)證研究與系統(tǒng)設(shè)計(jì)16公式(2.1)所示。H)()x(xxF(2.1)除此之外,殘差網(wǎng)絡(luò)關(guān)注特征矩陣維度的變化,殘差網(wǎng)絡(luò)利用11卷積和BatchNormalization層沒(méi)有增加新的學(xué)習(xí)參數(shù)的情況下,加速訓(xùn)練過(guò)程中網(wǎng)絡(luò)的收斂。2.1.2特征金字塔(FPN)多尺度問(wèn)題常用的解決方案就是構(gòu)造多尺度金字塔。特征金字塔網(wǎng)絡(luò)(FPN)是2017年由Facebook提出的用于多尺度檢測(cè)的算法[50],通過(guò)自上而下和自上而下的網(wǎng)絡(luò)連接方式,計(jì)算量沒(méi)有明顯的增加,實(shí)時(shí)性基本不受影響,大幅提升對(duì)小尺度目標(biāo)的檢測(cè)性能。由此本文采用的MaskScoringR-CNN中引入了多尺度的特征金字塔網(wǎng)絡(luò)(FeaturePyramidNetwork,F(xiàn)PN),網(wǎng)絡(luò)可以分為由自下而上和自上而下兩條通道側(cè)向連接,如圖2.3所示。圖2.3特征金字塔網(wǎng)絡(luò)結(jié)構(gòu)圖Fig.2.3StructurechartofFeaturizedPyramidNetwork(1)自下而上(Bottom-up)的過(guò)程就是卷積神經(jīng)網(wǎng)絡(luò)的正向傳播過(guò)程,將處理后的圖片送入特征網(wǎng)絡(luò)經(jīng)過(guò)卷積運(yùn)算后,隨著層數(shù)的增多,空間分辨率減少,從圖像中挖掘到更多的語(yǔ)義信息。(2)自上而下(Top-down)和側(cè)向連接的過(guò)程是得到的深層特征圖通過(guò)上采樣操作一步步還原回去,保留特征圖的語(yǔ)義信息,同時(shí)增大了特征圖的尺寸。通過(guò)側(cè)向連接將自下而上和自上而下的通道進(jìn)行側(cè)向連接,側(cè)向連接的時(shí)候按照逐元素相加的規(guī)則進(jìn)
本文編號(hào):2916103
本文鏈接:http://www.sikaile.net/kejilunwen/zidonghuakongzhilunwen/2916103.html
最近更新
教材專著