基于聯(lián)合編碼和卷積網(wǎng)絡的人臉圖像特征提取方法研究
發(fā)布時間:2020-08-13 18:55
【摘要】:人臉識別是圖像處理和計算機視覺領域的一個研究熱點,經(jīng)過幾十年的發(fā)展,取得了令人矚目的進展,但是人臉識別依然是一個具有挑戰(zhàn)性的研究課題,因為圖像在拍攝過程受姿態(tài)、光照、遮擋等因素的影響,導致同類樣本的相似度減小、異類樣本的相似度提升。經(jīng)典的人臉識別系統(tǒng)主要包括檢測、對齊、特征提取和識別四個部分,其中特征提取對整個識別系統(tǒng)的性能起著至關重要的作用。本文以人臉識別為應用背景,以提升人臉特征的魯棒性與判別性為研究目標,從手工設計、淺層學習和深層學習三個層面分別提出了三種人臉特征提取方法。本文主要研究工作和創(chuàng)新點如下:(1)在手工設計特征層面,提出多方向局部線形模式聯(lián)合編碼(Joint Encoding of Multi-Direction Line Binary Patterns,JEMDLBP)。該方法包含三個核心部分:局部方向線形模式(Direction Line Binary Patterns,DLBP)、顯著模式統(tǒng)計、多方向聯(lián)合編碼。不同于LBP在局部方形空間編碼,DLBP在局部線形空間編碼;顯著模式統(tǒng)計可以在不同數(shù)據(jù)庫、不同方向自適應地提取顯著DLBP模式;多方向聯(lián)合編碼能夠捕捉多個方向DLBP模式之間的共生信息,從而提高特征的判別能力。在四個人臉識別數(shù)據(jù)庫和一個人臉表情識別數(shù)據(jù)庫上的實驗結果表明JEMDLBP特征優(yōu)于傳統(tǒng)的局部二值模式類特征。(2)在淺層學習特征層面,提出判別概率潛在語義分析模型(Discriminative probabilistic Latent Semantic Analysis,DpLSA),把傳統(tǒng)人臉特征提取問題轉化為文檔主題分析問題進行解決,為人臉特征提取提供全新的思路。針對基于主題模型p LSA的人臉識別算法所學特征P(z|d)(主題-圖像分布)缺乏明確意義的不足,本文提出的DpLSA模型利用每類訓練樣本的結構信息,給出一個新穎的單詞-主題分布初始化方法,在主題和圖像類別之間建立一一對應關系,解決了傳統(tǒng)主題模型中如何選擇合適主題個數(shù)的問題、解決了EM算法對模型初始化的敏感問題、加快了模型的訓練速度,更為重要的是Dp LSA學到的人臉圖像特征P(z|d)具有判別語義性,可以直接用于識別任務。在多個人臉數(shù)據(jù)庫上的實驗結果表明DpLSA對光照、遮擋和姿態(tài)具有較好的魯棒性。(3)在深層學習特征層面,提出級聯(lián)K-means卷積特征學習方法(Cascaded K-means Convolutional Feature Learning,CKCFL),該方法延用卷積神經(jīng)網(wǎng)絡的特征提取思想,采用輕量級深度神經(jīng)網(wǎng)絡框架,在性能與效率兩方面提供良好的折中。CKCFL對深度神經(jīng)網(wǎng)絡的三個核心模塊:濾波器學習、特征變換和池化進行深入研究。在卷積濾波器學習層,CKCFL將K-means算法用于加速卷積濾波器的學習;在非線性變換層,利用激勵函數(shù)進行非線性特征變換,實驗發(fā)現(xiàn)Tanh函數(shù)的性能優(yōu)于其他激勵函數(shù);在特征池化層采用空間金字塔二階池化,一方面能夠刻畫不同維度特征之間的相關性,克服傳統(tǒng)一階池化只統(tǒng)計每個維度特征之間信息的不足,另一方面可以同時提取局部特征和整體特征。本文詳細探討了CKCFL的不同參數(shù)和模塊對識別率的影響,在AR、Extended Yale B、FERET和LFW等受限和非受限人臉數(shù)據(jù)庫上的實驗結果證明了CKCFL特征的判別性和魯棒性。
【學位授予單位】:重慶大學
【學位級別】:博士
【學位授予年份】:2018
【分類號】:TP391.41;TP183
【圖文】:
(a) 圖 2.6 (a) 深度信念網(wǎng)Fig. 2.6 (a) Deep Brief N2.4.2 卷積神經(jīng)網(wǎng)絡卷積神經(jīng)網(wǎng)絡是 LeCun 等人[123]在于手寫數(shù)字識別,圖 2.7 顯示了兩階段① 局部感知野:由于圖像相鄰像部感知野來捕捉像素間相關信息,即接;逐層傳遞到深層,網(wǎng)絡可以學習② 權值共享:為了避免全鏈接方了權值共享策略,每一層的所有神經(jīng)取圖像的一類特征,則多種卷積濾波于兩方面,一方面減少模型參數(shù)、加速③ 特征池化層:采用池化層可以
本文編號:2792385
【學位授予單位】:重慶大學
【學位級別】:博士
【學位授予年份】:2018
【分類號】:TP391.41;TP183
【圖文】:
(a) 圖 2.6 (a) 深度信念網(wǎng)Fig. 2.6 (a) Deep Brief N2.4.2 卷積神經(jīng)網(wǎng)絡卷積神經(jīng)網(wǎng)絡是 LeCun 等人[123]在于手寫數(shù)字識別,圖 2.7 顯示了兩階段① 局部感知野:由于圖像相鄰像部感知野來捕捉像素間相關信息,即接;逐層傳遞到深層,網(wǎng)絡可以學習② 權值共享:為了避免全鏈接方了權值共享策略,每一層的所有神經(jīng)取圖像的一類特征,則多種卷積濾波于兩方面,一方面減少模型參數(shù)、加速③ 特征池化層:采用池化層可以
【參考文獻】
相關期刊論文 前1條
1 江悅;王潤生;王程;;采用上下文金字塔特征的場景分類[J];計算機輔助設計與圖形學學報;2010年08期
相關博士學位論文 前4條
1 鄢萌;軟件倉庫的主題挖掘及其在軟件維護中的應用研究[D];重慶大學;2017年
2 蘇煜;融合全局和局部特征的人臉識別[D];哈爾濱工業(yè)大學;2009年
3 鄧偉洪;高精度人臉識別算法研究[D];北京郵電大學;2009年
4 山世光;人臉識別中若干關鍵問題的研究[D];中國科學院研究生院(計算技術研究所);2004年
本文編號:2792385
本文鏈接:http://www.sikaile.net/kejilunwen/zidonghuakongzhilunwen/2792385.html
最近更新
教材專著