任意姿態(tài)人臉表情識(shí)別方法研究
發(fā)布時(shí)間:2017-04-25 14:04
本文關(guān)鍵詞:任意姿態(tài)人臉表情識(shí)別方法研究,由筆耕文化傳播整理發(fā)布。
【摘要】:研發(fā)可用于自然場(chǎng)景中的自動(dòng)人臉表情識(shí)別系統(tǒng)是人機(jī)交互的重要目標(biāo)之一,然而自然場(chǎng)景中人的頭部是不斷運(yùn)動(dòng)的,因此想要把人臉表情識(shí)別系統(tǒng)應(yīng)用于現(xiàn)實(shí)場(chǎng)景中首先要解決圖像中不斷變化的人臉姿態(tài)問(wèn)題。現(xiàn)階段任意姿態(tài)人臉表情識(shí)別系統(tǒng)主要可以分為三類(lèi):1)分別為每種人臉姿態(tài)的表情圖像建立對(duì)應(yīng)的表情識(shí)別模型;2)忽略姿態(tài)因素,為各種姿態(tài)的人臉表情圖像建立單一的表情識(shí)別模型;3)通過(guò)建立不同姿態(tài)間映射關(guān)系進(jìn)行姿態(tài)歸一化,為不同姿態(tài)的人臉表情圖像建立統(tǒng)一的表情識(shí)別模型。第一種多分類(lèi)器方式需要根據(jù)姿態(tài)的不同訓(xùn)練眾多模型,且需要為每個(gè)模型單獨(dú)調(diào)節(jié)參數(shù)。第二種單一分類(lèi)器無(wú)法去除姿態(tài)的干擾信息也必然會(huì)影響模型最終的表情識(shí)別率。第三種統(tǒng)一分類(lèi)器多是通過(guò)定位人臉關(guān)鍵特征點(diǎn)學(xué)習(xí)非正臉圖像與正臉圖像映射關(guān)系的方法提取對(duì)姿態(tài)具有魯棒性的特征,從而使任意姿態(tài)的人臉表情識(shí)別任務(wù)可以在一個(gè)統(tǒng)一的模型中完成。這很大程度依賴(lài)于關(guān)鍵特征點(diǎn)定位的準(zhǔn)確性,尤其是側(cè)臉狀態(tài)下的關(guān)鍵特征點(diǎn)定位目前仍然存在很大困難。因此為了解決這三種方法所存在的問(wèn)題,本文提出基于層次狄利克雷模型和快速自動(dòng)編碼器的任意姿態(tài)人臉表情識(shí)別方法。文章的主要內(nèi)容如下:(1)提出基于層次狄利克雷模型的任意姿態(tài)人臉?lè)指、人臉表情識(shí)別方法。針對(duì)當(dāng)人臉表情圖像中人臉姿態(tài)變化復(fù)雜時(shí)需要為每種姿態(tài)分別建立模型和調(diào)節(jié)參數(shù)而引起的模型效率低的問(wèn)題,以及忽略姿態(tài)因素為不同姿態(tài)建立單一模型帶來(lái)的模型識(shí)別率低的問(wèn)題,提出基于層次狄利克雷模型的任意姿態(tài)人臉關(guān)鍵區(qū)域分割、人臉表情識(shí)別方法。該方法通過(guò)將姿態(tài)因素加入傳統(tǒng)狄利克雷模型中,由主題模型學(xué)習(xí)中間層特征,使模型在學(xué)習(xí)過(guò)程中可以共享不同姿態(tài)之間的特征信息,從而使任意姿態(tài)人臉表情識(shí)別任務(wù)可在一個(gè)完整統(tǒng)一的模型中完成。通過(guò)構(gòu)建人臉關(guān)鍵區(qū)域分割、人臉表情識(shí)別的層次結(jié)構(gòu)得到一種從粗糙到精細(xì)的表情識(shí)別模型,從而提高模型的效率。通過(guò)結(jié)合局部紋理特征和其所對(duì)應(yīng)的幾何特征學(xué)習(xí)得到特征之間的幾何約束,從而提高模型的穩(wěn)定性與識(shí)別率。在RAFD和BU-3DFE兩個(gè)公開(kāi)人臉表情數(shù)據(jù)庫(kù)上的實(shí)驗(yàn)結(jié)果表明,與現(xiàn)階段所提方法在同等條件下相比,該方法能有效解決人臉表情圖像中不斷變化的姿態(tài)問(wèn)題,將最終的平均表情識(shí)別率提高了0.4%~16.2%。(2)提出基于空間連貫特征的快速任意姿態(tài)人臉表情識(shí)別方法。針對(duì)人臉表情識(shí)別中出現(xiàn)的由于特征點(diǎn)定位不準(zhǔn)確而影響任意姿態(tài)人臉表情識(shí)別結(jié)果的問(wèn)題,以及層次狄利克雷模型中隨著姿態(tài)不斷增加而引起模型復(fù)雜度逐漸增加的問(wèn)題,提出基于空間連貫特征的快速任意姿態(tài)人臉表情識(shí)別方法。該方法通過(guò)將任意姿態(tài)的非正臉圖像從像素級(jí)別將其映射為所對(duì)應(yīng)的正臉圖像,避免了特征點(diǎn)定位不準(zhǔn)確的問(wèn)題。通過(guò)基于對(duì)表情貢獻(xiàn)較大的關(guān)鍵區(qū)域的無(wú)監(jiān)督特征學(xué)習(xí)方法提取對(duì)光照、圖像扭曲等因素更具魯棒性的特征,提高了模型的效率以及表情的識(shí)別率。通過(guò)將無(wú)監(jiān)督特征學(xué)習(xí)得到的學(xué)習(xí)型特征與其所對(duì)應(yīng)的關(guān)鍵區(qū)域的幾何信息相結(jié)合,形成具有空間連貫特性的混合特征,提高了模型的效率和穩(wěn)定性。在公開(kāi)的包含任意姿態(tài)人臉表情識(shí)別圖像的標(biāo)準(zhǔn)庫(kù)BU-3DFE上,從多個(gè)方面驗(yàn)證了所提方法的有效性,實(shí)驗(yàn)結(jié)果表明該方法所取得的人臉表情識(shí)別準(zhǔn)確率高于當(dāng)前最好方法,從最終表情識(shí)別結(jié)果來(lái)比較在當(dāng)前最高水平的基礎(chǔ)上又提高了1.6%。(3)設(shè)計(jì)實(shí)現(xiàn)人臉表情識(shí)別GUI界面。采用MATLAB與C++混合編程的方法實(shí)現(xiàn)了人臉表情識(shí)別的GUI界面,包括人臉檢測(cè)、人臉關(guān)鍵區(qū)域分割,表情識(shí)別等功能均在此原型系統(tǒng)中得以體現(xiàn)。
【關(guān)鍵詞】:人臉表情識(shí)別 任意姿態(tài) 狄利克雷模型 自動(dòng)編碼器 無(wú)監(jiān)督特征學(xué)習(xí)
【學(xué)位授予單位】:江蘇大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類(lèi)號(hào)】:TP391.41
【目錄】:
- 摘要4-6
- ABSTRACT6-10
- 第一章 緒論10-17
- 1.1 研究背景和意義10-11
- 1.2 國(guó)內(nèi)外研究現(xiàn)狀11-13
- 1.3 人臉表情識(shí)別方法中的難點(diǎn)13-15
- 1.4 論文主要工作15-16
- 1.5 論文的組織結(jié)構(gòu)16-17
- 第二章 任意姿態(tài)人臉表情識(shí)別相關(guān)技術(shù)及發(fā)展現(xiàn)狀17-30
- 2.1 任意姿態(tài)人臉表情識(shí)別概述17-21
- 2.1.1 任意姿態(tài)人臉表情識(shí)別過(guò)程簡(jiǎn)介17
- 2.1.2 人臉檢測(cè)方法研究現(xiàn)狀17-18
- 2.1.3 人臉預(yù)處理及姿態(tài)歸一化方法研究現(xiàn)狀18-19
- 2.1.4 人臉特征提取與表示方法研究現(xiàn)狀19-21
- 2.1.5 任意姿態(tài)人臉表情識(shí)別方法研究現(xiàn)狀21
- 2.2 狄利克雷模型21-26
- 2.2.1 狄利克雷模型概述21-25
- 2.2.2 狄利克雷模型與人臉表情識(shí)別的關(guān)系25-26
- 2.3 自動(dòng)編碼器26-29
- 2.3.1 自動(dòng)編碼器概述26-29
- 2.3.2 自動(dòng)編碼器與人臉表情識(shí)別的關(guān)系29
- 2.4 本章小結(jié)29-30
- 第三章 基于層次狄利克雷模型的任意姿態(tài)人臉?lè)指、表情識(shí)別方法30-46
- 3.1 概述30-31
- 3.2 基于層次狄利克雷模型的人臉表情識(shí)別31-36
- 3.2.1 基于狄利克雷模型的人臉?lè)指?/span>31-34
- 3.2.2 基于狄利克雷模型的人臉表情識(shí)別34
- 3.2.3 模型推導(dǎo)34-36
- 3.2.4 貝葉斯分類(lèi)36
- 3.3 表情特征提取與表示36-38
- 3.3.1 人臉檢測(cè)與姿態(tài)估計(jì)37
- 3.3.2 特征提取與表示37
- 3.3.3 中間層特征37-38
- 3.4 實(shí)驗(yàn)結(jié)果與分析38-45
- 3.4.1 表情庫(kù)與實(shí)驗(yàn)設(shè)置38-39
- 3.4.2 參數(shù)選擇39-40
- 3.4.3 實(shí)驗(yàn)結(jié)果分析與比較40-45
- 3.5 本章小結(jié)45-46
- 第四章 基于空間連貫特征的快速任意姿態(tài)人臉表情識(shí)別方法46-55
- 4.1 概述46-47
- 4.2 正臉圖像合成47-48
- 4.2.1 特征點(diǎn)定位48
- 4.2.2 估計(jì)投影矩陣&合成正臉圖像48
- 4.3 基于空間連貫特征的快速任意姿態(tài)人臉表情識(shí)別方法48-50
- 4.3.1 關(guān)鍵區(qū)域采樣49
- 4.3.2 空間連貫性特征的提取與表示49-50
- 4.3.3 任意姿態(tài)人臉表情識(shí)別50
- 4.4 實(shí)驗(yàn)與結(jié)果分析50-54
- 4.4.1 表情庫(kù)與實(shí)驗(yàn)設(shè)置50-51
- 4.4.2 參數(shù)選擇51-52
- 4.4.3 實(shí)驗(yàn)結(jié)果分析與比較52-54
- 4.5 本章小結(jié)54-55
- 第五章 原型系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)55-62
- 5.1 系統(tǒng)的運(yùn)行環(huán)境55
- 5.2 GUI界面層次結(jié)構(gòu)55-57
- 5.3 任意姿態(tài)人臉表情識(shí)別系統(tǒng)實(shí)現(xiàn)57-61
- 5.3.1 系統(tǒng)軟件實(shí)現(xiàn)57
- 5.3.2 系統(tǒng)運(yùn)行界面展示57-61
- 5.4 本章小結(jié)61-62
- 第六章 總結(jié)與展望62-64
- 6.1 總結(jié)62-63
- 6.2 展望63-64
- 參考文獻(xiàn)64-69
- 致謝69-70
- 在學(xué)期間發(fā)表的學(xué)術(shù)論文及其他科研成果70
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 孫蔚;王波;;人臉表情識(shí)別綜述[J];電腦知識(shí)與技術(shù);2012年01期
2 楊梅娟;;人臉表情識(shí)別綜述[J];甘肅科技;2006年04期
3 劉曉e,
本文編號(hào):326436
本文鏈接:http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/326436.html
最近更新
教材專(zhuān)著