基于離散和連續(xù)模型的視頻人臉表情識別研究
發(fā)布時間:2022-08-12 11:13
面部表情承載著人類的情感信息,被視為是超越了種族和文化多樣性的一種通用語言。深入研究人臉表情識別,有助于更好地理解人類的情感狀態(tài)和心理活動,在人機交互中實現更智能的互動。動態(tài)表情序列蘊含了豐富的時空域信息,能夠有效地反映面部表情的變化過程,因此基于視頻的表情識別研究成為新一代人機交互系統(tǒng)的重要研究方向。人臉表情識別分為離散和連續(xù)兩種表示模型,這兩種情感模型在社會生活的諸多領域都有著巨大的應用價值。例如零售行業(yè)通過識別消費者購物時的基本表情,評估顧客對商品的喜好;在線教育行業(yè)應用連續(xù)維度表情識別監(jiān)測學員狀態(tài),細化課程質量分析。本文研究了視頻序列中的離散表情分類與連續(xù)表情回歸問題,主要工作包含以下兩個方面:(1)長短期記憶網絡(LSTM)廣泛應用于視頻序列的人臉表情識別,針對單層LSTM表達能力有限,在解決復雜問題時其泛化能力易受制約的不足,提出一種層級注意力模型:使用堆疊LSTM學習時間序列數據的分層表示,利用自注意力機制構建差異化的層級關系,并通過構造懲罰項,進一步結合損失函數優(yōu)化網絡結構,提升網絡性能。在CK+以及MMI數據庫上的實驗結果表明,由于構建了良好的層次級別特征,時間序列上...
【文章頁數】:66 頁
【學位級別】:碩士
【文章目錄】:
致謝
摘要
abstract
第一章 緒論
1.1 課題研究背景與意義
1.2 人臉表情識別研究現狀
1.3 人臉表情數據集
1.4 人臉表情識別的研究難點
1.5 論文主要內容及結構安排
第二章 人臉表情識別理論基礎
2.1 人臉表情識別流程
2.2 人臉檢測與定位
2.3 圖像預處理
2.3.1 噪聲處理
2.3.2 直方圖均衡化
2.3.3 幾何變換
2.4 特征提取
2.5 表情的分類與回歸
2.6 本章小結
第三章 基于層級注意力模型的視頻序列表情識別
3.1 引言
3.2 層級注意力模型的CNN-LSTM架構設計
3.2.1 LSTM
3.2.2 注意力機制
3.2.3 自注意力機制
3.2.4 層級注意力模型
3.2.5 懲罰項
3.3 層級注意力模型的CNN-LSTM架構實現
3.3.1 視頻預處理
3.3.2 預訓練CNN
3.3.3 應用層級注意力機制的LSTM
3.4 實驗設計與結果分析
3.4.1 環(huán)境配置及實驗數據庫
3.4.2 實驗結果分析
3.5 本章小結
第四章 基于自輔助學習的視頻維度情感識別
4.1 引言
4.2 自輔助學習模型的構建
4.2.1 多任務網絡
4.2.2 標簽生成網絡
4.2.3 網絡訓練策略
4.3 實驗設計與結果分析
4.3.1 評估度量
4.3.2 環(huán)境配置及實驗數據庫
4.3.3 實驗結果分析
4.4 本章小結
第五章 總結與展望
5.1 本文工作總結
5.2 未來展望
參考文獻
攻讀碩士期間的學術活動以及成果情況
【參考文獻】:
期刊論文
[1]融合局部紋理和形狀特征的人臉表情識別[J]. 胡敏,滕文娣,王曉華,許良鳳,楊娟. 電子與信息學報. 2018(06)
[2]融合時空特征的視頻序列表情識別[J]. 王曉華,夏晨,胡敏,任福繼. 電子與信息學報. 2018(03)
[3]基于ROI-KNN卷積神經網絡的面部表情識別[J]. 孫曉,潘汀,任福繼. 自動化學報. 2016(06)
[4]基于隱馬爾可夫模型(HMM)的人臉表情識別[J]. 王沖,李一民,楊霞. 通信技術. 2007(11)
[5]基于多模板匹配的單人臉檢測[J]. 梁路宏,艾海舟,何克忠. 中國圖象圖形學報. 1999(10)
本文編號:3675772
【文章頁數】:66 頁
【學位級別】:碩士
【文章目錄】:
致謝
摘要
abstract
第一章 緒論
1.1 課題研究背景與意義
1.2 人臉表情識別研究現狀
1.3 人臉表情數據集
1.4 人臉表情識別的研究難點
1.5 論文主要內容及結構安排
第二章 人臉表情識別理論基礎
2.1 人臉表情識別流程
2.2 人臉檢測與定位
2.3 圖像預處理
2.3.1 噪聲處理
2.3.2 直方圖均衡化
2.3.3 幾何變換
2.4 特征提取
2.5 表情的分類與回歸
2.6 本章小結
第三章 基于層級注意力模型的視頻序列表情識別
3.1 引言
3.2 層級注意力模型的CNN-LSTM架構設計
3.2.1 LSTM
3.2.2 注意力機制
3.2.3 自注意力機制
3.2.4 層級注意力模型
3.2.5 懲罰項
3.3 層級注意力模型的CNN-LSTM架構實現
3.3.1 視頻預處理
3.3.2 預訓練CNN
3.3.3 應用層級注意力機制的LSTM
3.4 實驗設計與結果分析
3.4.1 環(huán)境配置及實驗數據庫
3.4.2 實驗結果分析
3.5 本章小結
第四章 基于自輔助學習的視頻維度情感識別
4.1 引言
4.2 自輔助學習模型的構建
4.2.1 多任務網絡
4.2.2 標簽生成網絡
4.2.3 網絡訓練策略
4.3 實驗設計與結果分析
4.3.1 評估度量
4.3.2 環(huán)境配置及實驗數據庫
4.3.3 實驗結果分析
4.4 本章小結
第五章 總結與展望
5.1 本文工作總結
5.2 未來展望
參考文獻
攻讀碩士期間的學術活動以及成果情況
【參考文獻】:
期刊論文
[1]融合局部紋理和形狀特征的人臉表情識別[J]. 胡敏,滕文娣,王曉華,許良鳳,楊娟. 電子與信息學報. 2018(06)
[2]融合時空特征的視頻序列表情識別[J]. 王曉華,夏晨,胡敏,任福繼. 電子與信息學報. 2018(03)
[3]基于ROI-KNN卷積神經網絡的面部表情識別[J]. 孫曉,潘汀,任福繼. 自動化學報. 2016(06)
[4]基于隱馬爾可夫模型(HMM)的人臉表情識別[J]. 王沖,李一民,楊霞. 通信技術. 2007(11)
[5]基于多模板匹配的單人臉檢測[J]. 梁路宏,艾海舟,何克忠. 中國圖象圖形學報. 1999(10)
本文編號:3675772
本文鏈接:http://www.sikaile.net/kejilunwen/shengwushengchang/3675772.html
最近更新
教材專著