視覺語言識別的嘴唇分割及特征提取方法研究
發(fā)布時間:2023-06-03 11:32
近年來,隨著人機(jī)交互技術(shù)的日益發(fā)展,各種智能設(shè)備紛紛出現(xiàn),人工智能已經(jīng)正式成為信息領(lǐng)域的研究熱點(diǎn)。作為人機(jī)交互技術(shù)中相對成熟的語音識別技術(shù),已逐步滲透到社會生活的各個領(lǐng)域,改變著人們的生活方式。但是在周圍有噪聲的情況下,基于音頻的語音識別的識別率就會急劇下降,甚至完全無法識別說話者所說的話語內(nèi)容。人們在進(jìn)行對話交流時,視覺唇動信息也可以反映話語內(nèi)容信息。因此,研究者們開始致力于基于唇動視覺特征的話語內(nèi)容識別研究,也就是視覺語言識別技術(shù)研究。該技術(shù)將在彌補(bǔ)語音識別技術(shù)的缺陷方面發(fā)揮重要作用。本文重點(diǎn)研究視覺語言識別系統(tǒng)中兩個關(guān)鍵技術(shù),即嘴唇分割和特征提取。在嘴唇分割方面,首先利用OpenCV檢測技術(shù)對包含有人臉的圖像進(jìn)行檢測,分割出嘴唇區(qū)域,并進(jìn)行色彩空間的變換。然后在三個色彩空間RGB、HSV和chromatic中進(jìn)行色彩增強(qiáng),色彩分割和嘴角定位等操作。最后利用細(xì)菌覓食優(yōu)化算法和以Kapur最大熵法為適應(yīng)度函數(shù)對輸入圖像求取最佳閾值并分割,得到精確的嘴唇二值圖像。在唇部視覺特征提取方面,由于不同種族膚色的差異,以及同一人在不同光照強(qiáng)度和不同色光下映射膚色不同等因素,使得圖像的像素特征失...
【文章頁數(shù)】:57 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 選題背景和意義
1.2 國內(nèi)外研究現(xiàn)狀和發(fā)展
1.3 本文研究的主要內(nèi)容
1.4 本文的組織結(jié)構(gòu)
第二章 嘴唇區(qū)域定位
2.1 人臉區(qū)域的檢測與提取
2.1.1 OpenCV技術(shù)
2.1.2 人臉圖像Haar特征介紹
2.1.3 AdaBoost級聯(lián)分類器
2.1.4 人臉區(qū)域的檢測和定位
2.2 嘴唇區(qū)域的定位和提取
2.3 本章小結(jié)
第三章 細(xì)菌覓食優(yōu)化算法
3.1 細(xì)菌覓食算法原理
3.2 自適應(yīng)步長的細(xì)菌覓食優(yōu)化算法的基本步驟
3.3 適應(yīng)度函數(shù)的設(shè)計(jì)-最優(yōu)閾值法
3.4 本章小結(jié)
第四章 嘴唇的精確分割
4.1 基于三色彩空間中的嘴唇分割
4.1.1 在RGB色彩空間中的嘴唇區(qū)域分割
4.1.2 在HSV色彩空間中的嘴唇區(qū)域分割
4.1.3 在chromatic色彩空間中的嘴唇區(qū)域分割
4.2 本章小結(jié)
第五章 唇部視覺特征提取
5.1 嘴唇邊緣關(guān)鍵點(diǎn)提取
5.1.1 外嘴唇邊緣關(guān)鍵點(diǎn)提取
5.1.2 內(nèi)嘴唇邊緣關(guān)鍵點(diǎn)提取
5.2 最小二乘法簡介
5.3 嘴唇外輪廓的提取
5.3.1 建立嘴唇輪廓模型
5.3.2 凸包算法
5.3.3 嘴唇外輪廓提取
5.4 嘴唇視覺動態(tài)特征提取
5.5 經(jīng)典的GVF Snake嘴唇輪廓模型算法
5.6 實(shí)驗(yàn)結(jié)果與分析
5.7 本章小結(jié)
第六章 結(jié)論
參考文獻(xiàn)
在學(xué)期間的研究成果
致謝
本文編號:3829253
【文章頁數(shù)】:57 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 選題背景和意義
1.2 國內(nèi)外研究現(xiàn)狀和發(fā)展
1.3 本文研究的主要內(nèi)容
1.4 本文的組織結(jié)構(gòu)
第二章 嘴唇區(qū)域定位
2.1 人臉區(qū)域的檢測與提取
2.1.1 OpenCV技術(shù)
2.1.2 人臉圖像Haar特征介紹
2.1.3 AdaBoost級聯(lián)分類器
2.1.4 人臉區(qū)域的檢測和定位
2.2 嘴唇區(qū)域的定位和提取
2.3 本章小結(jié)
第三章 細(xì)菌覓食優(yōu)化算法
3.1 細(xì)菌覓食算法原理
3.2 自適應(yīng)步長的細(xì)菌覓食優(yōu)化算法的基本步驟
3.3 適應(yīng)度函數(shù)的設(shè)計(jì)-最優(yōu)閾值法
3.4 本章小結(jié)
第四章 嘴唇的精確分割
4.1 基于三色彩空間中的嘴唇分割
4.1.1 在RGB色彩空間中的嘴唇區(qū)域分割
4.1.2 在HSV色彩空間中的嘴唇區(qū)域分割
4.1.3 在chromatic色彩空間中的嘴唇區(qū)域分割
4.2 本章小結(jié)
第五章 唇部視覺特征提取
5.1 嘴唇邊緣關(guān)鍵點(diǎn)提取
5.1.1 外嘴唇邊緣關(guān)鍵點(diǎn)提取
5.1.2 內(nèi)嘴唇邊緣關(guān)鍵點(diǎn)提取
5.2 最小二乘法簡介
5.3 嘴唇外輪廓的提取
5.3.1 建立嘴唇輪廓模型
5.3.2 凸包算法
5.3.3 嘴唇外輪廓提取
5.4 嘴唇視覺動態(tài)特征提取
5.5 經(jīng)典的GVF Snake嘴唇輪廓模型算法
5.6 實(shí)驗(yàn)結(jié)果與分析
5.7 本章小結(jié)
第六章 結(jié)論
參考文獻(xiàn)
在學(xué)期間的研究成果
致謝
本文編號:3829253
本文鏈接:http://www.sikaile.net/kejilunwen/zidonghuakongzhilunwen/3829253.html
最近更新
教材專著