基于GMM-UBM模型的說話人識別系統(tǒng)
本文關鍵詞:基于GMM-UBM模型的說話人識別系統(tǒng)
更多相關文章: 說話人識別 特征提取 GMM-UBM MFCC
【摘要】:說話人識別技術通過提取語音中的一些有用信息作為特征,建立模型來識別說話人的身份。最近幾十年,科技發(fā)展迅猛,在人們生活目益方便的同時,安全問題也越來越嚴重,身份驗證必須更加安全有效才能保證人們的財產和人身安全。而說話人識別技術所需成本低并且特征容易提取以及方便擴展等優(yōu)勢,所以可以應用于多個領域,比如計算機遠程登錄、門禁系統(tǒng)、數據庫訪問等等。近些年來,說話人識別已然成為了語音識別中熱門研究方向之一。在眾多的說話人識別技術中,本文主要進行基于梅爾倒譜特征提取方法和GMM-UBM模型的研究。論文主要研究內容如下:(1)介紹與分析了說話人識別的研究目的、背景以及意義,對說話人識別在國內外的發(fā)展歷史和近況以及在實際中的應用進行了介紹和分析;(2)對說話人識別的分類、識別的流程、常用的方法等等進行了介紹,分析了幾種特征提取方法以及系統(tǒng)識別方法,并給出它的評價方法的公式與流程;(3)從語音的發(fā)聲原理講起,研究了語音特征提取的各個步驟,介紹了梅爾倒譜特征、動態(tài)特征、短時歸一化能量的提取,并進行實驗驗證了動態(tài)特征以及短時歸一化能量的作用;(4)重點介紹了GMM-UBM模型的實現,對于實現該模型的EM算法、K-means算法等也進行了分析,并進行實驗對于模型的各種參數變化進行了對比,得出最優(yōu)的結果。
【關鍵詞】:說話人識別 特征提取 GMM-UBM MFCC
【學位授予單位】:內蒙古大學
【學位級別】:碩士
【學位授予年份】:2016
【分類號】:TN912.34
【目錄】:
- 摘要4-5
- ABSTRACT5-12
- 第一章 緒論12-15
- 1.1 說話人識別的研究目的與意義12
- 1.2 說話人識別的發(fā)展歷史和研究現狀12-14
- 1.3 存在的問題14
- 1.4 本文的主要內容及安排14-15
- 第二章 說話人識別簡介15-22
- 2.1 說話人識別分類15
- 2.2 說話人識別的原理和結構15-16
- 2.3 說話人識別的特征提取16-17
- 2.3.1 特征提取的原則16
- 2.3.2 特征提取的原則16-17
- 2.4 說話人識別的建模方法17-19
- 2.4.1 模板匹配17-18
- 2.4.2 概率統(tǒng)計模型18
- 2.4.3 人工神經網絡18-19
- 2.4.4 融合方法19
- 2.5 說話人識別的性能評價指標19-22
- 2.5.1 說話人辨認19
- 2.5.2 說話人確認19-20
- 2.5.3 實際應用的要求20-22
- 第三章 語音信號處理及特征提取22-36
- 3.1 語音信號的產生22-23
- 3.1.1 語音信號的產生機理22-23
- 3.1.2 語音產生的數學模型23
- 3.2 語音信號的預處理23-26
- 3.2.1 采樣與量化23-24
- 3.2.2 歸一化24
- 3.2.3 預加重24-25
- 3.2.4 分幀與加窗25-26
- 3.3 語音信號的時域分析26-29
- 3.3.1 短時平均能量26-27
- 3.3.2 短時平均過零率27-28
- 3.3.3 語音信號的端點檢測28-29
- 3.4 語音信號的頻域分析29-30
- 3.4.1 短時傅立葉變換29
- 3.4.2 語譜圖29-30
- 3.5 語音信號的同態(tài)倒譜分析30-31
- 3.5.1 倒譜和復倒譜30
- 3.5.2 線性預測系數30-31
- 3.6 語音信號特征提取31-35
- 3.6.1 線性預測倒譜系數31-32
- 3.6.2 梅爾頻率倒譜系數32-34
- 3.6.3 短時歸一化能量34
- 3.6.4 動態(tài)特征34-35
- 3.7 矢量特征的參數規(guī)整35-36
- 第四章 基于GMM-UBM的說話人識別36-43
- 4.1 GMM的基本原理36-39
- 4.1.1 GMM模型的原理36-37
- 4.1.2 GMM模型的參數估計37-39
- 4.1.3 GMM模型的參數初始化39
- 4.2 GMM-UBM模型39-43
- 4.2.1 UBM在說話人識別中的應用39-40
- 4.2.2 MAP算法40-41
- 4.2.3 GMM-UBM的對數似然比41-43
- 第五章 系統(tǒng)實現與實驗結果43-50
- 5.1 說話人識別系統(tǒng)平臺43-45
- 5.1.1 硬件平臺43
- 5.1.2 軟件平臺43
- 5.1.3 系統(tǒng)功能與模塊43-45
- 5.2 高斯混合密度個數對系統(tǒng)的影響45-46
- 5.3 語音長度對系統(tǒng)影響46-47
- 5.3.1 訓練語音長度對系統(tǒng)影響46-47
- 5.3.2 測試語音長度對系統(tǒng)影響47
- 5.4 特征維數對系統(tǒng)影響47-48
- 5.5 端點檢測對系統(tǒng)影響48-49
- 5.6 GMM模型與GMM-UBM模型的比較49
- 5.7 實驗結果49-50
- 第六章 總結與展望50-52
- 6.1 主要結論50
- 6.2 待研究的問題50-52
- 參考文獻52-55
- 致謝55
【相似文獻】
中國期刊全文數據庫 前10條
1 石艷;王曉曄;;新穎檢測法在說話人識別技術中的應用[J];現代計算機(專業(yè)版);2008年07期
2 劉雪燕;張娜;袁寶玲;;說話人識別綜述[J];電腦知識與技術;2009年01期
3 邱政權;范小春;王俊年;;基于動態(tài)環(huán)境下的說話人識別[J];科學技術與工程;2010年02期
4 單進;;說話人識別技術研究[J];科技資訊;2010年21期
5 申志生;于明;;說話人識別算法的定點DSP實現[J];單片機與嵌入式系統(tǒng)應用;2011年03期
6 謝建勛;;淺談說話人識別技術[J];電腦知識與技術;2011年11期
7 安茂波;劉建;;一個快速說話人識別系統(tǒng)的設計和實現[J];網絡新媒體技術;2012年03期
8 楊迪;戚銀城;劉明軍;張華芳子;武軍娜;;說話人識別綜述[J];電子科技;2012年06期
9 武光利;;說話人識別方法概述[J];硅谷;2012年19期
10 曹業(yè)敏,侯風雷,王炳錫;說話人識別技術現狀與進展[J];河南科技;1998年09期
中國重要會議論文全文數據庫 前10條
1 鮑福良;方志剛;徐潔;;說話人識別綜述[A];第六屆全國信息獲取與處理學術會議論文集(2)[C];2008年
2 孫帆;遲惠生;;循環(huán)網絡說話人識別[A];第二屆全國人機語音通訊學術會議論文集[C];1992年
3 肖劍;歐貴文;;多層前饋神經網絡組的文本無關說話人識別[A];第七屆全國人機語音通訊學術會議(NCMMSC7)論文集[C];2003年
4 張玲華;鄭寶玉;楊震;;模糊超橢球聚類算法及其在說話人識別中的應用研究[A];第八屆全國人機語音通訊學術會議論文集[C];2005年
5 王宏;潘金貴;;基于矩陣正態(tài)分布的文本有關說話人識別[A];2007通信理論與技術新發(fā)展——第十二屆全國青年通信學術會議論文集(上冊)[C];2007年
6 戴紅霞;趙力;;文本無關說話人識別系統(tǒng)的研究[A];2007’促進西部發(fā)展聲學學術交流會論文集[C];2007年
7 陳聯武;郭武;戴禮榮;;說話人識別系統(tǒng)中多樣訓練的應用[A];第十一屆全國人機語音通訊學術會議論文集(一)[C];2011年
8 崔玉紅;胡光銳;;基于神經網絡特征維數壓縮方法及其在說話人識別中的應用[A];第十屆全國信號處理學術年會(CCSP-2001)論文集[C];2001年
9 吳麗麗;;基于仿生模式識別的說話人識別學習模型研究[A];第二屆中國科學院博士后學術年會暨高新技術前沿與發(fā)展學術會議程序冊[C];2010年
10 張晶;董金明;馮文全;;說話人識別系統(tǒng)研究與實現[A];全國第二屆信號處理與應用學術會議?痆C];2008年
中國重要報紙全文數據庫 前2條
1 汪永安;科大訊飛說話人識別技術世界領先[N];安徽日報;2008年
2 吳長鋒;科大訊飛勇奪說話人識別國際大賽第一[N];科技日報;2008年
中國博士學位論文全文數據庫 前10條
1 單振宇;情感說話人識別及其解決方法的研究[D];浙江大學;2010年
2 別凡虎;說話人識別中區(qū)分性問題的研究[D];清華大學;2015年
3 謝怡寧;基于稀疏編碼的魯棒說話人識別方法研究[D];哈爾濱理工大學;2016年
4 陸偉;基于缺失特征的文本無關說話人識別魯棒性研究[D];中國科學技術大學;2008年
5 劉鏑;說話人識別中信息融合算法的研究[D];北京交通大學;2011年
6 付中華;說話人識別系統(tǒng)魯棒性研究[D];西北工業(yè)大學;2004年
7 林琳;基于模糊聚類與遺傳算法的說話人識別理論研究及應用[D];吉林大學;2007年
8 邱政權;在噪聲環(huán)境下的說話人識別[D];華南理工大學;2007年
9 郭武;復雜信道下的說話人識別[D];中國科學技術大學;2007年
10 錢博;基于漢語元音映射的說話人識別技術研究[D];南京理工大學;2007年
中國碩士學位論文全文數據庫 前10條
1 叢菡菡;基于支持相量機的穩(wěn)鍵說話人識別[D];電子科技大學;2008年
2 任舒彬;面向手持應用的說話人識別算法研究[D];浙江大學;2006年
3 申志生;文本相關說話人識別嵌入式系統(tǒng)及其關鍵技術研究[D];河北工業(yè)大學;2011年
4 汪q,
本文編號:968412
本文鏈接:http://www.sikaile.net/kejilunwen/xinxigongchenglunwen/968412.html