天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 信息工程論文 >

基于GMM-UBM模型的說話人識別系統(tǒng)

發(fā)布時間:2017-10-04 03:31

  本文關鍵詞:基于GMM-UBM模型的說話人識別系統(tǒng)


  更多相關文章: 說話人識別 特征提取 GMM-UBM MFCC


【摘要】:說話人識別技術通過提取語音中的一些有用信息作為特征,建立模型來識別說話人的身份。最近幾十年,科技發(fā)展迅猛,在人們生活目益方便的同時,安全問題也越來越嚴重,身份驗證必須更加安全有效才能保證人們的財產和人身安全。而說話人識別技術所需成本低并且特征容易提取以及方便擴展等優(yōu)勢,所以可以應用于多個領域,比如計算機遠程登錄、門禁系統(tǒng)、數據庫訪問等等。近些年來,說話人識別已然成為了語音識別中熱門研究方向之一。在眾多的說話人識別技術中,本文主要進行基于梅爾倒譜特征提取方法和GMM-UBM模型的研究。論文主要研究內容如下:(1)介紹與分析了說話人識別的研究目的、背景以及意義,對說話人識別在國內外的發(fā)展歷史和近況以及在實際中的應用進行了介紹和分析;(2)對說話人識別的分類、識別的流程、常用的方法等等進行了介紹,分析了幾種特征提取方法以及系統(tǒng)識別方法,并給出它的評價方法的公式與流程;(3)從語音的發(fā)聲原理講起,研究了語音特征提取的各個步驟,介紹了梅爾倒譜特征、動態(tài)特征、短時歸一化能量的提取,并進行實驗驗證了動態(tài)特征以及短時歸一化能量的作用;(4)重點介紹了GMM-UBM模型的實現,對于實現該模型的EM算法、K-means算法等也進行了分析,并進行實驗對于模型的各種參數變化進行了對比,得出最優(yōu)的結果。
【關鍵詞】:說話人識別 特征提取 GMM-UBM MFCC
【學位授予單位】:內蒙古大學
【學位級別】:碩士
【學位授予年份】:2016
【分類號】:TN912.34
【目錄】:
  • 摘要4-5
  • ABSTRACT5-12
  • 第一章 緒論12-15
  • 1.1 說話人識別的研究目的與意義12
  • 1.2 說話人識別的發(fā)展歷史和研究現狀12-14
  • 1.3 存在的問題14
  • 1.4 本文的主要內容及安排14-15
  • 第二章 說話人識別簡介15-22
  • 2.1 說話人識別分類15
  • 2.2 說話人識別的原理和結構15-16
  • 2.3 說話人識別的特征提取16-17
  • 2.3.1 特征提取的原則16
  • 2.3.2 特征提取的原則16-17
  • 2.4 說話人識別的建模方法17-19
  • 2.4.1 模板匹配17-18
  • 2.4.2 概率統(tǒng)計模型18
  • 2.4.3 人工神經網絡18-19
  • 2.4.4 融合方法19
  • 2.5 說話人識別的性能評價指標19-22
  • 2.5.1 說話人辨認19
  • 2.5.2 說話人確認19-20
  • 2.5.3 實際應用的要求20-22
  • 第三章 語音信號處理及特征提取22-36
  • 3.1 語音信號的產生22-23
  • 3.1.1 語音信號的產生機理22-23
  • 3.1.2 語音產生的數學模型23
  • 3.2 語音信號的預處理23-26
  • 3.2.1 采樣與量化23-24
  • 3.2.2 歸一化24
  • 3.2.3 預加重24-25
  • 3.2.4 分幀與加窗25-26
  • 3.3 語音信號的時域分析26-29
  • 3.3.1 短時平均能量26-27
  • 3.3.2 短時平均過零率27-28
  • 3.3.3 語音信號的端點檢測28-29
  • 3.4 語音信號的頻域分析29-30
  • 3.4.1 短時傅立葉變換29
  • 3.4.2 語譜圖29-30
  • 3.5 語音信號的同態(tài)倒譜分析30-31
  • 3.5.1 倒譜和復倒譜30
  • 3.5.2 線性預測系數30-31
  • 3.6 語音信號特征提取31-35
  • 3.6.1 線性預測倒譜系數31-32
  • 3.6.2 梅爾頻率倒譜系數32-34
  • 3.6.3 短時歸一化能量34
  • 3.6.4 動態(tài)特征34-35
  • 3.7 矢量特征的參數規(guī)整35-36
  • 第四章 基于GMM-UBM的說話人識別36-43
  • 4.1 GMM的基本原理36-39
  • 4.1.1 GMM模型的原理36-37
  • 4.1.2 GMM模型的參數估計37-39
  • 4.1.3 GMM模型的參數初始化39
  • 4.2 GMM-UBM模型39-43
  • 4.2.1 UBM在說話人識別中的應用39-40
  • 4.2.2 MAP算法40-41
  • 4.2.3 GMM-UBM的對數似然比41-43
  • 第五章 系統(tǒng)實現與實驗結果43-50
  • 5.1 說話人識別系統(tǒng)平臺43-45
  • 5.1.1 硬件平臺43
  • 5.1.2 軟件平臺43
  • 5.1.3 系統(tǒng)功能與模塊43-45
  • 5.2 高斯混合密度個數對系統(tǒng)的影響45-46
  • 5.3 語音長度對系統(tǒng)影響46-47
  • 5.3.1 訓練語音長度對系統(tǒng)影響46-47
  • 5.3.2 測試語音長度對系統(tǒng)影響47
  • 5.4 特征維數對系統(tǒng)影響47-48
  • 5.5 端點檢測對系統(tǒng)影響48-49
  • 5.6 GMM模型與GMM-UBM模型的比較49
  • 5.7 實驗結果49-50
  • 第六章 總結與展望50-52
  • 6.1 主要結論50
  • 6.2 待研究的問題50-52
  • 參考文獻52-55
  • 致謝55

【相似文獻】

中國期刊全文數據庫 前10條

1 石艷;王曉曄;;新穎檢測法在說話人識別技術中的應用[J];現代計算機(專業(yè)版);2008年07期

2 劉雪燕;張娜;袁寶玲;;說話人識別綜述[J];電腦知識與技術;2009年01期

3 邱政權;范小春;王俊年;;基于動態(tài)環(huán)境下的說話人識別[J];科學技術與工程;2010年02期

4 單進;;說話人識別技術研究[J];科技資訊;2010年21期

5 申志生;于明;;說話人識別算法的定點DSP實現[J];單片機與嵌入式系統(tǒng)應用;2011年03期

6 謝建勛;;淺談說話人識別技術[J];電腦知識與技術;2011年11期

7 安茂波;劉建;;一個快速說話人識別系統(tǒng)的設計和實現[J];網絡新媒體技術;2012年03期

8 楊迪;戚銀城;劉明軍;張華芳子;武軍娜;;說話人識別綜述[J];電子科技;2012年06期

9 武光利;;說話人識別方法概述[J];硅谷;2012年19期

10 曹業(yè)敏,侯風雷,王炳錫;說話人識別技術現狀與進展[J];河南科技;1998年09期

中國重要會議論文全文數據庫 前10條

1 鮑福良;方志剛;徐潔;;說話人識別綜述[A];第六屆全國信息獲取與處理學術會議論文集(2)[C];2008年

2 孫帆;遲惠生;;循環(huán)網絡說話人識別[A];第二屆全國人機語音通訊學術會議論文集[C];1992年

3 肖劍;歐貴文;;多層前饋神經網絡組的文本無關說話人識別[A];第七屆全國人機語音通訊學術會議(NCMMSC7)論文集[C];2003年

4 張玲華;鄭寶玉;楊震;;模糊超橢球聚類算法及其在說話人識別中的應用研究[A];第八屆全國人機語音通訊學術會議論文集[C];2005年

5 王宏;潘金貴;;基于矩陣正態(tài)分布的文本有關說話人識別[A];2007通信理論與技術新發(fā)展——第十二屆全國青年通信學術會議論文集(上冊)[C];2007年

6 戴紅霞;趙力;;文本無關說話人識別系統(tǒng)的研究[A];2007’促進西部發(fā)展聲學學術交流會論文集[C];2007年

7 陳聯武;郭武;戴禮榮;;說話人識別系統(tǒng)中多樣訓練的應用[A];第十一屆全國人機語音通訊學術會議論文集(一)[C];2011年

8 崔玉紅;胡光銳;;基于神經網絡特征維數壓縮方法及其在說話人識別中的應用[A];第十屆全國信號處理學術年會(CCSP-2001)論文集[C];2001年

9 吳麗麗;;基于仿生模式識別的說話人識別學習模型研究[A];第二屆中國科學院博士后學術年會暨高新技術前沿與發(fā)展學術會議程序冊[C];2010年

10 張晶;董金明;馮文全;;說話人識別系統(tǒng)研究與實現[A];全國第二屆信號處理與應用學術會議?痆C];2008年

中國重要報紙全文數據庫 前2條

1 汪永安;科大訊飛說話人識別技術世界領先[N];安徽日報;2008年

2 吳長鋒;科大訊飛勇奪說話人識別國際大賽第一[N];科技日報;2008年

中國博士學位論文全文數據庫 前10條

1 單振宇;情感說話人識別及其解決方法的研究[D];浙江大學;2010年

2 別凡虎;說話人識別中區(qū)分性問題的研究[D];清華大學;2015年

3 謝怡寧;基于稀疏編碼的魯棒說話人識別方法研究[D];哈爾濱理工大學;2016年

4 陸偉;基于缺失特征的文本無關說話人識別魯棒性研究[D];中國科學技術大學;2008年

5 劉鏑;說話人識別中信息融合算法的研究[D];北京交通大學;2011年

6 付中華;說話人識別系統(tǒng)魯棒性研究[D];西北工業(yè)大學;2004年

7 林琳;基于模糊聚類與遺傳算法的說話人識別理論研究及應用[D];吉林大學;2007年

8 邱政權;在噪聲環(huán)境下的說話人識別[D];華南理工大學;2007年

9 郭武;復雜信道下的說話人識別[D];中國科學技術大學;2007年

10 錢博;基于漢語元音映射的說話人識別技術研究[D];南京理工大學;2007年

中國碩士學位論文全文數據庫 前10條

1 叢菡菡;基于支持相量機的穩(wěn)鍵說話人識別[D];電子科技大學;2008年

2 任舒彬;面向手持應用的說話人識別算法研究[D];浙江大學;2006年

3 申志生;文本相關說話人識別嵌入式系統(tǒng)及其關鍵技術研究[D];河北工業(yè)大學;2011年

4 汪q,

本文編號:968412


資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/xinxigongchenglunwen/968412.html


Copyright(c)文論論文網All Rights Reserved | 網站地圖 |

版權申明:資料由用戶2e397***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com