基于非重構壓縮采樣的抗噪說話人識別技術研究
本文關鍵詞:基于非重構壓縮采樣的抗噪說話人識別技術研究
更多相關文章: 說話人識別 魯棒性 壓縮感知 語音增強 加權融合
【摘要】:隨著計算機的產生和互聯網技術的發(fā)展,說話人識別作為生物認證的一種,憑借其獨一無二的優(yōu)勢在人機交互領域一直備受關注。說話人識別技術已經從實驗室轉向了實際應用中,同時用戶對其準確性、友好性和魯棒性的要求越來越高。在實際應用環(huán)境中,說話人識別性能受到諸多因素影響,其中最主要的因素是環(huán)境噪聲的存在。環(huán)境噪聲污染了采集的語音信號,導致訓練數據集和測試數據集之間的匹配度降低,引起識別性能下降。另一方面,隨著云計算、大數據產業(yè)的發(fā)展,人們獲得的信息量不斷增加,為了減輕傳輸和處理數據的負擔,信號的壓縮感知技術應運而生。奈奎斯特采樣下的說話人識別,當為了確保高的識別率而采集較長時間說話人語音時,采樣數據量特別大,其中有許多冗余造成了采樣資源的浪費,壓縮感知理論可以很好地解決此問題。本文將壓縮感知理論應用到噪聲環(huán)境下的說話人識別系統中,直接對觀測矩陣壓縮后的觀測序列進行特征提取,針對基于壓縮感知的魯棒性說話人識別進行研究,論文工作是導師國家自然科學基金工作的一部分,本文主要工作和創(chuàng)新如下:(1)研究壓縮感知壓縮比和語音分幀長度對識別系統性能影響。對行階梯矩陣投影下的觀測序列展開研究,研究壓縮比和幀長對識別率的影響。發(fā)現在壓縮比為1:2時,識別性能與傳統方法相當;幀長過短或過長時,說話人識別率有明顯的下降趨勢,一般所取的幀長在20ms-30ms左右。(2)研究在有噪環(huán)境下語音壓縮感知識別系統的特征參數和消噪技術。首先提出了基于譜減法的特征參數CS-SSMFCC,提高了系統的魯棒性。將時頻分析特性較好的小波閾值去噪應用到系統前端,發(fā)現小波軟閾值去噪效果比譜減法更好,在15dB信噪比下,識別率可以達到90%以上。(3)語音信號是由激勵源和聲道函數共同作用的結果,基于行階梯矩陣提取另一種關鍵特征參數—基音頻率。為了提高識別率,提出一種將基音信息和Mel倒譜特征分數層線性加權融合方法,根據加權系數是否與每條測試語音有關,采用固定加權和動態(tài)加權兩種融合方法,實驗結果表明動態(tài)加權融合識別效果更好。在此基礎上,將小波軟閾值去噪增加到系統前端,設計一種新的抗噪融合識別系統,增強了系統的魯棒性。
【關鍵詞】:說話人識別 魯棒性 壓縮感知 語音增強 加權融合
【學位授予單位】:南京郵電大學
【學位級別】:碩士
【學位授予年份】:2016
【分類號】:TN912.34
【目錄】:
- 摘要4-5
- Abstract5-9
- 專用術語注釋表9-10
- 第一章 緒論10-17
- 1.1 引言10-11
- 1.2 說話人識別技術11-15
- 1.2.1 說話人識別的發(fā)展歷程12-13
- 1.2.2 說話人識別中的問題13-14
- 1.2.3 說話人識別的應用14-15
- 1.3 基于CS的說話人識別技術研究現狀15
- 1.4 論文內容和結構安排15-17
- 第二章 說話人識別技術與壓縮感知理論17-37
- 2.1 說話人識別原理17
- 2.2 語音預處理17-20
- 2.3 特征參數提取20-24
- 2.4 說話人識別模型24-28
- 2.4.1 矢量量化模型(VQ)24-25
- 2.4.2 隱馬爾科夫模型(HMM)25
- 2.4.3 高斯混合模型(GMM)25-27
- 2.4.4 支持向量機(SVM)27-28
- 2.5 說話人識別性能評價28-29
- 2.6 壓縮感知基本理論29-35
- 2.6.1 語音信號的稀疏性30-32
- 2.6.2 觀測矩陣的選取32-35
- 2.7 基于CS的識別系統框架35-36
- 2.8 本章小結36-37
- 第三章 基于壓縮感知的增強型特征參數研究37-53
- 3.1 引言37
- 3.2 基于CS的增強型識別系統37-38
- 3.3 有噪環(huán)境下基于CS的說話人識別38-47
- 3.3.1 行階梯觀測矩陣39-41
- 3.3.2 基于譜減法的特征提取41-43
- 3.3.3 基于小波閾值去噪法的特征提取43-47
- 3.4 實驗結果與分析47-51
- 3.4.1 實驗一:壓縮比與識別率的關系47-48
- 3.4.2 實驗二:幀長對識別率的影響48-49
- 3.4.3 實驗三:有噪環(huán)境下輸出信噪比對比49-50
- 3.4.4 實驗四:有噪環(huán)境下特征參數性能對比50-51
- 3.5 本章小結51-53
- 第四章 基于壓縮感知信息融合的說話人識別系統53-69
- 4.1 引言53-54
- 4.2 基于CS的基音特征提取54-57
- 4.3 基于CS的倒譜特征提取57
- 4.4 兩種特征信息融合方法研究57-63
- 4.4.1 匹配分數線性融合的具體過程58-59
- 4.4.2 固定權重融合方法59-60
- 4.4.3 動態(tài)權重融合方法60-62
- 4.4.4 有噪環(huán)境下信息融合的說話人識別系統62-63
- 4.5 實驗結果及分析63-67
- 4.5.1 實驗一:單一特征識別率63-65
- 4.5.2 實驗二:特征融合后的識別率65-66
- 4.5.3 實驗三:噪聲環(huán)境下融合系統識別效果66-67
- 4.6 本章小結67-69
- 第五章 總結與展望69-71
- 5.1 論文總結69-70
- 5.2 工作展望70-71
- 參考文獻71-75
- 附錄1 攻讀碩士學位期間撰寫的論文75-76
- 附錄2 攻讀碩士學位期間參加的科研項目76-77
- 致謝77
【相似文獻】
中國期刊全文數據庫 前10條
1 石艷;王曉曄;;新穎檢測法在說話人識別技術中的應用[J];現代計算機(專業(yè)版);2008年07期
2 劉雪燕;張娜;袁寶玲;;說話人識別綜述[J];電腦知識與技術;2009年01期
3 邱政權;范小春;王俊年;;基于動態(tài)環(huán)境下的說話人識別[J];科學技術與工程;2010年02期
4 單進;;說話人識別技術研究[J];科技資訊;2010年21期
5 申志生;于明;;說話人識別算法的定點DSP實現[J];單片機與嵌入式系統應用;2011年03期
6 謝建勛;;淺談說話人識別技術[J];電腦知識與技術;2011年11期
7 安茂波;劉建;;一個快速說話人識別系統的設計和實現[J];網絡新媒體技術;2012年03期
8 楊迪;戚銀城;劉明軍;張華芳子;武軍娜;;說話人識別綜述[J];電子科技;2012年06期
9 武光利;;說話人識別方法概述[J];硅谷;2012年19期
10 曹業(yè)敏,侯風雷,王炳錫;說話人識別技術現狀與進展[J];河南科技;1998年09期
中國重要會議論文全文數據庫 前10條
1 鮑福良;方志剛;徐潔;;說話人識別綜述[A];第六屆全國信息獲取與處理學術會議論文集(2)[C];2008年
2 孫帆;遲惠生;;循環(huán)網絡說話人識別[A];第二屆全國人機語音通訊學術會議論文集[C];1992年
3 肖劍;歐貴文;;多層前饋神經網絡組的文本無關說話人識別[A];第七屆全國人機語音通訊學術會議(NCMMSC7)論文集[C];2003年
4 張玲華;鄭寶玉;楊震;;模糊超橢球聚類算法及其在說話人識別中的應用研究[A];第八屆全國人機語音通訊學術會議論文集[C];2005年
5 王宏;潘金貴;;基于矩陣正態(tài)分布的文本有關說話人識別[A];2007通信理論與技術新發(fā)展——第十二屆全國青年通信學術會議論文集(上冊)[C];2007年
6 戴紅霞;趙力;;文本無關說話人識別系統的研究[A];2007’促進西部發(fā)展聲學學術交流會論文集[C];2007年
7 陳聯武;郭武;戴禮榮;;說話人識別系統中多樣訓練的應用[A];第十一屆全國人機語音通訊學術會議論文集(一)[C];2011年
8 崔玉紅;胡光銳;;基于神經網絡特征維數壓縮方法及其在說話人識別中的應用[A];第十屆全國信號處理學術年會(CCSP-2001)論文集[C];2001年
9 吳麗麗;;基于仿生模式識別的說話人識別學習模型研究[A];第二屆中國科學院博士后學術年會暨高新技術前沿與發(fā)展學術會議程序冊[C];2010年
10 張晶;董金明;馮文全;;說話人識別系統研究與實現[A];全國第二屆信號處理與應用學術會議?痆C];2008年
中國重要報紙全文數據庫 前2條
1 汪永安;科大訊飛說話人識別技術世界領先[N];安徽日報;2008年
2 吳長鋒;科大訊飛勇奪說話人識別國際大賽第一[N];科技日報;2008年
中國博士學位論文全文數據庫 前10條
1 單振宇;情感說話人識別及其解決方法的研究[D];浙江大學;2010年
2 別凡虎;說話人識別中區(qū)分性問題的研究[D];清華大學;2015年
3 謝怡寧;基于稀疏編碼的魯棒說話人識別方法研究[D];哈爾濱理工大學;2016年
4 陸偉;基于缺失特征的文本無關說話人識別魯棒性研究[D];中國科學技術大學;2008年
5 劉鏑;說話人識別中信息融合算法的研究[D];北京交通大學;2011年
6 付中華;說話人識別系統魯棒性研究[D];西北工業(yè)大學;2004年
7 林琳;基于模糊聚類與遺傳算法的說話人識別理論研究及應用[D];吉林大學;2007年
8 邱政權;在噪聲環(huán)境下的說話人識別[D];華南理工大學;2007年
9 郭武;復雜信道下的說話人識別[D];中國科學技術大學;2007年
10 錢博;基于漢語元音映射的說話人識別技術研究[D];南京理工大學;2007年
中國碩士學位論文全文數據庫 前10條
1 叢菡菡;基于支持相量機的穩(wěn)鍵說話人識別[D];電子科技大學;2008年
2 任舒彬;面向手持應用的說話人識別算法研究[D];浙江大學;2006年
3 申志生;文本相關說話人識別嵌入式系統及其關鍵技術研究[D];河北工業(yè)大學;2011年
4 汪q,
本文編號:734267
本文鏈接:http://www.sikaile.net/kejilunwen/xinxigongchenglunwen/734267.html