天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 網絡通信論文 >

噪聲環(huán)境下說話人識別的魯棒性研究

發(fā)布時間:2020-12-17 21:06
  說話人識別,又稱為聲紋識別,是一種基于說話人聲音中特征信息自動識別或驗證說話人身份的技術。說話人識別技術能夠讓服務系統(tǒng)通過語音來控制用戶對受限的服務(如自動銀行服務)、信息資源(取決于用戶的訪問權限)或區(qū)域(如政府或研究機構)的訪問權限。此外,還可以用于說話人的檢測,如音頻檔案中基于語音的信息檢索、識別犯罪者的取證分析及用戶設備的個性化。經過多年的研究,目前的說話人識別系統(tǒng)取得了相當令人滿意的成績。但是,系統(tǒng)在實際應用環(huán)境下的噪聲魯棒性問題仍亟待解決,這也是說話人識別技術走向日常應用的一大障礙。本文針對該問題做了以下研究:首先,分析了經過主成分分析處理的伽馬通頻率倒譜系數特征應用到說話人識別中的噪聲魯棒性。在white、babble和destroyerops不同信噪比的噪聲環(huán)境下,與梅爾頻率倒譜系數特征的系統(tǒng)性能做了全面的分析和比較。此外,將主成分分析算法用于伽馬通頻率倒譜系數的預處理中,并且對處理后的伽馬通頻率倒譜系數的性能做了實驗分析。實驗結果表明,主成分分析在一定程度上提高了伽馬通頻率倒譜系數在低信噪比條件下的系統(tǒng)表現(xiàn)。隨后,對目前在各類評測中表現(xiàn)突出的i-vector/PLDA... 

【文章來源】:南京郵電大學江蘇省

【文章頁數】:75 頁

【學位級別】:碩士

【部分圖文】:

噪聲環(huán)境下說話人識別的魯棒性研究


Mel濾波器組頻譜圖

示意圖,濾波器組,示意圖,濾波器


南京郵電大學專業(yè)學位碩士研究生學位論文 第三章 基于 GFCC 和 PCA 的說話人識別1 2( ) cos(2 )n btcg t at e f t 其中,cf 為濾波器的中心頻率; 表示相位偏移,通常取 0; a 為增益常數器階數,通常 n 4;b 表示衰減因子,由以下公式給出: 1. 019*24.7*(4.37*1000 1)cb f多個不同中心頻率的 Gammatone 濾波器構成一個濾波器組。和基于快速傅時頻譜分析類似,利用該濾波器組可以獲得原始信號在不同頻率分量上的特征學上,可以用等效矩陣帶寬來度量每個濾波器的帶寬:( ) 24.7 (4 .37/1000 1)ccERB ff其中,Q為漸進因子,通常取值為 9.26449;0B 為最小帶寬,通常設為 24.7Hz

【參考文獻】:
期刊論文
[1]《機器學習》[J]. 周志華.  中國民商. 2016(03)
[2]語音識別中聽覺特征的噪聲魯棒性分析[J]. 李銀國,歐陽希子,鄭方.  清華大學學報(自然科學版). 2013(08)
[3]基于MDT特征補償的噪聲魯棒語音識別算法[J]. 胡旭琰,鄒月嫻,王文敏.  清華大學學報(自然科學版). 2013(06)
[4]結合譜減和缺失特征重建的魯棒性話者識別[J]. 王寧,陸偉,戴蓓蒨,李輝.  數據采集與處理. 2009(02)



本文編號:2922708

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/wltx/2922708.html


Copyright(c)文論論文網All Rights Reserved | 網站地圖 |

版權申明:資料由用戶b55ed***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com