基于深度學(xué)習(xí)的說(shuō)話人識(shí)別技術(shù)應(yīng)用
【文章頁(yè)數(shù)】:94 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖2-1?MFCC提取及轉(zhuǎn)置流程圖??1..?dāng)?shù)模轉(zhuǎn)換(A/D?conversion)??
?電子科技大學(xué)碩士學(xué)位論文???第二章背景知識(shí)與相關(guān)理論??2.1語(yǔ)音信號(hào)的特征提取??2.1.1梅爾倒頻系數(shù)??MFCC至今仍是最優(yōu)秀的語(yǔ)音特征集之一,其主要優(yōu)點(diǎn)是能夠在短時(shí)功率譜??中對(duì)聲道進(jìn)行建模。39維的MFCC特征是現(xiàn)有語(yǔ)音研究中的常用特征,此維數(shù)小??到足夠?qū)W習(xí)到音頻....
圖2-2實(shí)際頻率與梅爾頻率的映射關(guān)系圖??
隨窗:函數(shù)的選擇變化,Hamming窗’??取值為0.46164,Hanning窗取值為0.5。??4.離散傅里葉變換??采用DFT提取頻域中的信息,由公式(2-4)完成時(shí)域信號(hào)到頻域信號(hào)的轉(zhuǎn)換。??耶]=2〇n]e_/27rfc/W?(2-4)??5.梅爾濾波器組??設(shè)備的測(cè)量....
圖2-3三角濾波器工作原理示意圖??
?電子科技大莩碩土學(xué)位論文???接下來(lái)使用三角帶通濾波器將頻率信息轉(zhuǎn)換成為人耳接收的模擬債息》首先??對(duì)DFT轉(zhuǎn)換的輸出求乎方,這反應(yīng)了每個(gè)頻率的語(yǔ)音功率,稱之為DFT功率譜。??之后使用H角梅爾濾波器組將該能量鐠轉(zhuǎn)換為梅爾功率譜,每個(gè)梅爾能養(yǎng)譜槽的??輸出代表其覆蓋的多個(gè)頻帶的....
圖2-4?GMM-UBM模型訓(xùn)練-識(shí)別流程圖??
UniversalBackgroundModel,UBM).?[36,37]。UBM?代表了除了?目標(biāo)說(shuō)??話人之外的每個(gè)人,從本質(zhì)上來(lái)說(shuō)是一個(gè)大型的GMM。UBM是通過EM算法對(duì)??大量說(shuō)話人語(yǔ)音訓(xùn)練出來(lái)的獨(dú)立于說(shuō)話人的背景模型,該模型表示了特征向量與??說(shuō)話人無(wú)關(guān)的分布g當(dāng)新....
本文編號(hào):3967790
本文鏈接:http://www.sikaile.net/kejilunwen/xinxigongchenglunwen/3967790.html