天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 信息工程論文 >

基于深度學(xué)習(xí)的說(shuō)話人識(shí)別技術(shù)應(yīng)用

發(fā)布時(shí)間:2024-05-08 20:38
  隨著信息化時(shí)代的不斷推進(jìn),人們對(duì)系統(tǒng)身份認(rèn)證可靠性和服務(wù)提供個(gè)性化的需求不斷提升,基于用戶語(yǔ)音的說(shuō)話人識(shí)別和說(shuō)話人屬性分類技術(shù)迅速成為信號(hào)處理領(lǐng)域的研究熱點(diǎn)。現(xiàn)有的基于深度學(xué)習(xí)方法的說(shuō)話人識(shí)別及說(shuō)話人屬性分類任務(wù)仍然受限于環(huán)境噪聲及信道失配問題,本論文旨在基于深度學(xué)習(xí)研究具有較高魯棒性的說(shuō)話人識(shí)別和說(shuō)話人屬性分類系統(tǒng),提升復(fù)雜場(chǎng)景下的識(shí)別和分類準(zhǔn)確率。為了實(shí)現(xiàn)上述研究目標(biāo),本文對(duì)話人識(shí)別及說(shuō)話人屬性分類展開以下研究:針對(duì)說(shuō)話人識(shí)別,本論文提出基于殘差網(wǎng)絡(luò)及雙向長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)的ResNet-BLSTM網(wǎng)絡(luò)結(jié)構(gòu),使用語(yǔ)譜圖作為網(wǎng)絡(luò)輸入,提取出了對(duì)于語(yǔ)速魯棒且表征信息更豐富的深度特征。在訓(xùn)練階段提出了基于改進(jìn)三元組損失的T-Triplet Loss,嚴(yán)格控制特征向量的類內(nèi)聚集及類間分離,使模型在噪聲語(yǔ)料集下也能準(zhǔn)確地聚類同說(shuō)話人語(yǔ)音。最后分別在Voxceleb、LibriSpeech和AISHELL-1三個(gè)語(yǔ)料集上開展實(shí)驗(yàn),并在三個(gè)數(shù)據(jù)集上都取得了較為接近的識(shí)別等錯(cuò)誤率,驗(yàn)證了系統(tǒng)在多種語(yǔ)音環(huán)境下的魯棒性,且更是在噪聲數(shù)據(jù)集Voxceleb上相較于基線系統(tǒng)i-vector/PLDA取得了 6...

【文章頁(yè)數(shù)】:94 頁(yè)

【學(xué)位級(jí)別】:碩士

【部分圖文】:

圖2-1?MFCC提取及轉(zhuǎn)置流程圖??1..?dāng)?shù)模轉(zhuǎn)換(A/D?conversion)??

圖2-1?MFCC提取及轉(zhuǎn)置流程圖??1..?dāng)?shù)模轉(zhuǎn)換(A/D?conversion)??

?電子科技大學(xué)碩士學(xué)位論文???第二章背景知識(shí)與相關(guān)理論??2.1語(yǔ)音信號(hào)的特征提取??2.1.1梅爾倒頻系數(shù)??MFCC至今仍是最優(yōu)秀的語(yǔ)音特征集之一,其主要優(yōu)點(diǎn)是能夠在短時(shí)功率譜??中對(duì)聲道進(jìn)行建模。39維的MFCC特征是現(xiàn)有語(yǔ)音研究中的常用特征,此維數(shù)小??到足夠?qū)W習(xí)到音頻....


圖2-2實(shí)際頻率與梅爾頻率的映射關(guān)系圖??

圖2-2實(shí)際頻率與梅爾頻率的映射關(guān)系圖??

隨窗:函數(shù)的選擇變化,Hamming窗’??取值為0.46164,Hanning窗取值為0.5。??4.離散傅里葉變換??采用DFT提取頻域中的信息,由公式(2-4)完成時(shí)域信號(hào)到頻域信號(hào)的轉(zhuǎn)換。??耶]=2〇n]e_/27rfc/W?(2-4)??5.梅爾濾波器組??設(shè)備的測(cè)量....


圖2-3三角濾波器工作原理示意圖??

圖2-3三角濾波器工作原理示意圖??

?電子科技大莩碩土學(xué)位論文???接下來(lái)使用三角帶通濾波器將頻率信息轉(zhuǎn)換成為人耳接收的模擬債息》首先??對(duì)DFT轉(zhuǎn)換的輸出求乎方,這反應(yīng)了每個(gè)頻率的語(yǔ)音功率,稱之為DFT功率譜。??之后使用H角梅爾濾波器組將該能量鐠轉(zhuǎn)換為梅爾功率譜,每個(gè)梅爾能養(yǎng)譜槽的??輸出代表其覆蓋的多個(gè)頻帶的....


圖2-4?GMM-UBM模型訓(xùn)練-識(shí)別流程圖??

圖2-4?GMM-UBM模型訓(xùn)練-識(shí)別流程圖??

UniversalBackgroundModel,UBM).?[36,37]。UBM?代表了除了?目標(biāo)說(shuō)??話人之外的每個(gè)人,從本質(zhì)上來(lái)說(shuō)是一個(gè)大型的GMM。UBM是通過EM算法對(duì)??大量說(shuō)話人語(yǔ)音訓(xùn)練出來(lái)的獨(dú)立于說(shuō)話人的背景模型,該模型表示了特征向量與??說(shuō)話人無(wú)關(guān)的分布g當(dāng)新....



本文編號(hào):3967790

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/xinxigongchenglunwen/3967790.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶38a22***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com