一種基于GMM-DNN的說話人確認(rèn)方法
本文關(guān)鍵詞:一種基于GMM-DNN的說話人確認(rèn)方法
更多相關(guān)文章: 說話人識別 深度神經(jīng)網(wǎng)絡(luò) 高斯混合模型 統(tǒng)計(jì)參數(shù)
【摘要】:針對說話人確認(rèn)中話者建模問題,提出GMM-DNN的混合建模方法。該方法先通過GMM提取原始語音特征的統(tǒng)計(jì)特征,然后進(jìn)一步通過DNN非線性映射的方式將統(tǒng)計(jì)特征變換到一個(gè)與說話人相關(guān)的線性可分空間。選用棧式自編碼神經(jīng)網(wǎng)絡(luò)SAE(Stacked Auto-encoder Neutral Network)作為深度神經(jīng)網(wǎng)絡(luò)的基本模型。在注冊階段從已訓(xùn)練的DNN網(wǎng)絡(luò)中抽取最后一層作為說話人模型,稱為p-vector。測試階段,通過抽取測試語音的p-vector與注冊說話人p-vector進(jìn)行匹配,從而作出判決;另外還詳細(xì)說明了DNN隱藏層的作用。通過對NIST語料庫的實(shí)驗(yàn)表明,采用GMM-DNN的說話人確認(rèn)方法相對于傳統(tǒng)的GMM-UBM話者建模方法具有一定的優(yōu)勢。
【作者單位】: 公安部物證鑒定中心;中國科學(xué)技術(shù)大學(xué)電子科學(xué)與技術(shù)系;
【關(guān)鍵詞】: 說話人識別 深度神經(jīng)網(wǎng)絡(luò) 高斯混合模型 統(tǒng)計(jì)參數(shù)
【基金】:北京市科委項(xiàng)目(Z141100006014002)
【分類號】:TN912.34;TP183
【正文快照】: 0引言 隨著語音相關(guān)技術(shù)的發(fā)展和成熟,在日常生活中語音的應(yīng)用越來越廣泛,而語音作為證據(jù)在安全方面的應(yīng)用也日益重要,使得對說話人確認(rèn)技術(shù)的需求越來越迫切。說話人確認(rèn)[1]的任務(wù)是通過測試給定語音波形信號中包含的說話人個(gè)性信息,從而對其聲明的身份進(jìn)行判決。目前,主流
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 郭偉;李輝;許敏強(qiáng);劉青松;;基于高維空間映射失配補(bǔ)償方法的說話人確認(rèn)[J];中國科學(xué)技術(shù)大學(xué)學(xué)報(bào);2010年02期
2 張怡穎,朱小燕,張鈸;一種新的說話人確認(rèn)方法[J];軟件學(xué)報(bào);1999年04期
3 翁武斌,方棣棠;應(yīng)用分段辨認(rèn)序列頻度信息的說話人確認(rèn)方法[J];中文信息學(xué)報(bào);2000年05期
4 文學(xué),劉加,劉潤生;一種改進(jìn)的新型說話人確認(rèn)算法[J];清華大學(xué)學(xué)報(bào)(自然科學(xué)版);2003年01期
5 陳繼旭;劉明輝;戴蓓劏;李輝;;文本無關(guān)說話人確認(rèn)中的一種新的評分規(guī)整方法[J];信號處理;2006年04期
6 劉明輝;戴蓓劏;解焱陸;;基于GMM多維概率輸出的SVM話者確認(rèn)[J];模式識別與人工智能;2008年01期
7 解焱陸;劉青松;戴蓓劏;李輝;;一種用于魯棒性說話人確認(rèn)的分段概率分布參數(shù)規(guī)整方法[J];電路與系統(tǒng)學(xué)報(bào);2008年06期
8 郭武;李軼杰;戴禮榮;王仁華;;采用非監(jiān)督得分規(guī)整和因子分析的說話人確認(rèn)[J];電子學(xué)報(bào);2009年04期
9 許東星;戴蓓劏;許敏強(qiáng);劉青松;;聲母發(fā)聲特點(diǎn)參數(shù)的提取及其提高說話人確認(rèn)魯棒性的研究[J];信號處理;2009年09期
10 陳存寶;趙力;;嵌入時(shí)延網(wǎng)絡(luò)的高斯混合背景模型說話人確認(rèn)[J];信號處理;2010年04期
中國重要會議論文全文數(shù)據(jù)庫 前10條
1 吳璽宏;遲惠生;;一種高性能的限定文本說話人確認(rèn)系統(tǒng)[A];第三屆全國人機(jī)語音通訊學(xué)術(shù)會議論文集[C];1994年
2 洪青陽;陳毅東;;一種用于說話人確認(rèn)的區(qū)別性訓(xùn)練方法[A];第八屆全國人機(jī)語音通訊學(xué)術(shù)會議論文集[C];2005年
3 許云飛;黃厚軍;金怡珠;李桂蓮;周若華;;基于PLDA的“一對多”下的說話人確認(rèn)方法研究[A];第十二屆全國人機(jī)語音通訊學(xué)術(shù)會議(NCMMSC'2013)論文集[C];2013年
4 展領(lǐng);景新幸;;矢量量化和VQ-UBM在說話人確認(rèn)中的應(yīng)用[A];中國聲學(xué)學(xué)會2009年青年學(xué)術(shù)會議[CYCA’09]論文集[C];2009年
5 趙賢宇;董遠(yuǎn);張雪峰;楊浩;王海拉;;說話人確認(rèn)系統(tǒng)中基于高斯混合分布相似度選擇TNorm背景模型的研究[A];第八屆全國人機(jī)語音通訊學(xué)術(shù)會議論文集[C];2005年
6 趙亞麗;付中華;謝磊;張健;張艷寧;;雙麥克風(fēng)語音增強(qiáng)和雜混模型訓(xùn)練相結(jié)合的頑健說話人確認(rèn)[A];第十一屆全國人機(jī)語音通訊學(xué)術(shù)會議論文集(一)[C];2011年
7 楊藝敏;景新幸;楊海燕;;PSO-SVM在說話人確認(rèn)系統(tǒng)中的研究[A];泛在信息社會中的聲學(xué)——中國聲學(xué)學(xué)會2010年全國會員代表大會暨學(xué)術(shù)會議論文集[C];2010年
8 張濤;王嵐;遲惠生;;基于VQ的說話人確認(rèn)系統(tǒng)的硬件實(shí)現(xiàn)[A];第六屆全國人機(jī)語音通訊學(xué)術(shù)會議論文集[C];2001年
9 尹聰;白靜;龔[,
本文編號:657097
本文鏈接:http://www.sikaile.net/kejilunwen/zidonghuakongzhilunwen/657097.html