采用M-矢量和支持向量機(jī)的說(shuō)話人確認(rèn)系統(tǒng)
【圖文】:
后通過(guò)MLLR超矢量形成方法從UBM模型自適應(yīng)得到該說(shuō)話人的變換矩陣W,把W的所有行按順序排列起來(lái)得到MLLR超矢量.對(duì)超矢量進(jìn)行重疊加窗分割(含重疊元素的均勻分割)就得到一系列的新矢量Mi,這些新矢量就稱為M-矢量[3],該過(guò)程如圖1所示,圖中黑色方塊表示MLLR超矢量的每一維.其中重疊分割的目的是為了能充分挖掘不同特征維度空間中潛在的能反映說(shuō)話人身份特性的信息,可類比特征提取過(guò)程中對(duì)原始語(yǔ)音信號(hào)進(jìn)行重疊加窗分幀的做法.圖1M-矢量的結(jié)構(gòu)2.2多類MLLRM-矢量估計(jì)與M-矢量的產(chǎn)生不同,本文中多類MLLRM-矢量是在UBM子空間基礎(chǔ)上進(jìn)行MLLR自適應(yīng)而獲得.在此借鑒了傳統(tǒng)音素類MLLR自適應(yīng)技術(shù)的優(yōu)點(diǎn),采用多個(gè)子空間來(lái)描述語(yǔ)音信號(hào)中含有的豐富細(xì)節(jié)信息.如從不同的UBM子空間中估計(jì)出的M-矢量可從不同語(yǔ)義層面、信道類型、說(shuō)話人習(xí)慣用語(yǔ)等方面對(duì)說(shuō)話人的原始語(yǔ)音進(jìn)行細(xì)節(jié)描述.其估計(jì)流程如下.·64·華中科技大學(xué)學(xué)報(bào)(自然科學(xué)版)第42卷
象減輕,無(wú)須估計(jì)大量的HMM參數(shù).2.3說(shuō)話人確認(rèn)系統(tǒng)構(gòu)建SVM作為一種直接以最小化分類錯(cuò)誤為目標(biāo)函數(shù)的分類器,在說(shuō)話人確認(rèn)這種兩類分類問(wèn)題中優(yōu)勢(shì)明顯,但因說(shuō)話人識(shí)別中目標(biāo)說(shuō)話人的訓(xùn)練語(yǔ)料非常少的特殊性而使得SVM的潛能尚未充分得到發(fā)揮,如在文獻(xiàn)[9]中,每位目標(biāo)說(shuō)話人的正例樣本點(diǎn)就只有一個(gè)GMM均值超向量.本研究提出一種全新的基于支持向量機(jī)的說(shuō)話人確認(rèn)系統(tǒng),它將多類MLLRM-矢量作為SVM的輸入特征進(jìn)行模型的訓(xùn)練和測(cè)試,其模型訓(xùn)練流程如圖2所示,具體步驟如下:步驟1將UBM通過(guò)EM算法聚類成S個(gè)子空間;步驟2冒認(rèn)者和目標(biāo)說(shuō)話人的每一句原始語(yǔ)音分別通過(guò)MLLR算法在各子空間中進(jìn)行自適應(yīng),構(gòu)建每句話在每個(gè)子空間中對(duì)應(yīng)的M-矢量,得到對(duì)應(yīng)于各子空間的M-矢量集合;圖2基于多類MLLRM-矢量的支持向量機(jī)說(shuō)話人確認(rèn)系統(tǒng)訓(xùn)練流程步驟3將M-矢量作為SVM的輸入特征并在其核空間中進(jìn)行信道補(bǔ)償及相應(yīng)的說(shuō)話人模型訓(xùn)練,用以消除跨信道的問(wèn)題,從而得到最終每位目標(biāo)說(shuō)話人的SVM模型.在測(cè)試階段,對(duì)于每一段原始語(yǔ)音,同樣經(jīng)過(guò)上述三個(gè)步驟在SVM核空間中進(jìn)行信道補(bǔ)償與測(cè)試,得到用于最終判決的SVM得分.這里提出的說(shuō)話人確認(rèn)系統(tǒng)由于采用了基于UBM子空間的多類M-矢量,即每位目標(biāo)說(shuō)話人的訓(xùn)練正例樣本數(shù)為子空間數(shù)S乘以每個(gè)子空間對(duì)應(yīng)的M-矢量數(shù)目N,從而使得目標(biāo)說(shuō)話人的正例樣本數(shù)大大增加,能很好地解決訓(xùn)練數(shù)據(jù)的稀疏問(wèn)題,在更大程度上挖掘出SVM強(qiáng)大的分類能力.須要提出的是:SVM
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 何昕,劉重慶,李介谷;基于支撐向量機(jī)的說(shuō)話人確認(rèn)系統(tǒng)[J];計(jì)算機(jī)工程與應(yīng)用;2000年12期
2 鄧浩江,王守覺(jué),杜利民;優(yōu)先度排序RBF神經(jīng)網(wǎng)絡(luò)在與文本無(wú)關(guān)說(shuō)話人確認(rèn)中的應(yīng)用[J];電子與信息學(xué)報(bào);2003年09期
3 忻棟,楊瑩春,吳朝暉;基于SVM-HMM混合模型的說(shuō)話人確認(rèn)[J];計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào);2002年11期
4 殷啟新,楊鑒;基于高斯混合模型和假設(shè)檢驗(yàn)方法的說(shuō)話人確認(rèn)[J];計(jì)算機(jī)應(yīng)用;2004年S1期
5 李軼,范影樂(lè);基于倒譜與復(fù)雜性的說(shuō)話人確認(rèn)系統(tǒng)[J];杭州電子工業(yè)學(xué)院學(xué)報(bào);2004年06期
6 郭武;戴禮榮;王仁華;;基于均值超矢量聚類和特征映射的說(shuō)話人確認(rèn)[J];數(shù)據(jù)采集與處理;2009年01期
7 張怡穎,朱小燕,張鈸;一種新的說(shuō)話人確認(rèn)方法[J];軟件學(xué)報(bào);1999年04期
8 馬靜;侯麗敏;王朔中;;基于全局背景模型和競(jìng)爭(zhēng)者模型的說(shuō)話人確認(rèn)系統(tǒng)[J];聲學(xué)技術(shù);2007年01期
9 陳皓,付中華,趙榮椿;說(shuō)話人確認(rèn)中針對(duì)語(yǔ)音編碼差異的似然比得分補(bǔ)償方法[J];西北工業(yè)大學(xué)學(xué)報(bào);2005年04期
10 石如亮;王波;李弼程;高新建;;低速率信道環(huán)境下魯棒的說(shuō)話人確認(rèn)[J];計(jì)算機(jī)應(yīng)用;2007年04期
相關(guān)會(huì)議論文 前10條
1 張濤;王嵐;遲惠生;;基于VQ的說(shuō)話人確認(rèn)系統(tǒng)的硬件實(shí)現(xiàn)[A];第六屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C];2001年
2 趙亞麗;付中華;謝磊;張健;張艷寧;;雙麥克風(fēng)語(yǔ)音增強(qiáng)和雜混模型訓(xùn)練相結(jié)合的頑健說(shuō)話人確認(rèn)[A];第十一屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集(一)[C];2011年
3 陳勝;徐明星;;基于Feature Warping和ICA的發(fā)音方式魯棒的說(shuō)話人確認(rèn)[A];第十一屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集(一)[C];2011年
4 楊藝敏;景新幸;楊海燕;;PSO-SVM在說(shuō)話人確認(rèn)系統(tǒng)中的研究[A];泛在信息社會(huì)中的聲學(xué)——中國(guó)聲學(xué)學(xué)會(huì)2010年全國(guó)會(huì)員代表大會(huì)暨學(xué)術(shù)會(huì)議論文集[C];2010年
5 展領(lǐng);景新幸;;矢量量化和VQ-UBM在說(shuō)話人確認(rèn)中的應(yīng)用[A];中國(guó)聲學(xué)學(xué)會(huì)2009年青年學(xué)術(shù)會(huì)議[CYCA’09]論文集[C];2009年
6 陳龍;吳志勇;袁春;蒙美玲;蔡蓮紅;;面向數(shù)字版權(quán)管理的聲紋輔助認(rèn)證系統(tǒng)[A];第十一屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集(一)[C];2011年
7 吳璽宏;遲惠生;;一種高性能的限定文本說(shuō)話人確認(rèn)系統(tǒng)[A];第三屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C];1994年
8 鮑福良;方志剛;徐潔;;基于MFCC和GMM的說(shuō)話人確認(rèn)研究[A];第六屆全國(guó)信息獲取與處理學(xué)術(shù)會(huì)議論文集(2)[C];2008年
9 彭詩(shī)雅;;聲紋識(shí)別技術(shù)研究[A];第十六屆全國(guó)青年通信學(xué)術(shù)會(huì)議論文集(上)[C];2011年
10 洪青陽(yáng);陳毅東;;一種用于說(shuō)話人確認(rèn)的區(qū)別性訓(xùn)練方法[A];第八屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C];2005年
相關(guān)重要報(bào)紙文章 前4條
1 北京大學(xué)信息科學(xué)中心視覺(jué)與聽(tīng)覺(jué)信息處理國(guó)家重點(diǎn)實(shí)驗(yàn)室 吳璽宏;聲紋識(shí)別聽(tīng)聲辨人[N];計(jì)算機(jī)世界;2001年
2 實(shí)習(xí)生 沈春梅;鑒定薩達(dá)姆錄音真假[N];科技日?qǐng)?bào);2003年
3 吳璽宏;聲紋識(shí)別應(yīng)用前景[N];計(jì)算機(jī)世界;2001年
4 ;解密聲紋鎖 一聲令下,“芝麻開(kāi)門”[N];廣東科技報(bào);2011年
相關(guān)博士學(xué)位論文 前10條
1 劉明輝;基于GMM和SVM的文本無(wú)關(guān)的說(shuō)話人確認(rèn)方法研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2007年
2 陸偉;基于缺失特征的文本無(wú)關(guān)說(shuō)話人識(shí)別魯棒性研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2008年
3 許東星;基于GMM和高層信息特征的文本無(wú)關(guān)說(shuō)話人識(shí)別研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2009年
4 解焱陸;基于特征變換和分類的文本無(wú)關(guān)電話語(yǔ)音說(shuō)話人識(shí)別研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2007年
5 姚志強(qiáng);說(shuō)話人識(shí)別中提高GMM性能方法的研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2006年
6 李冬冬;基于拓展和聚類的情感魯棒說(shuō)話人識(shí)別研究[D];浙江大學(xué);2008年
7 龍艷花;基于SVM的話者確認(rèn)關(guān)鍵技術(shù)研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2011年
8 蔣曄;基于短語(yǔ)音和信道變化的說(shuō)話人識(shí)別研究[D];南京理工大學(xué);2013年
9 郭武;復(fù)雜信道下的說(shuō)話人識(shí)別[D];中國(guó)科學(xué)技術(shù)大學(xué);2007年
10 高二中;對(duì)話電話語(yǔ)音的話者確認(rèn)研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2011年
相關(guān)碩士學(xué)位論文 前10條
1 花城;說(shuō)話人確認(rèn)的特征域補(bǔ)償方法研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2014年
2 尹聰;基于感知對(duì)數(shù)面積比系數(shù)的說(shuō)話人確認(rèn)系統(tǒng)的研究[D];太原理工大學(xué);2013年
3 周毓;基于因子分析的說(shuō)話人確認(rèn)[D];中國(guó)科學(xué)技術(shù)大學(xué);2010年
4 駱啟帆;基于聲門信息的說(shuō)話人確認(rèn)方法研究[D];杭州電子科技大學(xué);2014年
5 李成;基于SoPC技術(shù)的便攜式說(shuō)話人確認(rèn)系統(tǒng)研究與實(shí)現(xiàn)[D];北京交通大學(xué);2010年
6 余巍;基于排序GMM的說(shuō)話人確認(rèn)的研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2011年
7 李軼;說(shuō)話人識(shí)別系統(tǒng)研究[D];浙江大學(xué);2003年
8 哈斯塔木嘎;嵌入式Linux環(huán)境下與文本有關(guān)的說(shuō)話人確認(rèn)系統(tǒng)實(shí)現(xiàn)[D];內(nèi)蒙古大學(xué);2009年
9 周昆湘;基于矢量量化的與文本無(wú)關(guān)的說(shuō)話人確認(rèn)系統(tǒng)的研究[D];中南大學(xué);2007年
10 趙靖;基于高斯混合模型的說(shuō)話人確認(rèn)魯棒性研究和系統(tǒng)實(shí)現(xiàn)[D];重慶大學(xué);2008年
,本文編號(hào):2570105
本文鏈接:http://www.sikaile.net/kejilunwen/wltx/2570105.html