天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 自動(dòng)化論文 >

采用深度神經(jīng)網(wǎng)絡(luò)的說(shuō)話人特征提取方法

發(fā)布時(shí)間:2018-03-25 11:03

  本文選題:說(shuō)話人確認(rèn) 切入點(diǎn):深度神經(jīng)網(wǎng)絡(luò) 出處:《小型微型計(jì)算機(jī)系統(tǒng)》2017年01期


【摘要】:在說(shuō)話人確認(rèn)中,通常采用的聲學(xué)特征(如MFCC,PLP特征等)包含的主要是文本信息和信道信息,說(shuō)話人信息屬于其中的弱信息,極易受到語(yǔ)音信號(hào)中的文本信息及信道、噪聲等干擾的影響.針對(duì)這個(gè)問(wèn)題,提出一種基于深度神經(jīng)網(wǎng)絡(luò)提取語(yǔ)音信號(hào)中說(shuō)話人特征的方法,該方法用語(yǔ)音識(shí)別深度神經(jīng)網(wǎng)絡(luò)各個(gè)隱層非線性輸出值來(lái)提取說(shuō)話人特征.在RSR2015數(shù)據(jù)庫(kù)上開(kāi)展了GMM-UBM文本無(wú)關(guān)和文本相關(guān)說(shuō)話人確認(rèn)實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果表明本文方法提取的特征相對(duì)于傳統(tǒng)的MFCC特征,系統(tǒng)等錯(cuò)誤率(Equal Error Rate,EER)有了明顯的下降.
[Abstract]:In the speaker confirmation, the acoustic features (such as MFCC / PLP) mainly contain the text information and channel information, and the speaker information belongs to the weak information, so it is vulnerable to the text information and the channel in the speech signal. Aiming at this problem, a method of extracting speaker features from speech signal based on depth neural network is proposed. The method uses the nonlinear output values of speech recognition depth neural network to extract the speaker features. The GMM-UBM text-independent and text-dependent speaker validation experiments are carried out on the RSR2015 database. The experimental results show that compared with the traditional MFCC feature, the equal Error error rate (equal Error rate) of the proposed method is significantly reduced.
【作者單位】: 中國(guó)科學(xué)技術(shù)大學(xué)語(yǔ)音及語(yǔ)言信息處理國(guó)家工程實(shí)驗(yàn)室;百度在線網(wǎng)絡(luò)技術(shù)有限公司;
【基金】:國(guó)家自然科學(xué)基金項(xiàng)目(61273264)資助
【分類(lèi)號(hào)】:TP183;TN912.3

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 丁輝;唐振民;錢(qián)博;李燕萍;;易擴(kuò)展小樣本環(huán)境說(shuō)話人辨認(rèn)系統(tǒng)的研究[J];系統(tǒng)仿真學(xué)報(bào);2008年10期

2 劉明輝;黃中偉;熊繼平;;用于說(shuō)話人辨識(shí)的評(píng)分規(guī)整[J];計(jì)算機(jī)工程與應(yīng)用;2010年12期

3 陳雪芳;楊繼臣;;一種三層判決的說(shuō)話人索引算法[J];計(jì)算機(jī)工程;2012年02期

4 楊繼臣;何俊;李艷雄;;一種基于性別的說(shuō)話人索引算法[J];計(jì)算機(jī)工程與科學(xué);2012年06期

5 何致遠(yuǎn),胡起秀,徐光yP;兩級(jí)決策的開(kāi)集說(shuō)話人辨認(rèn)方法[J];清華大學(xué)學(xué)報(bào)(自然科學(xué)版);2003年04期

6 殷啟新,韓春光,楊鑒;基于掌上電腦錄音的說(shuō)話人辨認(rèn)[J];云南民族學(xué)院學(xué)報(bào)(自然科學(xué)版);2003年04期

7 呂聲,尹俊勛;同語(yǔ)種說(shuō)話人轉(zhuǎn)換的實(shí)現(xiàn)[J];移動(dòng)通信;2004年S3期

8 董明,劉加,劉潤(rùn)生;快速口音自適應(yīng)的動(dòng)態(tài)說(shuō)話人選擇性訓(xùn)練[J];清華大學(xué)學(xué)報(bào)(自然科學(xué)版);2005年07期

9 曹敏;王浩川;;說(shuō)話人自動(dòng)識(shí)別技術(shù)研究[J];中州大學(xué)學(xué)報(bào);2007年02期

10 王堅(jiān);;基于支撐向量選擇的說(shuō)話人自適應(yīng)[J];中國(guó)新通信;2007年11期

相關(guān)會(huì)議論文 前10條

1 司羅;胡起秀;金琴;;完全無(wú)監(jiān)督的雙人對(duì)話中的說(shuō)話人分隔[A];第九屆全國(guó)信號(hào)處理學(xué)術(shù)年會(huì)(CCSP-99)論文集[C];1999年

2 金乃高;侯剛;王學(xué)輝;李非墨;;基于主動(dòng)感知的音視頻聯(lián)合說(shuō)話人跟蹤方法[A];2010年通信理論與信號(hào)處理學(xué)術(shù)年會(huì)論文集[C];2010年

3 馬勇;鮑長(zhǎng)春;夏丙寅;;基于辨別性深度信念網(wǎng)絡(luò)的說(shuō)話人分割[A];第十二屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議(NCMMSC'2013)論文集[C];2013年

4 白俊梅;張樹(shù)武;徐波;;廣播電視中的目標(biāo)說(shuō)話人跟蹤技術(shù)[A];第八屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C];2005年

5 索宏彬;劉曉星;;基于高斯混合模型的說(shuō)話人跟蹤系統(tǒng)[A];第八屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C];2005年

6 羅海風(fēng);龍長(zhǎng)才;;多話者環(huán)境下說(shuō)話人辨識(shí)聽(tīng)覺(jué)線索研究[A];中國(guó)聲學(xué)學(xué)會(huì)2009年青年學(xué)術(shù)會(huì)議[CYCA’09]論文集[C];2009年

7 王剛;鄔曉鈞;鄭方;王琳琳;張陳昊;;基于參考說(shuō)話人模型和雙層結(jié)構(gòu)的說(shuō)話人辨認(rèn)快速算法[A];第十一屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集(一)[C];2011年

8 李經(jīng)偉;;語(yǔ)體轉(zhuǎn)換與角色定位[A];全國(guó)語(yǔ)言與符號(hào)學(xué)研究會(huì)第五屆研討會(huì)論文摘要集[C];2002年

9 王剛;鄔曉鈞;鄭方;王琳琳;張陳昊;;基于參考說(shuō)話人模型和雙層結(jié)構(gòu)的說(shuō)話人辨認(rèn)[A];第十一屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集(二)[C];2011年

10 何磊;方棣棠;吳文虎;;說(shuō)話人聚類(lèi)與模型自適應(yīng)結(jié)合的說(shuō)話人自適應(yīng)方法[A];第六屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C];2001年

相關(guān)重要報(bào)紙文章 前3條

1 ;做一名積極的傾聽(tīng)者[N];中國(guó)紡織報(bào);2003年

2 唐志強(qiáng);不聽(tīng)別人說(shuō)話,也能模仿其口音[N];新華每日電訊;2010年

3 黃惠慧(南京師范大學(xué)附屬揚(yáng)子中學(xué));高考聽(tīng)力要求及對(duì)策[N];中國(guó)教育資訊報(bào);2002年

相關(guān)博士學(xué)位論文 前10條

1 李洪儒;語(yǔ)句中的說(shuō)話人形象[D];黑龍江大學(xué);2003年

2 李威;多人會(huì)話語(yǔ)音中的說(shuō)話人角色分析[D];華南理工大學(xué);2015年

3 楊繼臣;說(shuō)話人信息分析及其在多媒體檢索中的應(yīng)用研究[D];華南理工大學(xué);2010年

4 鄭建煒;基于核方法的說(shuō)話人辨認(rèn)模型研究[D];浙江工業(yè)大學(xué);2010年

5 呂聲;說(shuō)話人轉(zhuǎn)換方法的研究[D];華南理工大學(xué);2004年

6 陳凌輝;說(shuō)話人轉(zhuǎn)換建模方法研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2013年

7 玄成君;基于語(yǔ)音頻率特性抑制音素影響的說(shuō)話人特征提取[D];天津大學(xué);2014年

8 李燕萍;說(shuō)話人辨認(rèn)中的特征參數(shù)提取和魯棒性技術(shù)研究[D];南京理工大學(xué);2009年

9 徐利敏;說(shuō)話人辨認(rèn)中的特征變換和魯棒性技術(shù)研究[D];南京理工大學(xué);2008年

10 王堅(jiān);語(yǔ)音識(shí)別中的說(shuō)話人自適應(yīng)研究[D];北京郵電大學(xué);2007年

相關(guān)碩士學(xué)位論文 前10條

1 楊浩;基于廣義音素的文本無(wú)關(guān)說(shuō)話人認(rèn)證的研究[D];北京郵電大學(xué);2008年

2 史夢(mèng)潔;構(gòu)式“沒(méi)有比X更Y的(了)”研究[D];上海師范大學(xué);2015年

3 魏君;“說(shuō)你什么好”的多角度研究[D];河北大學(xué);2015年

4 解冬悅;互動(dòng)韻律:英語(yǔ)多人沖突性話語(yǔ)中說(shuō)話人的首音模式研究[D];大連外國(guó)語(yǔ)大學(xué);2015年

5 朱韋巍;揚(yáng)州街上話語(yǔ)氣詞研究[D];南京林業(yè)大學(xué);2015年

6 蔣博;特定目標(biāo)說(shuō)話人的語(yǔ)音轉(zhuǎn)換系統(tǒng)設(shè)計(jì)[D];電子科技大學(xué);2015年

7 王雅丹;漢語(yǔ)反語(yǔ)研究[D];南昌大學(xué);2015年

8 陳雨鶯;基于EMD的說(shuō)話人特征參數(shù)提取方法研究[D];湘潭大學(xué);2015年

9 單燕燕;變音環(huán)境下魯棒性說(shuō)話人辨認(rèn)關(guān)鍵技術(shù)研究[D];南京郵電大學(xué);2015年

10 陳sネ,

本文編號(hào):1662834


資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/zidonghuakongzhilunwen/1662834.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶abd2c***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com