天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 信息工程論文 >

基于改進(jìn)的深度神經(jīng)網(wǎng)絡(luò)的說(shuō)話人辨認(rèn)研究

發(fā)布時(shí)間:2018-02-20 23:40

  本文關(guān)鍵詞: 說(shuō)話人辨認(rèn) 堆疊降噪自編碼 深度信念網(wǎng)絡(luò) 整流線性單元 出處:《電子器件》2017年05期  論文類型:期刊論文


【摘要】:說(shuō)話人辨認(rèn)技術(shù)在許多領(lǐng)域有著廣泛的應(yīng)用前景。首先研究了兩種基本的深度神經(jīng)網(wǎng)絡(luò)模型(深度信念網(wǎng)絡(luò)和降噪自編碼)在說(shuō)話人辨認(rèn)上的應(yīng)用,深度神經(jīng)網(wǎng)絡(luò)通過(guò)逐層無(wú)監(jiān)督的預(yù)訓(xùn)練和有監(jiān)督的反向微調(diào)避免了反向傳播容易陷入局部最小值的缺陷,通過(guò)實(shí)驗(yàn)證明了當(dāng)神經(jīng)元個(gè)數(shù)達(dá)到一定數(shù)量之后深度網(wǎng)絡(luò)模型是優(yōu)于普通BP網(wǎng)絡(luò)的,并且其性能隨著網(wǎng)絡(luò)規(guī)模的擴(kuò)大而提升。考慮到大規(guī)模的深度網(wǎng)絡(luò)訓(xùn)練時(shí)間較長(zhǎng)的缺點(diǎn),提出使用整流線性單元(Re LU)代替?zhèn)鹘y(tǒng)的sigmoid類函數(shù)對(duì)說(shuō)話人識(shí)別的深度模型進(jìn)行改進(jìn),實(shí)驗(yàn)結(jié)果表明改進(jìn)后的深度模型平均訓(xùn)練時(shí)間減少了35%,平均誤識(shí)率降低了8.3%。
[Abstract]:Speaker identification technology has a wide application prospect in many fields. Firstly, two basic depth neural network models (depth belief network and noise reduction self-coding) are studied. The depth neural network avoids the defect that backpropagation is prone to fall into local minimum by layer by layer unsupervised pre-training and supervised reverse fine-tuning. The experiments show that the depth network model is superior to the common BP network when the number of neurons reaches a certain number, and its performance is improved with the expansion of the network size. This paper proposes an improved depth model for speaker recognition using rectifier linear unit re LU instead of the traditional sigmoid class function. The experimental results show that the average training time of the improved depth model is reduced by 35% and the average error rate is reduced by 8.3%.
【作者單位】: 南京工程學(xué)院電力工程學(xué)院;東南大學(xué)信息科學(xué)與工程學(xué)院;
【基金】:國(guó)家自然科學(xué)基金項(xiàng)目(61301219) 南京工程學(xué)院校級(jí)項(xiàng)目(YKJ201107) 2014年青藍(lán)工程項(xiàng)目
【分類號(hào)】:TN912.3;TP183

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 劉文舉,孫兵,鐘秋海;基于說(shuō)話人分類技術(shù)的分級(jí)說(shuō)話人識(shí)別研究[J];電子學(xué)報(bào);2005年07期

2 丁輝;唐振民;錢博;李燕萍;;易擴(kuò)展小樣本環(huán)境說(shuō)話人辨認(rèn)系統(tǒng)的研究[J];系統(tǒng)仿真學(xué)報(bào);2008年10期

3 劉明輝;黃中偉;熊繼平;;用于說(shuō)話人辨識(shí)的評(píng)分規(guī)整[J];計(jì)算機(jī)工程與應(yīng)用;2010年12期

4 陳雪芳;楊繼臣;;一種三層判決的說(shuō)話人索引算法[J];計(jì)算機(jī)工程;2012年02期

5 楊繼臣;何俊;李艷雄;;一種基于性別的說(shuō)話人索引算法[J];計(jì)算機(jī)工程與科學(xué);2012年06期

6 何致遠(yuǎn),胡起秀,徐光yP;兩級(jí)決策的開集說(shuō)話人辨認(rèn)方法[J];清華大學(xué)學(xué)報(bào)(自然科學(xué)版);2003年04期

7 殷啟新,韓春光,楊鑒;基于掌上電腦錄音的說(shuō)話人辨認(rèn)[J];云南民族學(xué)院學(xué)報(bào)(自然科學(xué)版);2003年04期

8 呂聲,尹俊勛;同語(yǔ)種說(shuō)話人轉(zhuǎn)換的實(shí)現(xiàn)[J];移動(dòng)通信;2004年S3期

9 董明,劉加,劉潤(rùn)生;快速口音自適應(yīng)的動(dòng)態(tài)說(shuō)話人選擇性訓(xùn)練[J];清華大學(xué)學(xué)報(bào)(自然科學(xué)版);2005年07期

10 曹敏;王浩川;;說(shuō)話人自動(dòng)識(shí)別技術(shù)研究[J];中州大學(xué)學(xué)報(bào);2007年02期

相關(guān)會(huì)議論文 前10條

1 司羅;胡起秀;金琴;;完全無(wú)監(jiān)督的雙人對(duì)話中的說(shuō)話人分隔[A];第九屆全國(guó)信號(hào)處理學(xué)術(shù)年會(huì)(CCSP-99)論文集[C];1999年

2 金乃高;侯剛;王學(xué)輝;李非墨;;基于主動(dòng)感知的音視頻聯(lián)合說(shuō)話人跟蹤方法[A];2010年通信理論與信號(hào)處理學(xué)術(shù)年會(huì)論文集[C];2010年

3 馬勇;鮑長(zhǎng)春;夏丙寅;;基于辨別性深度信念網(wǎng)絡(luò)的說(shuō)話人分割[A];第十二屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議(NCMMSC'2013)論文集[C];2013年

4 白俊梅;張樹武;徐波;;廣播電視中的目標(biāo)說(shuō)話人跟蹤技術(shù)[A];第八屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C];2005年

5 索宏彬;劉曉星;;基于高斯混合模型的說(shuō)話人跟蹤系統(tǒng)[A];第八屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C];2005年

6 羅海風(fēng);龍長(zhǎng)才;;多話者環(huán)境下說(shuō)話人辨識(shí)聽覺(jué)線索研究[A];中國(guó)聲學(xué)學(xué)會(huì)2009年青年學(xué)術(shù)會(huì)議[CYCA’09]論文集[C];2009年

7 王剛;鄔曉鈞;鄭方;王琳琳;張陳昊;;基于參考說(shuō)話人模型和雙層結(jié)構(gòu)的說(shuō)話人辨認(rèn)快速算法[A];第十一屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集(一)[C];2011年

8 王剛;鄔曉鈞;鄭方;王琳琳;張陳昊;;基于參考說(shuō)話人模型和雙層結(jié)構(gòu)的說(shuō)話人辨認(rèn)[A];第十一屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集(二)[C];2011年

9 何磊;方棣棠;吳文虎;;說(shuō)話人聚類與模型自適應(yīng)結(jié)合的說(shuō)話人自適應(yīng)方法[A];第六屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C];2001年

10 張彬橋;;基于主分量分析的說(shuō)話人特征提取[A];2006北京地區(qū)高校研究生學(xué)術(shù)交流會(huì)——通信與信息技術(shù)會(huì)議論文集(上)[C];2006年

相關(guān)博士學(xué)位論文 前10條

1 李威;多人會(huì)話語(yǔ)音中的說(shuō)話人角色分析[D];華南理工大學(xué);2015年

2 楊繼臣;說(shuō)話人信息分析及其在多媒體檢索中的應(yīng)用研究[D];華南理工大學(xué);2010年

3 鄭建煒;基于核方法的說(shuō)話人辨認(rèn)模型研究[D];浙江工業(yè)大學(xué);2010年

4 呂聲;說(shuō)話人轉(zhuǎn)換方法的研究[D];華南理工大學(xué);2004年

5 陳凌輝;說(shuō)話人轉(zhuǎn)換建模方法研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2013年

6 玄成君;基于語(yǔ)音頻率特性抑制音素影響的說(shuō)話人特征提取[D];天津大學(xué);2014年

7 李燕萍;說(shuō)話人辨認(rèn)中的特征參數(shù)提取和魯棒性技術(shù)研究[D];南京理工大學(xué);2009年

8 徐利敏;說(shuō)話人辨認(rèn)中的特征變換和魯棒性技術(shù)研究[D];南京理工大學(xué);2008年

9 王堅(jiān);語(yǔ)音識(shí)別中的說(shuō)話人自適應(yīng)研究[D];北京郵電大學(xué);2007年

10 侯代文;非線性濾波及其在說(shuō)話人跟蹤中的應(yīng)用研究[D];大連理工大學(xué);2008年

相關(guān)碩士學(xué)位論文 前10條

1 楊浩;基于廣義音素的文本無(wú)關(guān)說(shuō)話人認(rèn)證的研究[D];北京郵電大學(xué);2008年

2 蔣博;特定目標(biāo)說(shuō)話人的語(yǔ)音轉(zhuǎn)換系統(tǒng)設(shè)計(jì)[D];電子科技大學(xué);2015年

3 陳雨鶯;基于EMD的說(shuō)話人特征參數(shù)提取方法研究[D];湘潭大學(xué);2015年

4 單燕燕;變音環(huán)境下魯棒性說(shuō)話人辨認(rèn)關(guān)鍵技術(shù)研究[D];南京郵電大學(xué);2015年

5 肖澤蘋;無(wú)線電對(duì)講語(yǔ)音的說(shuō)話人分割聚類研究[D];北京理工大學(xué);2016年

6 李銳;基于因子分析的說(shuō)話人分離技術(shù)研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2016年

7 張亞明;說(shuō)話人性別識(shí)別和年齡估計(jì)的系統(tǒng)研制[D];華南理工大學(xué);2016年

8 倪冬琴;基于特征子空間量化的文本無(wú)關(guān)說(shuō)話人年齡識(shí)別[D];蘇州大學(xué);2016年

9 李灣灣;說(shuō)話人聲紋識(shí)別的算法研究[D];浙江大學(xué);2017年

10 唐郅;語(yǔ)音驅(qū)動(dòng)虛擬說(shuō)話人研究[D];西南交通大學(xué);2017年



本文編號(hào):1520364

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/xinxigongchenglunwen/1520364.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶55a69***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com