天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 信息工程論文 >

基于DNN的低資源語音識別特征提取技術(shù)

發(fā)布時間:2019-11-07 11:23
【摘要】:針對低資源訓(xùn)練數(shù)據(jù)條件下深層神經(jīng)網(wǎng)絡(luò)(Deep neural network,DNN)特征聲學(xué)建模性能急劇下降的問題,提出兩種適合于低資源語音識別的深層神經(jīng)網(wǎng)絡(luò)特征提取方法.首先基于隱含層共享訓(xùn)練的網(wǎng)絡(luò)結(jié)構(gòu),借助資源較為豐富的語料實現(xiàn)對深層瓶頸神經(jīng)網(wǎng)絡(luò)的輔助訓(xùn)練,針對BN層位于共享層的特點,引入Dropout,Maxout,Rectified linear units等技術(shù)改善多流訓(xùn)練樣本分布不規(guī)律導(dǎo)致的過擬合問題,同時縮小網(wǎng)絡(luò)參數(shù)規(guī)模、降低訓(xùn)練耗時;其次為了改善深層神經(jīng)網(wǎng)絡(luò)特征提取方法,提出一種基于凸非負矩陣分解(Convex-non-negative matrix factorization,CNMF)算法的低維高層特征提取技術(shù),通過對網(wǎng)絡(luò)的權(quán)值矩陣分解得到基矩陣作為特征層的權(quán)值矩陣,然后從該層提取一種新的低維特征.基于Vystadial 2013的1小時低資源捷克語訓(xùn)練語料的實驗表明,在26.7小時的英語語料輔助訓(xùn)練下,當使用Dropout和Rectified linear units時,識別率相對基線系統(tǒng)提升7.0%;當使用Dropout和Maxout時,識別率相對基線系統(tǒng)提升了12.6%,且網(wǎng)絡(luò)參數(shù)數(shù)量相對其他系統(tǒng)降低了62.7%,訓(xùn)練時間降低了25%.而基于矩陣分解的低維特征在單語言訓(xùn)練和輔助訓(xùn)練的兩種情況下都取得了優(yōu)于瓶頸特征(Bottleneck features,BNF)的識別率,且在輔助訓(xùn)練的情況下優(yōu)于深層神經(jīng)網(wǎng)絡(luò)隱馬爾科夫識別系統(tǒng),提升幅度從0.8%~3.4%不等.

【相似文獻】

相關(guān)期刊論文 前10條

1 郭遠瓊;提高語音識別率點滴[J];電腦技術(shù);2000年03期

2 邢文;語音識別[J];個人電腦;2000年02期

3 ;語音識別的真相[J];個人電腦;2001年12期

4 ;語音識別漸入佳境[J];個人電腦;2002年03期

5 ;微軟語音識別軟件可與人直接對話[J];自動化博覽;2003年04期

6 ;語音識別[J];印刷世界;2004年01期

7 杰里米·瓦格斯塔夫;讓語音識別軟件 解放你的雙手[J];農(nóng)業(yè)圖書情報學(xué)刊;2004年03期

8 韓紀慶,王歡良,李海峰,鄭鐵然;基于語音識別的發(fā)音學(xué)習(xí)技術(shù)[J];電聲技術(shù);2004年09期

9 陳孝強;語音識別擬起新潮[J];微電腦世界;2005年07期

10 韓紀慶;張磊;鄭鐵然;;網(wǎng)絡(luò)環(huán)境下的語音識別方法[J];計算機科學(xué);2005年01期

相關(guān)會議論文 前10條

1 張歆奕;吳今培;張其善;;語音的共性特征及其在語音識別中的應(yīng)用[A];第十屆全國信號處理學(xué)術(shù)年會(CCSP-2001)論文集[C];2001年

2 杜樹木;何良華;;一種新的基于段長分布的語音識別模型[A];2009年通信理論與信號處理學(xué)術(shù)年會論文集[C];2009年

3 李楨;高萬林;歐文浩;徐山川;;基于關(guān)鍵詞語音識別的農(nóng)業(yè)信息語音服務(wù)系統(tǒng)的研究與實現(xiàn)[A];中國農(nóng)業(yè)工程學(xué)會電氣信息與自動化專業(yè)委員會、中國電機工程學(xué)會農(nóng)村電氣化分會科技與教育專委會2010年學(xué)術(shù)年會論文摘要[C];2010年

4 張冰;龍長才;羅海風;;熟悉掩蔽音背景下的目標語音識別[A];泛在信息社會中的聲學(xué)——中國聲學(xué)學(xué)會2010年全國會員代表大會暨學(xué)術(shù)會議論文集[C];2010年

5 王承發(fā);趙德彬;金山;苗百利;朱志瑩;;語音識別應(yīng)用中抗噪聲干擾方法的初步探討[A];第二屆全國人機語音通訊學(xué)術(shù)會議論文集[C];1992年

6 杜笑平;楊啟綱;楊家沅;;過零周期轉(zhuǎn)移概率矩陣語音識別部件的研制[A];第二屆全國人機語音通訊學(xué)術(shù)會議論文集[C];1992年

7 季宏;劉志文;杜燕玲;黃曾陽;;語音識別中的音字轉(zhuǎn)換[A];第三屆全國人機語音通訊學(xué)術(shù)會議論文集[C];1994年

8 葛余博;楊大利;曾德超;;噪聲環(huán)境下語音識別的幾個問題(一)[A];第三屆全國人機語音通訊學(xué)術(shù)會議論文集[C];1994年

9 朱奇峰;俞鐵城;;聽覺中的協(xié)同現(xiàn)象和其對語音識別影響的探討[A];第四屆全國人機語音通訊學(xué)術(shù)會議論文集[C];1996年

10 姚磊;黃泰翼;陳景東;;一種高魯棒性語音識別的通用自適應(yīng)方法研究[A];第四屆全國人機語音通訊學(xué)術(shù)會議論文集[C];1996年

相關(guān)重要報紙文章 前10條

1 黃夢;方案商積極切入語音識別市場[N];電腦商報;2006年

2 閆婷;語音識別 理想與現(xiàn)實的距離[N];計算機世界;2007年

3 劉喜喜;語音識別將把鼠標鍵盤打入冷宮?[N];中國計算機報;2008年

4 樂天;語音識別:讓你的手機更聰明[N];計算機世界;2011年

5 特約作者 王佳彬;語音識別漸入佳境[N];電腦報;2002年

6 雨夏;語音識別重在應(yīng)用[N];計算機世界;2001年

7 ;語音識別企業(yè)應(yīng)用前景光明[N];計算機世界;2003年

8 王向東 欒煥博 林守勛 錢躍良;語音識別:抗噪音能力有待加強[N];計算機世界;2006年

9 上海 高博;讓電腦“聽懂”人話[N];電腦報;2008年

10 張彤;語音識別融入統(tǒng)一通信[N];網(wǎng)絡(luò)世界;2008年

相關(guān)博士學(xué)位論文 前10條

1 許金普;農(nóng)產(chǎn)品市場信息采集的語音識別魯棒性方法研究[D];中國農(nóng)業(yè)科學(xué)院;2015年

2 包希日莫;面向蒙古語的語音識別聲學(xué)建模研究[D];內(nèi)蒙古大學(xué);2016年

3 吳斌;語音識別中的后處理技術(shù)研究[D];北京郵電大學(xué);2008年

4 奉小慧;音頻噪聲環(huán)境下唇動信息在語音識別中的應(yīng)用技術(shù)研究[D];華南理工大學(xué);2010年

5 孫f,

本文編號:2557258


資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/xinxigongchenglunwen/2557258.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶53bb8***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com