語音識別中深度神經(jīng)網(wǎng)絡(luò)目標值優(yōu)化
發(fā)布時間:2017-06-02 22:14
本文關(guān)鍵詞:語音識別中深度神經(jīng)網(wǎng)絡(luò)目標值優(yōu)化,由筆耕文化傳播整理發(fā)布。
【摘要】:訓練深度神經(jīng)網(wǎng)絡(luò)聲學模型時,所采用的強制對齊得到的目標值存在無法精準地表示出語音實際狀況的問題。針對這一問題,提出一種利用前后向算法得到非0-1分布目標值的方法。由于用于強制對齊的模型可能與處理語句不完全匹配,以及發(fā)音連續(xù)性導致的過渡邊界難以分離等問題,強制對齊得到的目標值存在不合理性。新的目標值可以表示某一幀以一定概率屬于鄰近各狀態(tài)的分布情況,更詳細地描述建模單元之間的過渡,進一步還原語音的原貌,提升模型的魯棒性。同時,為尋求模型魯棒性和建模單元區(qū)分度之間的平衡,對算法得到的目標值進行加窗處理。在中文客服問答領(lǐng)域進行實驗,在小數(shù)據(jù)量上驗證了目標值對于訓練的較大影響,并且選取窗長寬度這一參數(shù)。最后將訓練數(shù)據(jù)量提升至60、80以及100 h,結(jié)果顯示,新的目標值優(yōu)化方法訓練得到的模型在識別性能上獲得提升,相對字錯誤率下降為1.10%~3.65%。多組實驗驗證新的目標值優(yōu)化方法對模型訓練有一定效果,在訓練數(shù)據(jù)量上升的情況下依然具有有效性。
【作者單位】: 中國科學院語言聲學與內(nèi)容理解重點實驗室;
【關(guān)鍵詞】: 語音識別 深度神經(jīng)網(wǎng)絡(luò) 前后向算法 目標值優(yōu)化
【基金】:國家自然科學基金資助項目(11161140319;91120001;61271426) 中國科學院戰(zhàn)略性先導科技專項項目(XDA06030100;XDA06030500) 國家“863”計劃資助項目(2012AA012503) 中科院重點部署項目資助(KGZD-EW-103-2)
【分類號】:TN912.34
【正文快照】: 語音識別的研究可以追溯到20世紀50年代。過去,主流的聲學建模方法是基于混合高斯的隱馬爾可夫模型(gaussian mixture model-hidden markovmodel,GMM-HMM)。發(fā)展至今,人工神經(jīng)網(wǎng)絡(luò)(arti-ficial neural network,ANN),因其強大的非線性關(guān)系表達能力,已逐步取代GMM。隨著近年來機
【相似文獻】
中國重要會議論文全文數(shù)據(jù)庫 前1條
1 王德彰;荒井一嘉;落合裕晶;;氣動EGR閥目標值追蹤控制開發(fā)[A];2013中國汽車工程學會年會論文集[C];2013年
中國重要報紙全文數(shù)據(jù)庫 前10條
1 首席記者 于航;主要工作目標實現(xiàn)“雙過半”[N];牡丹江日報;2007年
2 鄭曉波;國資委完善央企負責人業(yè)績考核計分規(guī)則[N];證券時報;2008年
3 記者 楊世s,
本文編號:416651
本文鏈接:http://www.sikaile.net/kejilunwen/xinxigongchenglunwen/416651.html
最近更新
教材專著