基于深度神經(jīng)網(wǎng)絡的蒙古語語音識別系統(tǒng)聲學模型的研究
本文關鍵詞:基于深度神經(jīng)網(wǎng)絡的蒙古語語音識別系統(tǒng)聲學模型的研究 出處:《內(nèi)蒙古大學》2017年碩士論文 論文類型:學位論文
更多相關文章: 語音識別 神經(jīng)網(wǎng)絡 聲學模型 蒙古語 區(qū)分性訓練 說話人特征
【摘要】:語音識別是實現(xiàn)人機交互的重要手段,它的最終目的是讓人與機器能夠像人與人一樣通過語音對話實現(xiàn)交流。在最近幾年里,語音識別技術經(jīng)歷了巨大的變革,深度神經(jīng)網(wǎng)絡成功替代了高斯混合模型(GMM)成為聲學建模的主流方法。不同的神經(jīng)網(wǎng)絡結構如深度神經(jīng)網(wǎng)絡(DNN)、卷積神經(jīng)網(wǎng)絡(CNN)以及長短時記憶神經(jīng)網(wǎng)絡(LSTM)等在聲學模型上得到了廣泛的研究。然而這些研究主要集中在英語,中文等使用人數(shù)較多的語言上,對于其它使用人數(shù)較少的語言來講,語音識別技術研究仍然處于初級的研究階段,其中蒙古語正是這樣的一種語言。本文將DNN、時延神經(jīng)網(wǎng)絡(TDNN)、CNN,LSTM,前向序列記憶神經(jīng)網(wǎng)絡(FSMN)等神經(jīng)網(wǎng)絡結構用于蒙古語聲學模型的建模,通過對比不同神經(jīng)網(wǎng)絡結構的聲學模型來研究神經(jīng)網(wǎng)絡結構對蒙古語語音識別性能影響。同時為了進一步提升蒙古語聲學模型的性能,本文還使用神經(jīng)網(wǎng)絡的區(qū)分性訓練方法和添加說話人特征兩種方式對模型進行了優(yōu)化訓練。實驗結果表明,基于LSTM的聲學模型在蒙古語語音識別系統(tǒng)中有最好的性能,但是LSTM由于結構復雜導致解碼過程計算量大于其他結構,而FSMN在準確率和計算復雜度的均衡性能上要優(yōu)于其他結構。同時使用區(qū)分性訓練和添加說話人特征后,聲學模型的性能有明顯的提升。
[Abstract]:Speech recognition is an important means to achieve human-computer interaction, its ultimate aim is to let people and machines like people like to communicate through speech dialogue. In recent years, speech recognition technology has undergone great changes, the depth of the neural network has successfully replaced the Gauss mixture model (GMM) has become the mainstream method of acoustic modeling neural network. Various structures such as the depth of the neural network (DNN), convolutional neural network (CNN) and the short memory neural network (LSTM) in the acoustic model has been widely studied. However, these studies mainly focus on English, such as the use of more Chinese number of language, for other use fewer words in terms of speech recognition technology is still in the primary stage of the study, which is a kind of Mongolian language such as DNN. In this paper, time delay neural network (TDNN), CNN, LSTM, prior to the sequence of memory of God The network (FSMN), the structure of neural network modeling for Mongolian acoustic model, by comparing the acoustic model of different kinds of neural network to study the influence of neural network structure on the performance of Mongolian speech recognition. At the same time in order to further enhance the performance of Mongolian acoustic models, discriminative training methods are used in this neural network and add speaker characteristics in two ways optimize the training of the model. The experimental results show that the acoustic model based on LSTM has the best performance in the Mongolian speech recognition system, but due to the LSTM complex structure lead to calculate the amount of decoding process is greater than the other structures, and the computation complexity FSMN equalization performance is superior to other structures in the accuracy and use of distinction. At the same time add training and speaker characteristics, performance of acoustic model has significantly improved.
【學位授予單位】:內(nèi)蒙古大學
【學位級別】:碩士
【學位授予年份】:2017
【分類號】:TP183;TN912.34
【相似文獻】
相關期刊論文 前10條
1 楊曉帥 ,付玫;神經(jīng)網(wǎng)絡技術讓管理更輕松[J];軟件世界;2000年11期
2 云中客;新的神經(jīng)網(wǎng)絡來自于仿生學[J];物理;2001年10期
3 唐春明,高協(xié)平;進化神經(jīng)網(wǎng)絡的研究進展[J];系統(tǒng)工程與電子技術;2001年10期
4 李智;一種基于神經(jīng)網(wǎng)絡的煤炭調(diào)運優(yōu)化方法[J];長沙鐵道學院學報;2003年02期
5 程科,王士同,楊靜宇;新型模糊形態(tài)神經(jīng)網(wǎng)絡及其應用研究[J];計算機工程與應用;2004年21期
6 王凡,孟立凡;關于使用神經(jīng)網(wǎng)絡推定操作者疲勞的研究[J];人類工效學;2004年03期
7 周麗暉;從統(tǒng)計角度看神經(jīng)網(wǎng)絡[J];統(tǒng)計教育;2005年06期
8 趙奇 ,劉開第 ,龐彥軍;灰色補償神經(jīng)網(wǎng)絡及其應用研究[J];微計算機信息;2005年14期
9 袁婷;;神經(jīng)網(wǎng)絡在股票市場預測中的應用[J];軟件導刊;2006年05期
10 尚晉;楊有;;從神經(jīng)網(wǎng)絡的過去談科學發(fā)展觀[J];重慶三峽學院學報;2006年03期
相關會議論文 前10條
1 徐春玉;;基于泛集的神經(jīng)網(wǎng)絡的混沌性[A];1996中國控制與決策學術年會論文集[C];1996年
2 周樹德;王巖;孫增圻;孫富春;;量子神經(jīng)網(wǎng)絡[A];2003年中國智能自動化會議論文集(上冊)[C];2003年
3 羅山;張琳;范文新;;基于神經(jīng)網(wǎng)絡和簡單規(guī)劃的識別融合算法[A];2009系統(tǒng)仿真技術及其應用學術會議論文集[C];2009年
4 郭愛克;馬盡文;丁康;;序言(二)[A];1999年中國神經(jīng)網(wǎng)絡與信號處理學術會議論文集[C];1999年
5 鐘義信;;知識論:神經(jīng)網(wǎng)絡的新機遇——紀念中國神經(jīng)網(wǎng)絡10周年[A];1999年中國神經(jīng)網(wǎng)絡與信號處理學術會議論文集[C];1999年
6 許進;保錚;;神經(jīng)網(wǎng)絡與圖論[A];1999年中國神經(jīng)網(wǎng)絡與信號處理學術會議論文集[C];1999年
7 金龍;朱詩武;趙成志;陳寧;;數(shù)值預報產(chǎn)品的神經(jīng)網(wǎng)絡釋用預報應用[A];1999年中國神經(jīng)網(wǎng)絡與信號處理學術會議論文集[C];1999年
8 田金亭;;神經(jīng)網(wǎng)絡在中學生創(chuàng)造力評估中的應用[A];第十二屆全國心理學學術大會論文摘要集[C];2009年
9 唐墨;王科俊;;自發(fā)展神經(jīng)網(wǎng)絡的混沌特性研究[A];2009年中國智能自動化會議論文集(第七分冊)[南京理工大學學報(增刊)][C];2009年
10 張廣遠;萬強;曹海源;田方濤;;基于遺傳算法優(yōu)化神經(jīng)網(wǎng)絡的故障診斷方法研究[A];第十二屆全國設備故障診斷學術會議論文集[C];2010年
相關重要報紙文章 前10條
1 美國明尼蘇達大學社會學博士 密西西比州立大學國家戰(zhàn)略規(guī)劃與分析研究中心資深助理研究員 陳心想;維護好創(chuàng)新的“神經(jīng)網(wǎng)絡硬件”[N];中國教師報;2014年
2 盧業(yè)忠;腦控電腦 驚世駭俗[N];計算機世界;2001年
3 葛一鳴 路邊文;人工神經(jīng)網(wǎng)絡將大顯身手[N];中國紡織報;2003年
4 中國科技大學計算機系 邢方亮;神經(jīng)網(wǎng)絡挑戰(zhàn)人類大腦[N];計算機世界;2003年
5 記者 孫剛;“神經(jīng)網(wǎng)絡”:打開復雜工藝“黑箱”[N];解放日報;2007年
6 本報記者 劉霞;美用DNA制造出首個人造神經(jīng)網(wǎng)絡[N];科技日報;2011年
7 健康時報特約記者 張獻懷;干細胞移植:修復受損的神經(jīng)網(wǎng)絡[N];健康時報;2006年
8 劉力;我半導體神經(jīng)網(wǎng)絡技術及應用研究達國際先進水平[N];中國電子報;2001年
9 ;神經(jīng)網(wǎng)絡和模糊邏輯[N];世界金屬導報;2002年
10 鄒麗梅 陳耀群;江蘇科大神經(jīng)網(wǎng)絡應用研究通過鑒定[N];中國船舶報;2006年
相關博士學位論文 前10條
1 楊旭華;神經(jīng)網(wǎng)絡及其在控制中的應用研究[D];浙江大學;2004年
2 李素芳;基于神經(jīng)網(wǎng)絡的無線通信算法研究[D];山東大學;2015年
3 石艷超;憶阻神經(jīng)網(wǎng)絡的混沌性及幾類時滯神經(jīng)網(wǎng)絡的同步研究[D];電子科技大學;2014年
4 王新迎;基于隨機映射神經(jīng)網(wǎng)絡的多元時間序列預測方法研究[D];大連理工大學;2015年
5 付愛民;極速學習機的訓練殘差、穩(wěn)定性及泛化能力研究[D];中國農(nóng)業(yè)大學;2015年
6 李輝;基于粒計算的神經(jīng)網(wǎng)絡及集成方法研究[D];中國礦業(yè)大學;2015年
7 王衛(wèi)蘋;復雜網(wǎng)絡幾類同步控制策略研究及穩(wěn)定性分析[D];北京郵電大學;2015年
8 張海軍;基于云計算的神經(jīng)網(wǎng)絡并行實現(xiàn)及其學習方法研究[D];華南理工大學;2015年
9 李艷晴;風速時間序列預測算法研究[D];北京科技大學;2016年
10 陳輝;多維超精密定位系統(tǒng)建模與控制關鍵技術研究[D];東南大學;2015年
相關碩士學位論文 前10條
1 章穎;混合不確定性模塊化神經(jīng)網(wǎng)絡與高校效益預測的研究[D];華南理工大學;2015年
2 賈文靜;基于改進型神經(jīng)網(wǎng)絡的風力發(fā)電系統(tǒng)預測及控制研究[D];燕山大學;2015年
3 李慧芳;基于憶阻器的渦卷混沌系統(tǒng)及其電路仿真[D];西南大學;2015年
4 陳彥至;神經(jīng)網(wǎng)絡降維算法研究與應用[D];華南理工大學;2015年
5 董哲康;基于憶阻器的組合電路及神經(jīng)網(wǎng)絡研究[D];西南大學;2015年
6 武創(chuàng)舉;基于神經(jīng)網(wǎng)絡的遙感圖像分類研究[D];昆明理工大學;2015年
7 李志杰;基于神經(jīng)網(wǎng)絡的上證指數(shù)預測研究[D];華南理工大學;2015年
8 陳少吉;基于神經(jīng)網(wǎng)絡血壓預測研究與系統(tǒng)實現(xiàn)[D];華南理工大學;2015年
9 張韜;幾類時滯神經(jīng)網(wǎng)絡穩(wěn)定性分析[D];渤海大學;2015年
10 邵雪瑩;幾類時滯不確定神經(jīng)網(wǎng)絡的穩(wěn)定性分析[D];渤海大學;2015年
,本文編號:1401004
本文鏈接:http://www.sikaile.net/shoufeilunwen/xixikjs/1401004.html