天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 網絡通信論文 >

基于深度神經網絡的RASR語音識別的研究

發(fā)布時間:2017-06-08 01:18

  本文關鍵詞:基于深度神經網絡的RASR語音識別的研究,,由筆耕文化傳播整理發(fā)布。


【摘要】:目前有關語言和語音處理的公共可用的開源軟件越來越多,而大多數的語音識別系統(tǒng)僅僅處理封閉的詞匯表。但對于處理無限制語音輸入的應用程序來說,即使再大的詞匯表也無法覆蓋所有的詞匯。德國亞琛工業(yè)大學開發(fā)的開源語音識別工具(RWTH ASR,簡稱RASR),可將詞匯表中的詞單元組合起來合并成一個新詞,從而在識別處理過程中識別外來詞匯,完成大詞匯量連續(xù)語音識別。本文除了回顧語音識別相關理論背景之外,更重要的是通過RASR工具中的聲學模型和解碼器開發(fā)識別大詞匯量語音系統(tǒng)。通過配置相應參數完成語音信號分析,估計高斯混合模型(Gaussian Mixture Models, GMM)和語音決策樹,結合深度神經網絡(Deep Neural Network, DNN)得到一個開放的詞匯自動語音識別(Automatic Speech Recognition, ASR)系統(tǒng)。通過使用SRILM工具包訓練語言模型,最后使用NIST SCTK語音識別評分工具包進行誤差分析和評估。本文的重點是使用神經網絡(Neural Network, NN)模塊訓練神經網絡聲學模型,并詳細說明和介紹如何使用RASR開發(fā)大詞匯量連續(xù)語音自動識別系統(tǒng),重點介紹訓練和識別的配置和實現。
【關鍵詞】:RASR 神經網絡 聲學模型 語音識別
【學位授予單位】:內蒙古大學
【學位級別】:碩士
【學位授予年份】:2015
【分類號】:TN912.34
【目錄】:
  • 摘要4-5
  • ABSTRACT5-10
  • 第一章 緒論10-12
  • 1.1 語音識別概述10
  • 1.2 語言識別研究歷史及現狀10-11
  • 1.3 論文研究內容和組織結構11-12
  • 第二章 RASR實現語音識別的基本原理12-20
  • 2.1 隱馬爾可夫模型基本原理13-15
  • 2.2 HMM參數說明15
  • 2.3 Baum-Welch重估15-18
  • 2.4 識別和Viterbi算法18-19
  • 2.5 本章小結19-20
  • 第二章 神經網絡模型20-29
  • 3.1 人工神經網絡基礎20-22
  • 3.1.1 人工神經網絡模型20-21
  • 3.1.2 神經網絡的結構21-22
  • 3.1.3 神經網絡的學習22
  • 3.2 BP網絡模型22-25
  • 3.2.1 BP算法的基本思想23
  • 3.2.2 BP算法的步驟23-24
  • 3.2.3 BP網絡優(yōu)缺點24-25
  • 3.3 深度學習神經網絡模型25-28
  • 3.3.1 深度學習簡介25-26
  • 3.3.2 深度學習的基本思想26
  • 3.3.3 深度學習的常用方法26
  • 3.3.4 深度信念神經網絡26-28
  • 3.4 本章小結28-29
  • 第四章 基于深度神經網絡的RASR語音識別的研究29-59
  • 4.1 軟件安裝29-31
  • 4.1.1 RASR 0.6.1安裝29-30
  • 4.1.2 SRILM工具安裝30-31
  • 4.1.3 NISTSCTK安裝31
  • 4.2 數據準備31-36
  • 4.2.1 語料庫文件31-33
  • 4.2.2 字典文件33-34
  • 4.2.3 計算統(tǒng)計34-36
  • 4.3 特征提取36-39
  • 4.3.1 流網絡36-37
  • 4.3.2 聲學特征37-38
  • 4.3.3 MFCC特征提取38-39
  • 4.4 聲學模型訓練39-46
  • 4.4.1 單音素訓練40-42
  • 4.4.2 三音素訓練42-46
  • 4.5 神經網絡訓練46-49
  • 4.6 語言模型訓練49
  • 4.7 解碼及識別49-53
  • 4.7.1 解碼器49-50
  • 4.7.2 識別過程50-53
  • 4.8 實驗結果53-58
  • 4.8.1 AN4語料庫識別53-54
  • 4.8.2 TIMIT語料庫識別54-58
  • 4.9 本章小結58-59
  • 第五章 總結與展望59-61
  • 5.1 總結59
  • 5.2 展望59-61
  • 參考文獻61-64
  • 致謝64

【參考文獻】

中國期刊全文數據庫 前1條

1 楊俊安;王一;劉輝;李晉徽;陸俊;;深度學習理論及其在語音識別領域的應用[J];通信對抗;2014年03期


  本文關鍵詞:基于深度神經網絡的RASR語音識別的研究,由筆耕文化傳播整理發(fā)布。



本文編號:430948

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/wltx/430948.html


Copyright(c)文論論文網All Rights Reserved | 網站地圖 |

版權申明:資料由用戶7193a***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com