天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

山西朔州方言語音識別方法研究

發(fā)布時間:2024-03-05 06:25
  語音作為人機交互的最重要的手段和研究形勢之一,隨著科學技術的發(fā)展,自動語音識別(Automatic Speech Recognition,ASR)已經(jīng)應用于日常生活之中。但目前山西朔州的語音識別系統(tǒng)大多為普通話識別,各地方言用戶只有以近似標準的普通話發(fā)音才能得到較好的識別結果。加之方言語音語料數(shù)據(jù)采集成本高,僅有少量的資源可用于研究。在低資源條件下的語音識別相關系統(tǒng)識別率低。所以為滿足大眾的交互需求和實現(xiàn)高識別率,針對山西朔州方言的研究與應用就顯得十分必要。在此背景下,本文一方面對現(xiàn)有的模型進進行對比,另一方面對低資源數(shù)據(jù)進行整理,從而提高山西朔州方言的語音識別系統(tǒng)識別率。首先,本文對語音識別的發(fā)展史和基本原理進行了簡要的介紹,隨后對語音識別從模擬信號的處理到聲學模型的構建以及識別等每一項關鍵技術進行了闡述。之后,對聲學模型和語言模型進行著重研究,包括:高斯混合模型和隱馬爾可夫模型(GMM-HMM)、基于深度學習的神經(jīng)網(wǎng)絡模型(DNN-HMM)以及N-gram等模型。最后,本文對山西朔州方言的語言特征、低資源和小區(qū)域進行了分析研究,對各個模型下山西朔州方言的識別進行了對比實驗。本文共搭...

【文章頁數(shù)】:69 頁

【學位級別】:碩士

【部分圖文】:

圖1-1語音識別系統(tǒng)基本框架

圖1-1語音識別系統(tǒng)基本框架

中北大學學位論文41.3語音識別系統(tǒng)的框架簡單來說,語音識別就是將一段音頻例如一條語音,一段電話,通過目前已有的一系列技術操作,將語音序列識別為對應的單詞或者漢字。目前基于統(tǒng)計的模式識別是一種主流方法。給定觀察序列O={1,2,…,},然后采用MAP求解最優(yōu)序列:)|(maxar....


圖1-2方言下的語音識別框架圖

圖1-2方言下的語音識別框架圖

中北大學學位論文7通話的語音識別對方言識別率較低,人機交互低,對工作的效率影響較大,因此本文研究方言識別用于地方語音識別來提高人機交互性能。圖1-2方言下的語音識別框架圖Fig1-2Dialectspeechrecognitionframework1.6論文主要研究內容和工作安排....


圖2-2預加重之后對比圖

圖2-2預加重之后對比圖

中北大學學位論文102.1.2語音信號中的預加重通過研究分析人體發(fā)音器官及語音信號可知,由于受到聲門激勵和口鼻輻射的影響,單位頻帶內的語音信號功率,將會從800HZ以上的高頻段信號按6dB/倍頻程跌落[23],因此需要預加重處理。在語音信號數(shù)字化處理之后,使用一階數(shù)字濾波器實現(xiàn)[....


圖2-3三個窗口圖

圖2-3三個窗口圖

中北大學學位論文11深入研究語音分析,所以假設這個短時平穩(wěn)信號存在。分幀是為了能讓語音信號可以通過使用穩(wěn)定的信號處理辦法。為了得到短時的語音信號,就需要進行加窗操作,加窗操作也可以防止頻域的泄露。將窗函數(shù)的寬度定義為語音的幀長。窗函數(shù)每在語音信號中滑動一截,語音信號就分為一幀,重....



本文編號:3919822

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/shoufeilunwen/xixikjs/3919822.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶7b7d1***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com