天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 信息工程論文 >

基于深度學(xué)習(xí)的藏語拉薩方言語音識(shí)別的研究

發(fā)布時(shí)間:2017-08-16 12:22

  本文關(guān)鍵詞:基于深度學(xué)習(xí)的藏語拉薩方言語音識(shí)別的研究


  更多相關(guān)文章: 藏語語音識(shí)別 深度學(xué)習(xí) 長(zhǎng)短時(shí)記憶網(wǎng)絡(luò) 隱馬爾可夫模型 Tandem特征


【摘要】:讓機(jī)器聽懂人類的話、根據(jù)人類的命令完成工作,這是許多科研人員多年來的努力方向。近些年隨著計(jì)算機(jī)計(jì)算能力的提高以及大數(shù)據(jù)的出現(xiàn),深度學(xué)習(xí)算法在各個(gè)領(lǐng)域取得了廣泛的應(yīng)用。深度學(xué)習(xí)網(wǎng)絡(luò)是一種含有多隱含層的人工神經(jīng)網(wǎng)絡(luò),在提取特征時(shí),具有比傳統(tǒng)聲學(xué)特征提取器更好的表達(dá)能力。許多研究已經(jīng)將深度學(xué)習(xí)算法應(yīng)用到了語音識(shí)別系統(tǒng)當(dāng)中,但是這種深度學(xué)習(xí)算法目前只應(yīng)用于主流語言的語音識(shí)別中,還沒有引入到藏語等少數(shù)民族語言的語音識(shí)別中。本文在藏語拉薩方言語音識(shí)別中引入深度學(xué)習(xí)算法,設(shè)計(jì)了面向藏語語音識(shí)別的語料庫,采用深度學(xué)習(xí)模型--長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)模型作為藏語聲學(xué)特征提取器,然后應(yīng)用隱馬爾可夫模型(Hidden Markov Model,HMM)進(jìn)行識(shí)別。論文主要工作與創(chuàng)新如下:1.建立了一個(gè)面向藏語語音識(shí)別的藏語語料庫。首先設(shè)計(jì)了一個(gè)包含51個(gè)藏語常見字的文本語料,在對(duì)比了藏語與漢語的發(fā)音特點(diǎn)后,借助現(xiàn)有的漢語普通話標(biāo)注方案SAMPA-SC,設(shè)計(jì)了藏語拉薩方言標(biāo)注方案SAMPA-T,最后對(duì)藏語語料進(jìn)行了錄音和標(biāo)注(4人參與錄音,每人每個(gè)字讀30遍,共6120個(gè)樣本)。2.搭建了一個(gè)基于深度學(xué)習(xí)網(wǎng)絡(luò)的藏語聲學(xué)特征提取器。采用深度學(xué)習(xí)模型--長(zhǎng)短時(shí)記憶(Long Short Term Memory,LSTM)網(wǎng)絡(luò)模型,并將這種網(wǎng)絡(luò)應(yīng)用在藏語語音識(shí)別當(dāng)中作為聲學(xué)特征提取器。利用該網(wǎng)絡(luò)輸出語料庫中51個(gè)字的后驗(yàn)概率,并將這51維輸出激活與39維MFCC特征結(jié)合后經(jīng)過PCA(Principal Component Analysis)算法降維,提取最重要的40維Tandem特征,然后將這些特征輸入給HMM進(jìn)行訓(xùn)練與識(shí)別。3.實(shí)現(xiàn)了結(jié)合長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)與HMM的藏語語音識(shí)別。應(yīng)用長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)作為藏語聲學(xué)特征提取器,然后應(yīng)用HMM進(jìn)行藏語識(shí)別。實(shí)驗(yàn)結(jié)果表明,在本文建立的語料庫測(cè)試集中,本文提出的藏語語音識(shí)別方法能夠達(dá)到80.56%的識(shí)別率。
【關(guān)鍵詞】:藏語語音識(shí)別 深度學(xué)習(xí) 長(zhǎng)短時(shí)記憶網(wǎng)絡(luò) 隱馬爾可夫模型 Tandem特征
【學(xué)位授予單位】:西北師范大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:TN912.34
【目錄】:
  • 摘要4-5
  • ABSTRACT5-9
  • 第一章 引言9-13
  • 1.1 研究背景及意義9
  • 1.2 研究現(xiàn)狀9-11
  • 1.2.1 語音識(shí)別發(fā)展歷史及研究現(xiàn)狀9-11
  • 1.2.2 藏語語音識(shí)別的研究現(xiàn)狀11
  • 1.3 本論文的結(jié)構(gòu)11-12
  • 1.4 本章小結(jié)12-13
  • 第2章 藏語識(shí)別原理13-20
  • 2.1 藏語語音識(shí)別系統(tǒng)結(jié)構(gòu)13
  • 2.2 語音信號(hào)處理與分析13-19
  • 2.2.1 語音信號(hào)的數(shù)字化處理14
  • 2.2.2 預(yù)處理14-15
  • 2.2.3 特征提取15-19
  • 2.3 本章小結(jié)19-20
  • 第3章 基于HMM的語音識(shí)別研究20-27
  • 3.1 HMM基本原理20-21
  • 3.2 HMM模型的三個(gè)問題21-26
  • 3.2.1 概率計(jì)算22-23
  • 3.2.2 最優(yōu)狀態(tài)序列搜索23-24
  • 3.2.3 參數(shù)估計(jì)24-26
  • 3.3 本章小結(jié)26-27
  • 第4章 深度學(xué)習(xí)模型27-36
  • 4.1 深度學(xué)習(xí)簡(jiǎn)介27-28
  • 4.2 深度學(xué)習(xí)和淺層學(xué)習(xí)28-29
  • 4.3 深度學(xué)習(xí)的結(jié)構(gòu)29-30
  • 4.4 遞歸神經(jīng)網(wǎng)絡(luò)30-35
  • 4.4.1 多層感知器30-31
  • 4.4.2 遞歸神經(jīng)網(wǎng)絡(luò)31-32
  • 4.4.3 長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)32-35
  • 4.5 本章小結(jié)35-36
  • 第5章 LSTM-HMM模型的藏語語音識(shí)別實(shí)驗(yàn)36-49
  • 5.1 藏語發(fā)音介紹36-39
  • 5.1.1 藏文的介紹36-37
  • 5.1.2 藏語拉薩方言拼音的聲韻母37-38
  • 5.1.3 藏語的聲調(diào)38-39
  • 5.2 語音樣本庫的建立39-44
  • 5.2.1 文本語料庫的設(shè)計(jì)39
  • 5.2.2 語音語料的錄制39-41
  • 5.2.3 語料的切分和標(biāo)注41-44
  • 5.3 語音數(shù)據(jù)特征提取44-45
  • 5.4 遞歸神經(jīng)網(wǎng)絡(luò)配置45-47
  • 5.5 實(shí)驗(yàn)結(jié)果47-48
  • 5.6 本章小結(jié)48-49
  • 第6章 總結(jié)與展望49-51
  • 6.1 論文總結(jié)49
  • 6.2 下一步的工作展望49-51
  • 參考文獻(xiàn)51-55
  • 攻讀學(xué)位期間的研究成果55-56
  • 致謝56

【相似文獻(xiàn)】

中國(guó)期刊全文數(shù)據(jù)庫 前10條

1 郭遠(yuǎn)瓊;提高語音識(shí)別率點(diǎn)滴[J];電腦技術(shù);2000年03期

2 邢文;語音識(shí)別[J];個(gè)人電腦;2000年02期

3 ;語音識(shí)別的真相[J];個(gè)人電腦;2001年12期

4 ;語音識(shí)別漸入佳境[J];個(gè)人電腦;2002年03期

5 ;微軟語音識(shí)別軟件可與人直接對(duì)話[J];自動(dòng)化博覽;2003年04期

6 ;語音識(shí)別[J];印刷世界;2004年01期

7 杰里米·瓦格斯塔夫;讓語音識(shí)別軟件 解放你的雙手[J];農(nóng)業(yè)圖書情報(bào)學(xué)刊;2004年03期

8 韓紀(jì)慶,王歡良,李海峰,鄭鐵然;基于語音識(shí)別的發(fā)音學(xué)習(xí)技術(shù)[J];電聲技術(shù);2004年09期

9 陳孝強(qiáng);語音識(shí)別擬起新潮[J];微電腦世界;2005年07期

10 韓紀(jì)慶;張磊;鄭鐵然;;網(wǎng)絡(luò)環(huán)境下的語音識(shí)別方法[J];計(jì)算機(jī)科學(xué);2005年01期

中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫 前10條

1 張歆奕;吳今培;張其善;;語音的共性特征及其在語音識(shí)別中的應(yīng)用[A];第十屆全國(guó)信號(hào)處理學(xué)術(shù)年會(huì)(CCSP-2001)論文集[C];2001年

2 杜樹木;何良華;;一種新的基于段長(zhǎng)分布的語音識(shí)別模型[A];2009年通信理論與信號(hào)處理學(xué)術(shù)年會(huì)論文集[C];2009年

3 李楨;高萬林;歐文浩;徐山川;;基于關(guān)鍵詞語音識(shí)別的農(nóng)業(yè)信息語音服務(wù)系統(tǒng)的研究與實(shí)現(xiàn)[A];中國(guó)農(nóng)業(yè)工程學(xué)會(huì)電氣信息與自動(dòng)化專業(yè)委員會(huì)、中國(guó)電機(jī)工程學(xué)會(huì)農(nóng)村電氣化分會(huì)科技與教育專委會(huì)2010年學(xué)術(shù)年會(huì)論文摘要[C];2010年

4 張冰;龍長(zhǎng)才;羅海風(fēng);;熟悉掩蔽音背景下的目標(biāo)語音識(shí)別[A];泛在信息社會(huì)中的聲學(xué)——中國(guó)聲學(xué)學(xué)會(huì)2010年全國(guó)會(huì)員代表大會(huì)暨學(xué)術(shù)會(huì)議論文集[C];2010年

5 王承發(fā);趙德彬;金山;苗百利;朱志瑩;;語音識(shí)別應(yīng)用中抗噪聲干擾方法的初步探討[A];第二屆全國(guó)人機(jī)語音通訊學(xué)術(shù)會(huì)議論文集[C];1992年

6 杜笑平;楊啟綱;楊家沅;;過零周期轉(zhuǎn)移概率矩陣語音識(shí)別部件的研制[A];第二屆全國(guó)人機(jī)語音通訊學(xué)術(shù)會(huì)議論文集[C];1992年

7 季宏;劉志文;杜燕玲;黃曾陽;;語音識(shí)別中的音字轉(zhuǎn)換[A];第三屆全國(guó)人機(jī)語音通訊學(xué)術(shù)會(huì)議論文集[C];1994年

8 葛余博;楊大利;曾德超;;噪聲環(huán)境下語音識(shí)別的幾個(gè)問題(一)[A];第三屆全國(guó)人機(jī)語音通訊學(xué)術(shù)會(huì)議論文集[C];1994年

9 朱奇峰;俞鐵城;;聽覺中的協(xié)同現(xiàn)象和其對(duì)語音識(shí)別影響的探討[A];第四屆全國(guó)人機(jī)語音通訊學(xué)術(shù)會(huì)議論文集[C];1996年

10 姚磊;黃泰翼;陳景東;;一種高魯棒性語音識(shí)別的通用自適應(yīng)方法研究[A];第四屆全國(guó)人機(jī)語音通訊學(xué)術(shù)會(huì)議論文集[C];1996年

中國(guó)重要報(bào)紙全文數(shù)據(jù)庫 前10條

1 黃夢(mèng);方案商積極切入語音識(shí)別市場(chǎng)[N];電腦商報(bào);2006年

2 閆婷;語音識(shí)別 理想與現(xiàn)實(shí)的距離[N];計(jì)算機(jī)世界;2007年

3 劉喜喜;語音識(shí)別將把鼠標(biāo)鍵盤打入冷宮?[N];中國(guó)計(jì)算機(jī)報(bào);2008年

4 樂天;語音識(shí)別:讓你的手機(jī)更聰明[N];計(jì)算機(jī)世界;2011年

5 特約作者 王佳彬;語音識(shí)別漸入佳境[N];電腦報(bào);2002年

6 雨夏;語音識(shí)別重在應(yīng)用[N];計(jì)算機(jī)世界;2001年

7 ;語音識(shí)別企業(yè)應(yīng)用前景光明[N];計(jì)算機(jī)世界;2003年

8 王向東 欒煥博 林守勛 錢躍良;語音識(shí)別:抗噪音能力有待加強(qiáng)[N];計(jì)算機(jī)世界;2006年

9 上海 高博;讓電腦“聽懂”人話[N];電腦報(bào);2008年

10 張彤;語音識(shí)別融入統(tǒng)一通信[N];網(wǎng)絡(luò)世界;2008年

中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫 前10條

1 許金普;農(nóng)產(chǎn)品市場(chǎng)信息采集的語音識(shí)別魯棒性方法研究[D];中國(guó)農(nóng)業(yè)科學(xué)院;2015年

2 包希日莫;面向蒙古語的語音識(shí)別聲學(xué)建模研究[D];內(nèi)蒙古大學(xué);2016年

3 吳斌;語音識(shí)別中的后處理技術(shù)研究[D];北京郵電大學(xué);2008年

4 奉小慧;音頻噪聲環(huán)境下唇動(dòng)信息在語音識(shí)別中的應(yīng)用技術(shù)研究[D];華南理工大學(xué);2010年

5 孫f,

本文編號(hào):683257


資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/xinxigongchenglunwen/683257.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶a537a***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com