天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 信息工程論文 >

藏語(yǔ)語(yǔ)音深度特征提取及語(yǔ)音識(shí)別研究

發(fā)布時(shí)間:2017-10-09 17:10

  本文關(guān)鍵詞:藏語(yǔ)語(yǔ)音深度特征提取及語(yǔ)音識(shí)別研究


  更多相關(guān)文章: 語(yǔ)音識(shí)別 隱馬爾科夫模型 稀疏自動(dòng)編碼器 深度置信網(wǎng) 聲學(xué)模型


【摘要】:隨著對(duì)語(yǔ)言信息處理研究工作的不斷深入,藏文信息處理技術(shù)也從文字處理逐步轉(zhuǎn)向語(yǔ)言信息處理。藏文自動(dòng)分詞和詞性標(biāo)注是進(jìn)行藏語(yǔ)語(yǔ)義理解、藏文信息檢索、藏語(yǔ)與其他語(yǔ)種之間的機(jī)器翻譯等的首要問(wèn)題。藏語(yǔ)是我國(guó)一支重要的少數(shù)民族語(yǔ)種,藏語(yǔ)語(yǔ)音識(shí)別技術(shù)的研究與發(fā)展不僅可以使得不同民族之間的語(yǔ)言進(jìn)行無(wú)障礙的溝通交流,也可以促使藏區(qū)經(jīng)濟(jì)、文化、教育等各領(lǐng)域的發(fā)展。而目前藏語(yǔ)語(yǔ)音識(shí)別研究仍處于初期階段。進(jìn)入21世紀(jì),深度學(xué)習(xí)逐漸成為語(yǔ)音特征提取的新的研究方向。深度學(xué)習(xí)采取多層非線性變換技術(shù)從原始數(shù)據(jù)中提取由低到高、由具體到抽象、由一般到特征語(yǔ)義的特征。本文將深度學(xué)習(xí)應(yīng)用到藏語(yǔ)語(yǔ)音識(shí)別研究當(dāng)中,首先介紹藏語(yǔ)語(yǔ)音識(shí)別的研究現(xiàn)狀、語(yǔ)音識(shí)別的基本原理及其深度學(xué)習(xí)的相關(guān)理論,并著重闡述了深度特征提取模型在藏語(yǔ)語(yǔ)音識(shí)別的中的應(yīng)用。1.基于深度學(xué)習(xí)的藏語(yǔ)語(yǔ)音特征提取研究深度學(xué)習(xí)能夠克服人工設(shè)計(jì)特征會(huì)使原始語(yǔ)音數(shù)據(jù)特征丟失的缺點(diǎn),學(xué)習(xí)出人工無(wú)法定義的特征。因此,基于大數(shù)據(jù)和深度學(xué)習(xí)來(lái)學(xué)習(xí)特征,更能反映數(shù)據(jù)的豐富內(nèi)在特征信息。本文主要使用稀疏自動(dòng)編碼器和深度置信網(wǎng)兩種模型來(lái)提取藏語(yǔ)語(yǔ)音特征。從模型原理展開,就藏語(yǔ)特征提取模型的無(wú)監(jiān)督預(yù)訓(xùn)練和有監(jiān)督的微調(diào)方法做了詳細(xì)描述。2.基于深度特征的藏語(yǔ)語(yǔ)音識(shí)別聲學(xué)模型研究基于深度學(xué)習(xí)提取的特征,使用GMM-HMM方法建立聲學(xué)模型分別對(duì)音素和音節(jié)識(shí)別。實(shí)驗(yàn)證明,與MFCC特征相比,基于SA+MFCC特征的音素識(shí)別率最高為69.05%,提高10.22%,音節(jié)識(shí)別率為48.54%,提高了24.6個(gè)百分點(diǎn);基于DBN+MFCC特征的音素識(shí)別率最高為69.46%,提高10.63%,音節(jié)識(shí)別率為49.04%,提高了25.1%,并且DBN模型使用更少的迭代次數(shù),因此,DBN模型效率更高。在以后的藏語(yǔ)語(yǔ)音識(shí)別研究工作中,我們可以采用DBN模型進(jìn)行藏語(yǔ)連續(xù)語(yǔ)音識(shí)別的深度特征提取。
【關(guān)鍵詞】:語(yǔ)音識(shí)別 隱馬爾科夫模型 稀疏自動(dòng)編碼器 深度置信網(wǎng) 聲學(xué)模型
【學(xué)位授予單位】:中央民族大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:TN912.3
【目錄】:
  • 摘要3-5
  • ABSTRACT5-11
  • 第一章 緒論11-15
  • 1.1 研究背景與意義11-12
  • 1.2 藏語(yǔ)語(yǔ)音識(shí)別技術(shù)的發(fā)展現(xiàn)狀12-13
  • 1.3 論文創(chuàng)新點(diǎn)13
  • 1.4 本文主要內(nèi)容及結(jié)構(gòu)13-15
  • 第二章 語(yǔ)音識(shí)別基本原理和相關(guān)理論15-27
  • 2.1 人腦語(yǔ)音識(shí)別機(jī)理15-16
  • 2.2 數(shù)字語(yǔ)音信號(hào)預(yù)處理16
  • 2.3 數(shù)字語(yǔ)音信號(hào)的特征提取16-17
  • 2.3.1 時(shí)域特征16-17
  • 2.3.2 頻域特征17
  • 2.4 聲學(xué)模型17-23
  • 2.4.1 隱馬爾科夫模型(HMM)18-22
  • 2.4.2 GMM-HMM聲學(xué)模型22-23
  • 2.5 語(yǔ)言模型23-24
  • 2.6 藏語(yǔ)語(yǔ)音基本特點(diǎn)24-27
  • 第三章 基于深度學(xué)習(xí)的藏語(yǔ)語(yǔ)音特征提取研究27-37
  • 3.1 深度學(xué)習(xí)的基本思想和常用方法27-28
  • 3.1.1 深度學(xué)習(xí)的基本思想27
  • 3.1.2 深度學(xué)習(xí)的常用模型27-28
  • 3.2 稀疏自動(dòng)編碼器模型28-32
  • 3.2.1 稀疏自動(dòng)編碼器原理28-31
  • 3.2.2 基于稀疏自動(dòng)編碼器的藏語(yǔ)深度特征提取模型31-32
  • 3.3 深度置信網(wǎng)模型32-37
  • 3.3.1 深度置信網(wǎng)模型原理32-35
  • 3.3.2 基于深度置信網(wǎng)的藏語(yǔ)深度特征提取模型35-37
  • 第四章 基于深度特征的藏語(yǔ)語(yǔ)音識(shí)別聲學(xué)模型研究37-41
  • 4.1 建模單元的選擇37-38
  • 4.2 HMM模型訓(xùn)練38
  • 4.2.1 triphones模型訓(xùn)練38
  • 4.3 基于深度特征的聲學(xué)建模38-39
  • 4.4 基于深度特征和人工特征相結(jié)合的聲學(xué)建模39-41
  • 第五章 仿真與實(shí)驗(yàn)41-48
  • 5.1 語(yǔ)音樣本庫(kù)的建立41-42
  • 5.1.1 語(yǔ)音信號(hào)預(yù)處理41-42
  • 5.2 基于MFCC特征的聲學(xué)模型實(shí)驗(yàn)結(jié)果42
  • 5.2.1 音素、音節(jié)識(shí)別結(jié)果42
  • 5.3 基于深度特征的聲學(xué)模型實(shí)驗(yàn)結(jié)果42-48
  • 5.3.1 基于SA的音素、音節(jié)識(shí)別結(jié)果42-44
  • 5.3.1.1 實(shí)驗(yàn)設(shè)置42
  • 5.3.1.2 實(shí)驗(yàn)結(jié)果42-44
  • 5.3.2 基于DBN的音素、音節(jié)識(shí)別結(jié)果44-48
  • 5.3.2.1 實(shí)驗(yàn)設(shè)置44-45
  • 5.3.2.2 實(shí)驗(yàn)結(jié)果45-48
  • 第六章 總結(jié)與展望48-50
  • 6.1 總結(jié)48
  • 6.2 展望48-50
  • 參考文獻(xiàn)50-52
  • 致謝52-53
  • 攻讀學(xué)位期間發(fā)表的學(xué)術(shù)論文目錄53

【相似文獻(xiàn)】

中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條

1 郭遠(yuǎn)瓊;提高語(yǔ)音識(shí)別率點(diǎn)滴[J];電腦技術(shù);2000年03期

2 邢文;語(yǔ)音識(shí)別[J];個(gè)人電腦;2000年02期

3 ;語(yǔ)音識(shí)別的真相[J];個(gè)人電腦;2001年12期

4 ;語(yǔ)音識(shí)別漸入佳境[J];個(gè)人電腦;2002年03期

5 ;微軟語(yǔ)音識(shí)別軟件可與人直接對(duì)話[J];自動(dòng)化博覽;2003年04期

6 ;語(yǔ)音識(shí)別[J];印刷世界;2004年01期

7 杰里米·瓦格斯塔夫;讓語(yǔ)音識(shí)別軟件 解放你的雙手[J];農(nóng)業(yè)圖書情報(bào)學(xué)刊;2004年03期

8 韓紀(jì)慶,王歡良,李海峰,鄭鐵然;基于語(yǔ)音識(shí)別的發(fā)音學(xué)習(xí)技術(shù)[J];電聲技術(shù);2004年09期

9 陳孝強(qiáng);語(yǔ)音識(shí)別擬起新潮[J];微電腦世界;2005年07期

10 韓紀(jì)慶;張磊;鄭鐵然;;網(wǎng)絡(luò)環(huán)境下的語(yǔ)音識(shí)別方法[J];計(jì)算機(jī)科學(xué);2005年01期

中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前10條

1 張歆奕;吳今培;張其善;;語(yǔ)音的共性特征及其在語(yǔ)音識(shí)別中的應(yīng)用[A];第十屆全國(guó)信號(hào)處理學(xué)術(shù)年會(huì)(CCSP-2001)論文集[C];2001年

2 杜樹木;何良華;;一種新的基于段長(zhǎng)分布的語(yǔ)音識(shí)別模型[A];2009年通信理論與信號(hào)處理學(xué)術(shù)年會(huì)論文集[C];2009年

3 李楨;高萬(wàn)林;歐文浩;徐山川;;基于關(guān)鍵詞語(yǔ)音識(shí)別的農(nóng)業(yè)信息語(yǔ)音服務(wù)系統(tǒng)的研究與實(shí)現(xiàn)[A];中國(guó)農(nóng)業(yè)工程學(xué)會(huì)電氣信息與自動(dòng)化專業(yè)委員會(huì)、中國(guó)電機(jī)工程學(xué)會(huì)農(nóng)村電氣化分會(huì)科技與教育專委會(huì)2010年學(xué)術(shù)年會(huì)論文摘要[C];2010年

4 張冰;龍長(zhǎng)才;羅海風(fēng);;熟悉掩蔽音背景下的目標(biāo)語(yǔ)音識(shí)別[A];泛在信息社會(huì)中的聲學(xué)——中國(guó)聲學(xué)學(xué)會(huì)2010年全國(guó)會(huì)員代表大會(huì)暨學(xué)術(shù)會(huì)議論文集[C];2010年

5 王承發(fā);趙德彬;金山;苗百利;朱志瑩;;語(yǔ)音識(shí)別應(yīng)用中抗噪聲干擾方法的初步探討[A];第二屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C];1992年

6 杜笑平;楊啟綱;楊家沅;;過(guò)零周期轉(zhuǎn)移概率矩陣語(yǔ)音識(shí)別部件的研制[A];第二屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C];1992年

7 季宏;劉志文;杜燕玲;黃曾陽(yáng);;語(yǔ)音識(shí)別中的音字轉(zhuǎn)換[A];第三屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C];1994年

8 葛余博;楊大利;曾德超;;噪聲環(huán)境下語(yǔ)音識(shí)別的幾個(gè)問(wèn)題(一)[A];第三屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C];1994年

9 朱奇峰;俞鐵城;;聽覺(jué)中的協(xié)同現(xiàn)象和其對(duì)語(yǔ)音識(shí)別影響的探討[A];第四屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C];1996年

10 姚磊;黃泰翼;陳景東;;一種高魯棒性語(yǔ)音識(shí)別的通用自適應(yīng)方法研究[A];第四屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C];1996年

中國(guó)重要報(bào)紙全文數(shù)據(jù)庫(kù) 前10條

1 黃夢(mèng);方案商積極切入語(yǔ)音識(shí)別市場(chǎng)[N];電腦商報(bào);2006年

2 閆婷;語(yǔ)音識(shí)別 理想與現(xiàn)實(shí)的距離[N];計(jì)算機(jī)世界;2007年

3 劉喜喜;語(yǔ)音識(shí)別將把鼠標(biāo)鍵盤打入冷宮?[N];中國(guó)計(jì)算機(jī)報(bào);2008年

4 樂(lè)天;語(yǔ)音識(shí)別:讓你的手機(jī)更聰明[N];計(jì)算機(jī)世界;2011年

5 特約作者 王佳彬;語(yǔ)音識(shí)別漸入佳境[N];電腦報(bào);2002年

6 雨夏;語(yǔ)音識(shí)別重在應(yīng)用[N];計(jì)算機(jī)世界;2001年

7 ;語(yǔ)音識(shí)別企業(yè)應(yīng)用前景光明[N];計(jì)算機(jī)世界;2003年

8 王向東 欒煥博 林守勛 錢躍良;語(yǔ)音識(shí)別:抗噪音能力有待加強(qiáng)[N];計(jì)算機(jī)世界;2006年

9 上海 高博;讓電腦“聽懂”人話[N];電腦報(bào);2008年

10 張彤;語(yǔ)音識(shí)別融入統(tǒng)一通信[N];網(wǎng)絡(luò)世界;2008年

中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條

1 許金普;農(nóng)產(chǎn)品市場(chǎng)信息采集的語(yǔ)音識(shí)別魯棒性方法研究[D];中國(guó)農(nóng)業(yè)科學(xué)院;2015年

2 包希日莫;面向蒙古語(yǔ)的語(yǔ)音識(shí)別聲學(xué)建模研究[D];內(nèi)蒙古大學(xué);2016年

3 吳斌;語(yǔ)音識(shí)別中的后處理技術(shù)研究[D];北京郵電大學(xué);2008年

4 奉小慧;音頻噪聲環(huán)境下唇動(dòng)信息在語(yǔ)音識(shí)別中的應(yīng)用技術(shù)研究[D];華南理工大學(xué);2010年

5 孫f,

本文編號(hào):1001385


資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/xinxigongchenglunwen/1001385.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶da5a5***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com