藏語(yǔ)語(yǔ)音深度特征提取及語(yǔ)音識(shí)別研究
本文關(guān)鍵詞:藏語(yǔ)語(yǔ)音深度特征提取及語(yǔ)音識(shí)別研究
更多相關(guān)文章: 語(yǔ)音識(shí)別 隱馬爾科夫模型 稀疏自動(dòng)編碼器 深度置信網(wǎng) 聲學(xué)模型
【摘要】:隨著對(duì)語(yǔ)言信息處理研究工作的不斷深入,藏文信息處理技術(shù)也從文字處理逐步轉(zhuǎn)向語(yǔ)言信息處理。藏文自動(dòng)分詞和詞性標(biāo)注是進(jìn)行藏語(yǔ)語(yǔ)義理解、藏文信息檢索、藏語(yǔ)與其他語(yǔ)種之間的機(jī)器翻譯等的首要問(wèn)題。藏語(yǔ)是我國(guó)一支重要的少數(shù)民族語(yǔ)種,藏語(yǔ)語(yǔ)音識(shí)別技術(shù)的研究與發(fā)展不僅可以使得不同民族之間的語(yǔ)言進(jìn)行無(wú)障礙的溝通交流,也可以促使藏區(qū)經(jīng)濟(jì)、文化、教育等各領(lǐng)域的發(fā)展。而目前藏語(yǔ)語(yǔ)音識(shí)別研究仍處于初期階段。進(jìn)入21世紀(jì),深度學(xué)習(xí)逐漸成為語(yǔ)音特征提取的新的研究方向。深度學(xué)習(xí)采取多層非線性變換技術(shù)從原始數(shù)據(jù)中提取由低到高、由具體到抽象、由一般到特征語(yǔ)義的特征。本文將深度學(xué)習(xí)應(yīng)用到藏語(yǔ)語(yǔ)音識(shí)別研究當(dāng)中,首先介紹藏語(yǔ)語(yǔ)音識(shí)別的研究現(xiàn)狀、語(yǔ)音識(shí)別的基本原理及其深度學(xué)習(xí)的相關(guān)理論,并著重闡述了深度特征提取模型在藏語(yǔ)語(yǔ)音識(shí)別的中的應(yīng)用。1.基于深度學(xué)習(xí)的藏語(yǔ)語(yǔ)音特征提取研究深度學(xué)習(xí)能夠克服人工設(shè)計(jì)特征會(huì)使原始語(yǔ)音數(shù)據(jù)特征丟失的缺點(diǎn),學(xué)習(xí)出人工無(wú)法定義的特征。因此,基于大數(shù)據(jù)和深度學(xué)習(xí)來(lái)學(xué)習(xí)特征,更能反映數(shù)據(jù)的豐富內(nèi)在特征信息。本文主要使用稀疏自動(dòng)編碼器和深度置信網(wǎng)兩種模型來(lái)提取藏語(yǔ)語(yǔ)音特征。從模型原理展開,就藏語(yǔ)特征提取模型的無(wú)監(jiān)督預(yù)訓(xùn)練和有監(jiān)督的微調(diào)方法做了詳細(xì)描述。2.基于深度特征的藏語(yǔ)語(yǔ)音識(shí)別聲學(xué)模型研究基于深度學(xué)習(xí)提取的特征,使用GMM-HMM方法建立聲學(xué)模型分別對(duì)音素和音節(jié)識(shí)別。實(shí)驗(yàn)證明,與MFCC特征相比,基于SA+MFCC特征的音素識(shí)別率最高為69.05%,提高10.22%,音節(jié)識(shí)別率為48.54%,提高了24.6個(gè)百分點(diǎn);基于DBN+MFCC特征的音素識(shí)別率最高為69.46%,提高10.63%,音節(jié)識(shí)別率為49.04%,提高了25.1%,并且DBN模型使用更少的迭代次數(shù),因此,DBN模型效率更高。在以后的藏語(yǔ)語(yǔ)音識(shí)別研究工作中,我們可以采用DBN模型進(jìn)行藏語(yǔ)連續(xù)語(yǔ)音識(shí)別的深度特征提取。
【關(guān)鍵詞】:語(yǔ)音識(shí)別 隱馬爾科夫模型 稀疏自動(dòng)編碼器 深度置信網(wǎng) 聲學(xué)模型
【學(xué)位授予單位】:中央民族大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:TN912.3
【目錄】:
- 摘要3-5
- ABSTRACT5-11
- 第一章 緒論11-15
- 1.1 研究背景與意義11-12
- 1.2 藏語(yǔ)語(yǔ)音識(shí)別技術(shù)的發(fā)展現(xiàn)狀12-13
- 1.3 論文創(chuàng)新點(diǎn)13
- 1.4 本文主要內(nèi)容及結(jié)構(gòu)13-15
- 第二章 語(yǔ)音識(shí)別基本原理和相關(guān)理論15-27
- 2.1 人腦語(yǔ)音識(shí)別機(jī)理15-16
- 2.2 數(shù)字語(yǔ)音信號(hào)預(yù)處理16
- 2.3 數(shù)字語(yǔ)音信號(hào)的特征提取16-17
- 2.3.1 時(shí)域特征16-17
- 2.3.2 頻域特征17
- 2.4 聲學(xué)模型17-23
- 2.4.1 隱馬爾科夫模型(HMM)18-22
- 2.4.2 GMM-HMM聲學(xué)模型22-23
- 2.5 語(yǔ)言模型23-24
- 2.6 藏語(yǔ)語(yǔ)音基本特點(diǎn)24-27
- 第三章 基于深度學(xué)習(xí)的藏語(yǔ)語(yǔ)音特征提取研究27-37
- 3.1 深度學(xué)習(xí)的基本思想和常用方法27-28
- 3.1.1 深度學(xué)習(xí)的基本思想27
- 3.1.2 深度學(xué)習(xí)的常用模型27-28
- 3.2 稀疏自動(dòng)編碼器模型28-32
- 3.2.1 稀疏自動(dòng)編碼器原理28-31
- 3.2.2 基于稀疏自動(dòng)編碼器的藏語(yǔ)深度特征提取模型31-32
- 3.3 深度置信網(wǎng)模型32-37
- 3.3.1 深度置信網(wǎng)模型原理32-35
- 3.3.2 基于深度置信網(wǎng)的藏語(yǔ)深度特征提取模型35-37
- 第四章 基于深度特征的藏語(yǔ)語(yǔ)音識(shí)別聲學(xué)模型研究37-41
- 4.1 建模單元的選擇37-38
- 4.2 HMM模型訓(xùn)練38
- 4.2.1 triphones模型訓(xùn)練38
- 4.3 基于深度特征的聲學(xué)建模38-39
- 4.4 基于深度特征和人工特征相結(jié)合的聲學(xué)建模39-41
- 第五章 仿真與實(shí)驗(yàn)41-48
- 5.1 語(yǔ)音樣本庫(kù)的建立41-42
- 5.1.1 語(yǔ)音信號(hào)預(yù)處理41-42
- 5.2 基于MFCC特征的聲學(xué)模型實(shí)驗(yàn)結(jié)果42
- 5.2.1 音素、音節(jié)識(shí)別結(jié)果42
- 5.3 基于深度特征的聲學(xué)模型實(shí)驗(yàn)結(jié)果42-48
- 5.3.1 基于SA的音素、音節(jié)識(shí)別結(jié)果42-44
- 5.3.1.1 實(shí)驗(yàn)設(shè)置42
- 5.3.1.2 實(shí)驗(yàn)結(jié)果42-44
- 5.3.2 基于DBN的音素、音節(jié)識(shí)別結(jié)果44-48
- 5.3.2.1 實(shí)驗(yàn)設(shè)置44-45
- 5.3.2.2 實(shí)驗(yàn)結(jié)果45-48
- 第六章 總結(jié)與展望48-50
- 6.1 總結(jié)48
- 6.2 展望48-50
- 參考文獻(xiàn)50-52
- 致謝52-53
- 攻讀學(xué)位期間發(fā)表的學(xué)術(shù)論文目錄53
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 郭遠(yuǎn)瓊;提高語(yǔ)音識(shí)別率點(diǎn)滴[J];電腦技術(shù);2000年03期
2 邢文;語(yǔ)音識(shí)別[J];個(gè)人電腦;2000年02期
3 ;語(yǔ)音識(shí)別的真相[J];個(gè)人電腦;2001年12期
4 ;語(yǔ)音識(shí)別漸入佳境[J];個(gè)人電腦;2002年03期
5 ;微軟語(yǔ)音識(shí)別軟件可與人直接對(duì)話[J];自動(dòng)化博覽;2003年04期
6 ;語(yǔ)音識(shí)別[J];印刷世界;2004年01期
7 杰里米·瓦格斯塔夫;讓語(yǔ)音識(shí)別軟件 解放你的雙手[J];農(nóng)業(yè)圖書情報(bào)學(xué)刊;2004年03期
8 韓紀(jì)慶,王歡良,李海峰,鄭鐵然;基于語(yǔ)音識(shí)別的發(fā)音學(xué)習(xí)技術(shù)[J];電聲技術(shù);2004年09期
9 陳孝強(qiáng);語(yǔ)音識(shí)別擬起新潮[J];微電腦世界;2005年07期
10 韓紀(jì)慶;張磊;鄭鐵然;;網(wǎng)絡(luò)環(huán)境下的語(yǔ)音識(shí)別方法[J];計(jì)算機(jī)科學(xué);2005年01期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前10條
1 張歆奕;吳今培;張其善;;語(yǔ)音的共性特征及其在語(yǔ)音識(shí)別中的應(yīng)用[A];第十屆全國(guó)信號(hào)處理學(xué)術(shù)年會(huì)(CCSP-2001)論文集[C];2001年
2 杜樹木;何良華;;一種新的基于段長(zhǎng)分布的語(yǔ)音識(shí)別模型[A];2009年通信理論與信號(hào)處理學(xué)術(shù)年會(huì)論文集[C];2009年
3 李楨;高萬(wàn)林;歐文浩;徐山川;;基于關(guān)鍵詞語(yǔ)音識(shí)別的農(nóng)業(yè)信息語(yǔ)音服務(wù)系統(tǒng)的研究與實(shí)現(xiàn)[A];中國(guó)農(nóng)業(yè)工程學(xué)會(huì)電氣信息與自動(dòng)化專業(yè)委員會(huì)、中國(guó)電機(jī)工程學(xué)會(huì)農(nóng)村電氣化分會(huì)科技與教育專委會(huì)2010年學(xué)術(shù)年會(huì)論文摘要[C];2010年
4 張冰;龍長(zhǎng)才;羅海風(fēng);;熟悉掩蔽音背景下的目標(biāo)語(yǔ)音識(shí)別[A];泛在信息社會(huì)中的聲學(xué)——中國(guó)聲學(xué)學(xué)會(huì)2010年全國(guó)會(huì)員代表大會(huì)暨學(xué)術(shù)會(huì)議論文集[C];2010年
5 王承發(fā);趙德彬;金山;苗百利;朱志瑩;;語(yǔ)音識(shí)別應(yīng)用中抗噪聲干擾方法的初步探討[A];第二屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C];1992年
6 杜笑平;楊啟綱;楊家沅;;過(guò)零周期轉(zhuǎn)移概率矩陣語(yǔ)音識(shí)別部件的研制[A];第二屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C];1992年
7 季宏;劉志文;杜燕玲;黃曾陽(yáng);;語(yǔ)音識(shí)別中的音字轉(zhuǎn)換[A];第三屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C];1994年
8 葛余博;楊大利;曾德超;;噪聲環(huán)境下語(yǔ)音識(shí)別的幾個(gè)問(wèn)題(一)[A];第三屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C];1994年
9 朱奇峰;俞鐵城;;聽覺(jué)中的協(xié)同現(xiàn)象和其對(duì)語(yǔ)音識(shí)別影響的探討[A];第四屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C];1996年
10 姚磊;黃泰翼;陳景東;;一種高魯棒性語(yǔ)音識(shí)別的通用自適應(yīng)方法研究[A];第四屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C];1996年
中國(guó)重要報(bào)紙全文數(shù)據(jù)庫(kù) 前10條
1 黃夢(mèng);方案商積極切入語(yǔ)音識(shí)別市場(chǎng)[N];電腦商報(bào);2006年
2 閆婷;語(yǔ)音識(shí)別 理想與現(xiàn)實(shí)的距離[N];計(jì)算機(jī)世界;2007年
3 劉喜喜;語(yǔ)音識(shí)別將把鼠標(biāo)鍵盤打入冷宮?[N];中國(guó)計(jì)算機(jī)報(bào);2008年
4 樂(lè)天;語(yǔ)音識(shí)別:讓你的手機(jī)更聰明[N];計(jì)算機(jī)世界;2011年
5 特約作者 王佳彬;語(yǔ)音識(shí)別漸入佳境[N];電腦報(bào);2002年
6 雨夏;語(yǔ)音識(shí)別重在應(yīng)用[N];計(jì)算機(jī)世界;2001年
7 ;語(yǔ)音識(shí)別企業(yè)應(yīng)用前景光明[N];計(jì)算機(jī)世界;2003年
8 王向東 欒煥博 林守勛 錢躍良;語(yǔ)音識(shí)別:抗噪音能力有待加強(qiáng)[N];計(jì)算機(jī)世界;2006年
9 上海 高博;讓電腦“聽懂”人話[N];電腦報(bào);2008年
10 張彤;語(yǔ)音識(shí)別融入統(tǒng)一通信[N];網(wǎng)絡(luò)世界;2008年
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 許金普;農(nóng)產(chǎn)品市場(chǎng)信息采集的語(yǔ)音識(shí)別魯棒性方法研究[D];中國(guó)農(nóng)業(yè)科學(xué)院;2015年
2 包希日莫;面向蒙古語(yǔ)的語(yǔ)音識(shí)別聲學(xué)建模研究[D];內(nèi)蒙古大學(xué);2016年
3 吳斌;語(yǔ)音識(shí)別中的后處理技術(shù)研究[D];北京郵電大學(xué);2008年
4 奉小慧;音頻噪聲環(huán)境下唇動(dòng)信息在語(yǔ)音識(shí)別中的應(yīng)用技術(shù)研究[D];華南理工大學(xué);2010年
5 孫f,
本文編號(hào):1001385
本文鏈接:http://www.sikaile.net/kejilunwen/xinxigongchenglunwen/1001385.html