基于多模型矢量泰勒級(jí)數(shù)的語音識(shí)別系統(tǒng)優(yōu)化
發(fā)布時(shí)間:2017-05-21 21:16
本文關(guān)鍵詞:基于多模型矢量泰勒級(jí)數(shù)的語音識(shí)別系統(tǒng)優(yōu)化,由筆耕文化傳播整理發(fā)布。
【摘要】:在理想的實(shí)驗(yàn)室環(huán)境下,語音識(shí)別系統(tǒng)具有很高的識(shí)別率,但是在實(shí)際環(huán)境下,由于各種噪聲的干擾,降低了實(shí)際應(yīng)用環(huán)境下的語音識(shí)別性能,論文將從前端的端點(diǎn)檢測(cè)和后端的拒識(shí)別兩方面入手,進(jìn)行系統(tǒng)優(yōu)化,以提高語音識(shí)別系統(tǒng)性能、尤其是低信噪比環(huán)境下的識(shí)別性能。論文的主要工作包括:(1)分析了語音識(shí)別系統(tǒng)結(jié)構(gòu),包括預(yù)處理、特征提取和建模。預(yù)處理主要對(duì)語音信號(hào)進(jìn)行預(yù)加重、分幀加窗、端點(diǎn)檢測(cè);提取美爾頻率倒譜系數(shù)(MFCC:Mel-Frequency Cepstral Coefficients)及其一階差分倒譜系數(shù),作為語音識(shí)別系統(tǒng)的特征參數(shù);利用隱馬爾科夫模型(HMM:Hidden Markov Mod el)對(duì)語音信號(hào)進(jìn)行聲學(xué)建模。(2)實(shí)現(xiàn)了基于子帶能量譜熵的端點(diǎn)檢測(cè)算法,優(yōu)化了系統(tǒng)的端點(diǎn)檢測(cè)模塊。子帶能量譜熵參數(shù)不僅可以表征低信噪比環(huán)境下的語音信號(hào)特征,而且對(duì)不同種類的噪聲有一定的魯棒性。測(cè)試結(jié)果表明,在低信噪比環(huán)境下,基于子帶能量譜熵的端點(diǎn)檢測(cè)效果要優(yōu)于原先的雙門限端點(diǎn)檢測(cè):端點(diǎn)檢測(cè)模塊的優(yōu)化大幅提高VTSME(VTS-based Multi-Environment)語音識(shí)別系統(tǒng)的識(shí)別性能,尤其是在低信噪比環(huán)境下的識(shí)別性能。(3)為語音識(shí)別系統(tǒng)增加了拒識(shí)模塊。本文對(duì)語音長(zhǎng)度過短、環(huán)境信噪比過低和對(duì)可能識(shí)別錯(cuò)誤的孤立詞進(jìn)行拒識(shí)這三個(gè)方面進(jìn)行研究,其中重點(diǎn)研究了基于后驗(yàn)概率差值的拒識(shí)算法。通過拒識(shí)噪聲大、語音短和區(qū)分度低的測(cè)試語音,大幅度提高了系統(tǒng)識(shí)別準(zhǔn)確率,而基本沒有增加系統(tǒng)復(fù)雜度,保證了系統(tǒng)的實(shí)時(shí)性。(4)在MATLAB平臺(tái)上進(jìn)行的仿真實(shí)驗(yàn)基礎(chǔ)上,實(shí)現(xiàn)了C平臺(tái)的優(yōu)化算法。將優(yōu)化部分移植到C平臺(tái),完成了對(duì)實(shí)時(shí)的非特定人孤立詞識(shí)別系統(tǒng)的優(yōu)化。實(shí)驗(yàn)結(jié)果證明,優(yōu)化使語音識(shí)別系統(tǒng)的識(shí)別性能得到了大幅度提升。
【關(guān)鍵詞】:子帶譜熵 端點(diǎn)檢測(cè) 拒識(shí) 多環(huán)境模型
【學(xué)位授予單位】:東南大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類號(hào)】:TN912.34
【目錄】:
- 摘要4-5
- Abstract5-8
- 第一章 緒論8-12
- 1.1 語音識(shí)別的研究背景8
- 1.2 語音識(shí)別的發(fā)展歷史和現(xiàn)狀8-9
- 1.2.1 國(guó)外發(fā)展歷史和研究現(xiàn)狀8-9
- 1.2.2 國(guó)內(nèi)發(fā)展歷史和研究現(xiàn)狀9
- 1.3 語音識(shí)別技術(shù)的難點(diǎn)9-10
- 1.4 論文的主要內(nèi)容及組織結(jié)構(gòu)10-12
- 第二章 語音識(shí)別系統(tǒng)的優(yōu)化概述12-24
- 2.1 語音識(shí)別系統(tǒng)的結(jié)構(gòu)12-15
- 2.1.1 預(yù)處理12-13
- 2.1.2 特征提取13-14
- 2.1.3 HMM聲學(xué)模型14-15
- 2.2 端點(diǎn)檢測(cè)算法15-19
- 2.2.1 傳統(tǒng)雙門限端點(diǎn)檢測(cè)算法16-17
- 2.2.2 基于互相關(guān)函數(shù)的端點(diǎn)檢測(cè)算法17-18
- 2.2.3 基于譜熵的端點(diǎn)檢測(cè)算法18-19
- 2.3 語音拒識(shí)算法19-23
- 2.3.1 基于填充模型和噪聲模型的拒識(shí)算法20-21
- 2.3.2 基于后驗(yàn)概率差值的拒識(shí)算法21-23
- 2.4 小結(jié)23-24
- 第三章 多模型VTS孤立詞識(shí)別系統(tǒng)的前端優(yōu)化24-50
- 3.1 引言24-26
- 3.2 基于多環(huán)境模型VTS特征補(bǔ)償算法概述26-28
- 3.2.1 基于VTS倒譜域特征補(bǔ)償算法概述26
- 3.2.2 基于VTS特征補(bǔ)償算法噪聲均值方差估計(jì)26-27
- 3.2.3 多環(huán)境模型的VTS特征補(bǔ)償算法概述27-28
- 3.3 基于子帶譜熵的端點(diǎn)檢測(cè)算法28-38
- 3.3.1 子帶譜熵參數(shù)28-31
- 3.3.2 基于子帶譜熵的改進(jìn)端點(diǎn)檢測(cè)算法31-37
- 3.3.3 端點(diǎn)檢測(cè)及系統(tǒng)性能評(píng)價(jià)37-38
- 3.4 基于MATLAB的仿真實(shí)驗(yàn)38-43
- 3.4.1 實(shí)驗(yàn)條件38-39
- 3.4.2 實(shí)驗(yàn)結(jié)果及分析39-43
- 3.5 基于C平臺(tái)的實(shí)時(shí)實(shí)驗(yàn)43-47
- 3.5.1 實(shí)時(shí)語音采集43-44
- 3.5.2 實(shí)驗(yàn)設(shè)備與數(shù)據(jù)庫介紹44-45
- 3.5.3 實(shí)時(shí)測(cè)試方案45
- 3.5.4 實(shí)驗(yàn)結(jié)果與分析45-47
- 3.6 小結(jié)47-50
- 第四章 多模型VTS孤立詞識(shí)別系統(tǒng)的后端優(yōu)化50-68
- 4.1 基于后驗(yàn)概率差值的拒識(shí)算法50-55
- 4.1.1 拒識(shí)特征提取50-52
- 4.1.2 語音長(zhǎng)度過短的拒識(shí)52-53
- 4.1.3 環(huán)境信噪比過低的拒識(shí)53
- 4.1.4 拒識(shí)步驟及算法流程53-54
- 4.1.5 拒識(shí)及系統(tǒng)性能評(píng)價(jià)54-55
- 4.2 基于MATLAB的仿真實(shí)驗(yàn)55-63
- 4.2.1 實(shí)驗(yàn)參數(shù)的選取55-56
- 4.2.2 實(shí)驗(yàn)結(jié)果及分析56-63
- 4.3 基于C平臺(tái)的實(shí)時(shí)實(shí)驗(yàn)63-66
- 4.3.1 實(shí)驗(yàn)設(shè)備與數(shù)據(jù)庫介紹63
- 4.3.2 實(shí)時(shí)測(cè)試方案63
- 4.3.3 實(shí)驗(yàn)結(jié)果與分析63-66
- 4.4 小結(jié)66-68
- 第五章 總結(jié)與展望68-70
- 5.1 全文總結(jié)68
- 5.2 研究展望68-70
- 致謝70-72
- 參考文獻(xiàn)72-75
- 攻讀碩士學(xué)位期間參加的科研項(xiàng)目和完成的論文75
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫 前10條
1 汪洪波;;語音識(shí)別系統(tǒng)在配送中心的應(yīng)用[J];信息與電腦;2006年06期
2 楊q,
本文編號(hào):384869
本文鏈接:http://www.sikaile.net/kejilunwen/wltx/384869.html
最近更新
教材專著