基于激勵(lì)源能量和聲道譜的元音開(kāi)始點(diǎn)檢測(cè)
本文關(guān)鍵詞:基于激勵(lì)源能量和聲道譜的元音開(kāi)始點(diǎn)檢測(cè),由筆耕文化傳播整理發(fā)布。
【摘要】:語(yǔ)音承載信息繁雜,難以精確分離出各種類型單一信息(如語(yǔ)音內(nèi)容、說(shuō)話人特性、情感信息等)。分析和處理語(yǔ)音最關(guān)鍵環(huán)節(jié)之一是對(duì)各類信息的表征或提取。元音是語(yǔ)音中重要的一大類音素,它不僅是能量的主要載體,還蘊(yùn)含著各種信息的有效特征模式。元音開(kāi)始點(diǎn)即為元音開(kāi)始時(shí)刻。輔音-元音音節(jié)結(jié)構(gòu)中,元音開(kāi)始點(diǎn)也可認(rèn)為是輔音-元音分割點(diǎn),標(biāo)志著輔音結(jié)束和元音開(kāi)始時(shí)刻。不同語(yǔ)音處理應(yīng)用涉及各種各樣的語(yǔ)音事件,元音開(kāi)始點(diǎn)便是其中重要的語(yǔ)音事件,可作為語(yǔ)音識(shí)別、說(shuō)話人識(shí)別、情感識(shí)別等重要應(yīng)用的有效特征。因此,準(zhǔn)確檢測(cè)元音開(kāi)始點(diǎn)具有重要應(yīng)用價(jià)值,F(xiàn)有元音開(kāi)始點(diǎn)(VOP)檢測(cè)方法大致可以分為兩類,一類是基于激勵(lì)源信息實(shí)施檢測(cè),另一類基于聲道信息檢測(cè)。當(dāng)前公認(rèn)檢測(cè)效果較好的方法是Prasanna S R M提出的基于激勵(lì)源能量、譜峰能量、調(diào)制譜能量和組合能量的元音開(kāi)始點(diǎn)檢測(cè)方法。當(dāng)時(shí)間分辨率為?40 ms時(shí),這些檢測(cè)方法具有很好的檢測(cè)準(zhǔn)確率,但當(dāng)時(shí)間分辨率提高到?30 ms時(shí),其檢測(cè)準(zhǔn)確率急劇下降。針對(duì)這個(gè)問(wèn)題,本文提出使用時(shí)域包絡(luò)、稀疏線性預(yù)測(cè)和最大相位線性預(yù)測(cè)的元音開(kāi)始點(diǎn)檢測(cè)方法,設(shè)計(jì)處理TIMIT語(yǔ)料庫(kù)整個(gè)TEST部分共336條語(yǔ)句(168個(gè)說(shuō)話人,每個(gè)說(shuō)話人選取兩條語(yǔ)句)檢測(cè)性能評(píng)估實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果表明,當(dāng)時(shí)間分辨率為?30 ms時(shí),采用稀疏線性預(yù)測(cè)和最大相位線性預(yù)測(cè)的檢測(cè)準(zhǔn)確率分別為66.64%和64.19%,比基于激勵(lì)源能量的方法提高3.44%和0.99%。而當(dāng)時(shí)間分辨為?20 ms時(shí),采用稀疏線性預(yù)測(cè)和最大相位線性預(yù)測(cè)的檢測(cè)準(zhǔn)確率分別為55.14%和52.81%,比采用激勵(lì)源能量的方法提高3.94%和1.61%。本文主要?jiǎng)?chuàng)新工作:(1)提出采用頻域線性預(yù)測(cè)算法對(duì)時(shí)域包絡(luò)建模的元音開(kāi)始點(diǎn)檢測(cè)算法,并給出時(shí)域包絡(luò)建模參數(shù)的有效選取方法。(2)提出采用稀疏線性預(yù)測(cè)算法對(duì)激勵(lì)源能量建模的元音開(kāi)始點(diǎn)檢測(cè)算法,以稀疏余項(xiàng)表征激勵(lì)源能量。(3)提出使用最大相位線性預(yù)測(cè)算法對(duì)激勵(lì)源能量建模的元音開(kāi)始點(diǎn)檢測(cè)算法,通過(guò)濾除最大相位信息得到余項(xiàng)來(lái)表征激勵(lì)源能量。
【關(guān)鍵詞】:元音開(kāi)始點(diǎn) 線性預(yù)測(cè) 頻域線性預(yù)測(cè) 稀疏線性預(yù)測(cè) 最大相位線性預(yù)測(cè)
【學(xué)位授予單位】:吉林大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:TN912.3
【目錄】:
- 摘要4-5
- Abstract5-9
- 第1章 緒論9-15
- 1.1 元音開(kāi)始點(diǎn)檢測(cè)背景及意義9-10
- 1.2 元音開(kāi)始點(diǎn)檢測(cè)研究現(xiàn)狀10-11
- 1.3 研究問(wèn)題及內(nèi)容11-12
- 1.4 論文結(jié)構(gòu)安排12-15
- 第2章 語(yǔ)音信號(hào)處理基本原理15-23
- 2.1 語(yǔ)音生成模型15-16
- 2.2 語(yǔ)音分類16-19
- 2.3 短時(shí)處理19-20
- 2.4 語(yǔ)料庫(kù)簡(jiǎn)介20-21
- 2.5 本章小結(jié)21-23
- 第3章 元音開(kāi)始點(diǎn)檢測(cè)特征提取23-37
- 3.1 激勵(lì)源能量23-28
- 3.1.1 線性預(yù)測(cè)23-25
- 3.1.2 基于激勵(lì)源能量元音開(kāi)始點(diǎn)檢測(cè)25-28
- 3.2 譜峰能量28-30
- 3.3 調(diào)制譜能量30-32
- 3.4 組合能量32-33
- 3.5 實(shí)驗(yàn)結(jié)果與分析33-35
- 3.6 本章小結(jié)35-37
- 第4章 基于時(shí)域包絡(luò)元音開(kāi)始點(diǎn)檢測(cè)37-47
- 4.1 頻域線性預(yù)測(cè)37-40
- 4.2 基于時(shí)域包絡(luò)元音開(kāi)始點(diǎn)檢測(cè)40-44
- 4.3 實(shí)驗(yàn)結(jié)果與分析44-45
- 4.4 本章小結(jié)45-47
- 第5章 基于激勵(lì)源能量元音開(kāi)始點(diǎn)檢測(cè)47-59
- 5.1 稀疏線性預(yù)測(cè)47-51
- 5.1.1 余項(xiàng)稀疏的稀疏線性預(yù)測(cè)48
- 5.1.2 系數(shù)稀疏的稀疏線性預(yù)測(cè)48-49
- 5.1.3 基于稀疏線性預(yù)測(cè)元音開(kāi)始點(diǎn)檢測(cè)49-51
- 5.2 最大相位線性預(yù)測(cè)51-55
- 5.2.1 最大相位線性預(yù)測(cè)原理51-53
- 5.2.2 基于最大相位線性預(yù)測(cè)元音開(kāi)始點(diǎn)檢測(cè)53-55
- 5.3 實(shí)驗(yàn)結(jié)果與分析55-57
- 5.4 本章小結(jié)57-59
- 第6章 總結(jié)與展望59-61
- 參考文獻(xiàn)61-67
- 作者簡(jiǎn)介67
- 在攻讀碩士學(xué)位期間發(fā)表科研成果67
- 參加項(xiàng)目67-69
- 致謝69
【參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前5條
1 王艷;馮宏偉;張利平;忽滿利;;基于元音檢測(cè)的漢語(yǔ)連續(xù)語(yǔ)音聲韻母分割[J];計(jì)算機(jī)工程與應(yīng)用;2011年14期
2 張利平;馮宏偉;王艷;;基于元音檢測(cè)的漢語(yǔ)連續(xù)語(yǔ)音端點(diǎn)檢測(cè)方法[J];計(jì)算機(jī)工程與應(yīng)用;2010年27期
3 鄺航宇,張軍,韋崗;一種基于檢測(cè)元音的孤立詞端點(diǎn)檢測(cè)算法[J];電聲技術(shù);2005年03期
4 郭彤穎,吳成東,曲道奎;小波變換理論應(yīng)用進(jìn)展[J];信息與控制;2004年01期
5 屈丹,王炳錫;語(yǔ)音信號(hào)元音檢測(cè)的新方法[J];聲學(xué)學(xué)報(bào);2003年01期
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前2條
1 虢明;基于FRFT相位譜的說(shuō)話人識(shí)別研究[D];吉林大學(xué);2014年
2 彭遠(yuǎn)疆;基于線性預(yù)測(cè)編碼的低速率語(yǔ)音編碼算法的研究[D];電子科技大學(xué);2005年
本文關(guān)鍵詞:基于激勵(lì)源能量和聲道譜的元音開(kāi)始點(diǎn)檢測(cè),由筆耕文化傳播整理發(fā)布。
,本文編號(hào):411514
本文鏈接:http://www.sikaile.net/kejilunwen/xinxigongchenglunwen/411514.html