基于希爾伯特空間的超球覆蓋語音識別算法研究
本文關(guān)鍵詞:基于希爾伯特空間的超球覆蓋語音識別算法研究,由筆耕文化傳播整理發(fā)布。
【摘要】:語音識別是語音鏈的一環(huán),其最終目的是使計算機(jī)聽懂任何人、任何內(nèi)容的講話。語音識別技術(shù)作為一門交叉學(xué)科,在家電產(chǎn)品、智能玩具、商業(yè)系統(tǒng)的數(shù)據(jù)庫語音查詢、工業(yè)生產(chǎn)部門的語聲控制、電話與電信系統(tǒng)的自動撥號等領(lǐng)域得到了非常廣泛的應(yīng)用。雖然語音識別技術(shù)已經(jīng)取得了一些成就,但是由于語音信號的多樣性和復(fù)雜性,目前的語音識別效率還有待提高,因而開發(fā)高效率語音識別模型和算法成為語音識別研究中的一個重要課題。本文分別對語音識別技術(shù)中的預(yù)處理、特征提取和模式識別進(jìn)行了細(xì)致的研究,其主要內(nèi)容有:為了研究語音識別與何種參數(shù)相關(guān),本文做了相關(guān)的特征提取實驗,將現(xiàn)有的時域特征、頻域特征及時頻域特征進(jìn)行對比分析,發(fā)現(xiàn)時頻域特征才是語音識別的特征關(guān)鍵,通過對時頻譜的簡化,得到了一個新的語音時頻特征——過零譜,再經(jīng)由大量實驗證明,過零譜是一種可以實現(xiàn)簡單且識別效率高的語音特征函數(shù)。針對現(xiàn)有的語音識別模型雖精確度高但是計算復(fù)雜的特點,提出了一種高識別率,低復(fù)雜度的語音識別模型——基于希爾伯特空間的超球覆蓋識別算法,該算法不用做FFT。通過反復(fù)實驗,可知該算法在算法復(fù)雜度上低于傳統(tǒng)的語音識別算法,而在語音識別的準(zhǔn)確率上不低于傳統(tǒng)的語音識別算法。本文通過提出了一種新的特征提取方法,并用基于希爾伯特空間的超球覆蓋識別算法進(jìn)行識別,經(jīng)在MATLAB上進(jìn)行仿真,得到的結(jié)果表明該算法運行速度快,識別率高。本文的研究主要應(yīng)用于低速率嵌入式系統(tǒng)中,當(dāng)前語音識別算法相對較復(fù)雜,導(dǎo)致了語音芯片昂貴,今后將繼續(xù)朝著語音識別實時、準(zhǔn)確和語音識別系統(tǒng)價格低廉的方向努力,這樣才能使語音識別更有應(yīng)用價值,尤其是在物聯(lián)網(wǎng)和智能家居上。
【關(guān)鍵詞】:語音識別 特征提取 過零譜 希爾伯特空間 超球覆蓋
【學(xué)位授予單位】:上海師范大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:TN912.34
【目錄】:
- 摘要3-4
- Abstract4-8
- 第一章 緒論8-13
- 1.1 語音識別技術(shù)概述8-9
- 1.2 語音識別的發(fā)展和現(xiàn)狀9-11
- 1.2.1 國外發(fā)展歷史及現(xiàn)狀9-10
- 1.2.2 國內(nèi)發(fā)展歷史及現(xiàn)狀10-11
- 1.3 課題研究背景及意義11-12
- 1.4 本文的創(chuàng)新點12
- 1.5 本文內(nèi)容安排12-13
- 第二章 語音識別技術(shù)基本原理13-21
- 2.1 語音識別系統(tǒng)構(gòu)成13-15
- 2.2 語音信號預(yù)處理15-19
- 2.2.1 語音信號的預(yù)加重處理15
- 2.2.2 語音信號的加窗分幀15-17
- 2.2.3 語音信號的端點檢測17-19
- 2.3 語音識別特征提取19-20
- 2.4 模式識別算法20
- 2.5 本章小結(jié)20-21
- 第三章 特征參數(shù)過零譜的提取21-30
- 3.1 常用特征參數(shù)提取21-25
- 3.1.1 線性預(yù)測系數(shù)(LPC)21-22
- 3.1.2 線性預(yù)測倒譜系數(shù)(LPCC)22-23
- 3.1.3 Mel頻率倒譜系數(shù)(MFCC)23-25
- 3.2 新的特征參數(shù)提取25-29
- 3.3 本章小結(jié)29-30
- 第四章 基于希爾伯特空間的超球覆蓋算法30-48
- 4.1 常用識別算法30-38
- 4.1.1 動態(tài)時間規(guī)整(DTW)30-33
- 4.1.2 隱馬爾可夫模型(HMM)33-38
- 4.2 算法基本思想38-40
- 4.3 算法具體實現(xiàn)40-46
- 4.3.1 模板訓(xùn)練過程40-45
- 4.3.2 匹配識別過程45-46
- 4.4 本章小結(jié)46-48
- 第五章 總結(jié)與展望48-50
- 5.1 總結(jié)48
- 5.2 展望48-50
- 參考文獻(xiàn)50-53
- 攻讀學(xué)位期間取得的研究成果53-54
- 致謝54
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 郭遠(yuǎn)瓊;提高語音識別率點滴[J];電腦技術(shù);2000年03期
2 邢文;語音識別[J];個人電腦;2000年02期
3 ;語音識別的真相[J];個人電腦;2001年12期
4 ;語音識別漸入佳境[J];個人電腦;2002年03期
5 ;微軟語音識別軟件可與人直接對話[J];自動化博覽;2003年04期
6 ;語音識別[J];印刷世界;2004年01期
7 杰里米·瓦格斯塔夫;讓語音識別軟件 解放你的雙手[J];農(nóng)業(yè)圖書情報學(xué)刊;2004年03期
8 韓紀(jì)慶,王歡良,李海峰,鄭鐵然;基于語音識別的發(fā)音學(xué)習(xí)技術(shù)[J];電聲技術(shù);2004年09期
9 陳孝強(qiáng);語音識別擬起新潮[J];微電腦世界;2005年07期
10 韓紀(jì)慶;張磊;鄭鐵然;;網(wǎng)絡(luò)環(huán)境下的語音識別方法[J];計算機(jī)科學(xué);2005年01期
中國重要會議論文全文數(shù)據(jù)庫 前10條
1 張歆奕;吳今培;張其善;;語音的共性特征及其在語音識別中的應(yīng)用[A];第十屆全國信號處理學(xué)術(shù)年會(CCSP-2001)論文集[C];2001年
2 杜樹木;何良華;;一種新的基于段長分布的語音識別模型[A];2009年通信理論與信號處理學(xué)術(shù)年會論文集[C];2009年
3 李楨;高萬林;歐文浩;徐山川;;基于關(guān)鍵詞語音識別的農(nóng)業(yè)信息語音服務(wù)系統(tǒng)的研究與實現(xiàn)[A];中國農(nóng)業(yè)工程學(xué)會電氣信息與自動化專業(yè)委員會、中國電機(jī)工程學(xué)會農(nóng)村電氣化分會科技與教育專委會2010年學(xué)術(shù)年會論文摘要[C];2010年
4 張冰;龍長才;羅海風(fēng);;熟悉掩蔽音背景下的目標(biāo)語音識別[A];泛在信息社會中的聲學(xué)——中國聲學(xué)學(xué)會2010年全國會員代表大會暨學(xué)術(shù)會議論文集[C];2010年
5 王承發(fā);趙德彬;金山;苗百利;朱志瑩;;語音識別應(yīng)用中抗噪聲干擾方法的初步探討[A];第二屆全國人機(jī)語音通訊學(xué)術(shù)會議論文集[C];1992年
6 杜笑平;楊啟綱;楊家沅;;過零周期轉(zhuǎn)移概率矩陣語音識別部件的研制[A];第二屆全國人機(jī)語音通訊學(xué)術(shù)會議論文集[C];1992年
7 季宏;劉志文;杜燕玲;黃曾陽;;語音識別中的音字轉(zhuǎn)換[A];第三屆全國人機(jī)語音通訊學(xué)術(shù)會議論文集[C];1994年
8 葛余博;楊大利;曾德超;;噪聲環(huán)境下語音識別的幾個問題(一)[A];第三屆全國人機(jī)語音通訊學(xué)術(shù)會議論文集[C];1994年
9 朱奇峰;俞鐵城;;聽覺中的協(xié)同現(xiàn)象和其對語音識別影響的探討[A];第四屆全國人機(jī)語音通訊學(xué)術(shù)會議論文集[C];1996年
10 姚磊;黃泰翼;陳景東;;一種高魯棒性語音識別的通用自適應(yīng)方法研究[A];第四屆全國人機(jī)語音通訊學(xué)術(shù)會議論文集[C];1996年
中國重要報紙全文數(shù)據(jù)庫 前10條
1 黃夢;方案商積極切入語音識別市場[N];電腦商報;2006年
2 閆婷;語音識別 理想與現(xiàn)實的距離[N];計算機(jī)世界;2007年
3 劉喜喜;語音識別將把鼠標(biāo)鍵盤打入冷宮?[N];中國計算機(jī)報;2008年
4 樂天;語音識別:讓你的手機(jī)更聰明[N];計算機(jī)世界;2011年
5 特約作者 王佳彬;語音識別漸入佳境[N];電腦報;2002年
6 雨夏;語音識別重在應(yīng)用[N];計算機(jī)世界;2001年
7 ;語音識別企業(yè)應(yīng)用前景光明[N];計算機(jī)世界;2003年
8 王向東 欒煥博 林守勛 錢躍良;語音識別:抗噪音能力有待加強(qiáng)[N];計算機(jī)世界;2006年
9 上海 高博;讓電腦“聽懂”人話[N];電腦報;2008年
10 張彤;語音識別融入統(tǒng)一通信[N];網(wǎng)絡(luò)世界;2008年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 許金普;農(nóng)產(chǎn)品市場信息采集的語音識別魯棒性方法研究[D];中國農(nóng)業(yè)科學(xué)院;2015年
2 包希日莫;面向蒙古語的語音識別聲學(xué)建模研究[D];內(nèi)蒙古大學(xué);2016年
3 吳斌;語音識別中的后處理技術(shù)研究[D];北京郵電大學(xué);2008年
4 奉小慧;音頻噪聲環(huán)境下唇動信息在語音識別中的應(yīng)用技術(shù)研究[D];華南理工大學(xué);2010年
5 孫f,
本文編號:456153
本文鏈接:http://www.sikaile.net/kejilunwen/xinxigongchenglunwen/456153.html