噪聲環(huán)境下的語音檢測(cè)方法研究
本文關(guān)鍵詞:噪聲環(huán)境下的語音檢測(cè)方法研究,,由筆耕文化傳播整理發(fā)布。
【摘要】:語音檢測(cè)是指從一段包含語音的信號(hào)中自動(dòng)地檢測(cè)出語音存在時(shí)段的一門技術(shù),也稱為語音活動(dòng)檢測(cè)。它是語音信號(hào)處理中的重要環(huán)節(jié),廣泛地應(yīng)用于多個(gè)研究領(lǐng)域,如語音編碼、語音增強(qiáng)和語音識(shí)別等。目前,現(xiàn)有的語音檢測(cè)方法在高信噪比噪聲環(huán)境下檢測(cè)效果比較理想,然而在低信噪比噪聲環(huán)境下,其檢測(cè)效果很大程度地下降。因此,低信噪比環(huán)境下的魯棒語音檢測(cè)方法研究具有重大意義。本文主要對(duì)基于機(jī)器學(xué)習(xí)的語音檢測(cè)方法進(jìn)行研究,在研究和分析現(xiàn)有的一些檢測(cè)方法的基礎(chǔ)上,對(duì)兩種語音檢測(cè)方法進(jìn)行了改進(jìn),達(dá)到在低信噪比環(huán)境下提高語音檢測(cè)性能的目的,具體工作和創(chuàng)新如下:(1)基于魯棒特征的加權(quán)學(xué)習(xí)語音檢測(cè)該方法針對(duì)基于諧波頻率分量多觀測(cè)似然比測(cè)試的語音檢測(cè)方法所存在的一些問題進(jìn)行了改進(jìn)。針對(duì)噪聲方差是計(jì)算語音檢測(cè)似然比的關(guān)鍵,采用了無偏最小均方誤差的方法進(jìn)行噪聲估計(jì),提高了似然比計(jì)算的準(zhǔn)確性;針對(duì)在低信噪比噪聲環(huán)境下,濁音幀的諧波譜峰受到噪聲干擾很大,不能有效地提高原有多幀似然比的總得分的缺點(diǎn),提出了一個(gè)新的特征:基于長時(shí)譜峰的似然比幾何均值,并將此特征與原有的多觀測(cè)特征向量組合成一個(gè)新的特征向量,使用基于最小分類錯(cuò)誤可區(qū)分訓(xùn)練方法對(duì)新特征向量進(jìn)行加權(quán),以此來改進(jìn)語音檢測(cè)的決策規(guī)則,這樣消除了等權(quán)值模型所存在的缺陷。實(shí)驗(yàn)結(jié)果表明,該方法提高了對(duì)弱語音幀的檢測(cè),從而提高了語音檢測(cè)的檢測(cè)性能。(2)基于噪聲和信號(hào)分類的語音檢測(cè)由于基于信號(hào)分類的語音檢測(cè)方法在檢測(cè)模型構(gòu)建時(shí)是由多噪聲環(huán)境的混合含噪語音訓(xùn)練得到的,它沒有考慮到噪聲類別對(duì)語音檢測(cè)的檢測(cè)性能也存在一定的影響。因此,本文引入了噪聲分類方法,將其作為語音檢測(cè)方法的第一步,以此來提高檢測(cè)性能。采用了感知小波包變換的方法來進(jìn)行噪聲特征提取,提高了噪聲分類的準(zhǔn)確性。針對(duì)二元分類問題需要可分性高的信號(hào)特征的要求,使用了魯棒性高的多窗譜MFCC進(jìn)行信號(hào)特征提取。實(shí)驗(yàn)結(jié)果表明,該方法有效地提高了語音檢測(cè)的檢測(cè)性能。
【關(guān)鍵詞】:語音檢測(cè) 噪聲估計(jì) 長時(shí)譜峰 最小分類錯(cuò)誤 噪聲分類
【學(xué)位授予單位】:電子科技大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類號(hào)】:TN912.3
【目錄】:
- 摘要5-6
- ABSTRACT6-10
- 第一章 緒論10-17
- 1.1 研究工作的背景與意義10-11
- 1.2 國內(nèi)外研究歷史與現(xiàn)狀11-15
- 1.3 本文的主要貢獻(xiàn)與創(chuàng)新15
- 1.4 本論文的章節(jié)安排15-17
- 第二章 語音檢測(cè)技術(shù)基礎(chǔ)17-32
- 2.1 語音信號(hào)產(chǎn)生的數(shù)字模型17-20
- 2.1.1 激勵(lì)模型17-19
- 2.1.2 聲道模型19
- 2.1.3 輻射模型19-20
- 2.2 語音信號(hào)的特征分析20-27
- 2.2.1 語音信號(hào)的預(yù)處理20-22
- 2.2.2 語音信號(hào)的時(shí)域分析22-25
- 2.2.3 語音信號(hào)的頻域分析25-27
- 2.3 語音檢測(cè)技術(shù)27-30
- 2.3.1 基于統(tǒng)計(jì)模型的語音檢測(cè)27-29
- 2.3.2 基于信號(hào)分類的語音檢測(cè)29-30
- 2.4 語音數(shù)據(jù)庫準(zhǔn)備30-31
- 2.4.1 語音數(shù)據(jù)庫30
- 2.4.2 參考標(biāo)簽30-31
- 2.5 性能評(píng)價(jià)標(biāo)準(zhǔn)31
- 2.6 本章小結(jié)31-32
- 第三章 基于魯棒特征的加權(quán)學(xué)習(xí)語音檢測(cè)32-54
- 3.1 基于Hmfreq-MOLRT的語音檢測(cè)32-35
- 3.2 問題提出35-37
- 3.3 魯棒的Hmfreq-LTSP聯(lián)合特征37-42
- 3.3.1 無偏最小均方誤差噪聲估計(jì)37-38
- 3.3.2 Hmfreq-LTSP聯(lián)合特征38-42
- 3.4 改進(jìn)的決策規(guī)則42-45
- 3.5 實(shí)驗(yàn)結(jié)果45-53
- 3.5.1 噪聲估計(jì)效果45-47
- 3.5.2 語音檢測(cè)效果47-53
- 3.6 本章小結(jié)53-54
- 第四章 基于噪聲和信號(hào)分類的語音檢測(cè)54-73
- 4.1 MFCC-SVM的語音檢測(cè)方法54-61
- 4.1.1 MFCC特征提取55-58
- 4.1.2 SVM分類器58-61
- 4.2 基于噪聲和信號(hào)分類的語音檢測(cè)61-67
- 4.2.1 算法思想61-62
- 4.2.2 系統(tǒng)框圖62-63
- 4.2.3 噪聲分類方法63-65
- 4.2.4 信號(hào)分類方法65-67
- 4.3 實(shí)驗(yàn)結(jié)果67-71
- 4.3.1 噪聲分類效果67-68
- 4.3.2 信號(hào)分類效果68-70
- 4.3.3 語音檢測(cè)效果70-71
- 4.4 本章小結(jié)71-73
- 第五章 總結(jié)與展望73-75
- 5.1 工作總結(jié)73
- 5.2 工作展望73-75
- 致謝75-76
- 參考文獻(xiàn)76-81
【共引文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 苑津莎;張利偉;王瑜;尚海昆;;基于極限學(xué)習(xí)機(jī)的變壓器故障診斷方法研究[J];電測(cè)與儀表;2013年12期
2 張凱;趙建虎;王鍥;;基于支持向量機(jī)的水下地形匹配導(dǎo)航中適配區(qū)劃分方法研究[J];大地測(cè)量與地球動(dòng)力學(xué);2013年06期
3 周任軍;趙慧材;方昀暉;劉巍;;采用支持向量機(jī)圖形用戶界面的電力負(fù)荷組合預(yù)測(cè)方法[J];電力科學(xué)與工程;2013年12期
4 郝理陽;潘泉;;基于融合核方程對(duì)藥物-靶點(diǎn)作用預(yù)測(cè)研究[J];電子設(shè)計(jì)工程;2013年23期
5 王文;王成剛;李建海;楊帆;;基于SVR的電工實(shí)驗(yàn)裝置故障預(yù)測(cè)方法研究[J];電氣電子教學(xué)學(xué)報(bào);2013年06期
6 SUN Juelu;;An improved method to distinguish between scanned and rasterized document images[J];Baosteel Technical Research;2014年01期
7 歐陽純萍;陽小華;雷龍艷;徐強(qiáng);余穎;劉志明;;多策略中文微博細(xì)粒度情緒分析研究[J];北京大學(xué)學(xué)報(bào)(自然科學(xué)版);2014年01期
8 李雅倩;李穎杰;李海濱;張強(qiáng);張文明;;融合全局與局部多樣性特征的人臉表情識(shí)別[J];光學(xué)學(xué)報(bào);2014年05期
9 李姜;郭立紅;;基于改進(jìn)支持向量機(jī)的目標(biāo)威脅估計(jì)[J];光學(xué)精密工程;2014年05期
10 王曉春;黃靖;楊豐;羅蔓;;基于SVM模型參數(shù)優(yōu)化的多模態(tài)MRI圖像腫瘤分割方法[J];南方醫(yī)科大學(xué)學(xué)報(bào);2014年05期
中國重要會(huì)議論文全文數(shù)據(jù)庫 前7條
1 錢志明;楊家寬;段連鑫;;基于視頻的車輛檢測(cè)與跟蹤研究進(jìn)展[A];2013年中國智能自動(dòng)化學(xué)術(shù)會(huì)議論文集(第五分冊(cè))[C];2013年
2 朱強(qiáng)華;鄭鐵然;韓紀(jì)慶;;行車環(huán)境下基于二值語譜圖的聲學(xué)事件檢測(cè)[A];第十二屆全國人機(jī)語音通訊學(xué)術(shù)會(huì)議(NCMMSC'2013)論文集[C];2013年
3 YAN Jun-wei;Zhou Yu;ZHOU Xuan;;Study on Operation Energy Efficiency Model of Chiller Based on SVR[A];第26屆中國控制與決策會(huì)議論文集[C];2014年
4 蔡英鳳;王海;陳小波;;基于多部件RBM模型的部分遮擋車輛檢測(cè)[A];2014第九屆中國智能交通年會(huì)大會(huì)論文集[C];2014年
5 Jun Chen;Xiaoqi Peng;Xiuming Tang;;Error Correction of Support Vector Regression Model for Copper-Matte Converting Process[A];2015年中國智能自動(dòng)化學(xué)術(shù)會(huì)議論文集(第三分冊(cè))[C];2015年
6 吳龍飛;孫浩;計(jì)科峰;;基于集成映射的半監(jiān)督圖像分類方法[A];第八屆全國信號(hào)和智能信息處理與應(yīng)用學(xué)術(shù)會(huì)議會(huì)刊[C];2014年
7 游山;焦振宇;許超;;大間隔原則的雙邊2DPCA在人臉識(shí)別中的應(yīng)用[A];第九屆全國信號(hào)和智能信息處理與應(yīng)用學(xué)術(shù)會(huì)議專刊[C];2015年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 王寶勛;面向網(wǎng)絡(luò)社區(qū)問答對(duì)的語義挖掘研究[D];哈爾濱工業(yè)大學(xué);2013年
2 常廣;高壓斷路器振動(dòng)監(jiān)測(cè)與故障診斷的研究[D];北京交通大學(xué);2013年
3 姜恩宇;基于直腸感知功能重建的人工括約肌系統(tǒng)研究[D];上海大學(xué);2013年
4 邵喜高;基于統(tǒng)計(jì)學(xué)習(xí)理論的多核預(yù)測(cè)模型研究及應(yīng)用[D];中南大學(xué);2013年
5 木瑞塔(Murtada Khalafallah Elbashir Elfaki);基于機(jī)器學(xué)習(xí)和統(tǒng)計(jì)方法的蛋白質(zhì)結(jié)構(gòu)特征預(yù)測(cè)[D];中南大學(xué);2013年
6 張國鵬;三維紋理分析在虛擬結(jié)腸鏡計(jì)算機(jī)輔助檢測(cè)/診斷中的應(yīng)用研究[D];第四軍醫(yī)大學(xué);2013年
7 鄧盛川;具有調(diào)峰爐的熱力站節(jié)能控制策略研究[D];哈爾濱工業(yè)大學(xué);2012年
8 李翔;隧道工程穩(wěn)定可靠度計(jì)算分析方法研究[D];湖南大學(xué);2012年
9 張志敏;化學(xué)計(jì)量學(xué)算法實(shí)現(xiàn)的軟件開發(fā)基礎(chǔ)研究[D];中南大學(xué);2012年
10 胡振邦;基于Latent SVM的人體目標(biāo)檢測(cè)與跟蹤方法研究[D];中國地質(zhì)大學(xué);2013年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 馬靜;基于數(shù)據(jù)不平衡的SVM方法預(yù)測(cè)microRNA[D];燕山大學(xué);2013年
2 冉沛;基于特征提取的篡改圖像取證研究[D];重慶大學(xué);2013年
3 劉峰;基于多目標(biāo)優(yōu)化的多標(biāo)簽分類算法參數(shù)調(diào)諧研究[D];南京師范大學(xué);2013年
4 袁建洲;風(fēng)電場(chǎng)短期功率預(yù)測(cè)方法的研究[D];南昌大學(xué);2013年
5 周明輝;運(yùn)動(dòng)車輛車牌識(shí)別算法的研究與實(shí)現(xiàn)[D];昆明理工大學(xué);2013年
6 張軼;干擾量化類隱寫的檢測(cè)[D];解放軍信息工程大學(xué);2013年
7 李家魁;基于序列進(jìn)化信息的蛋白質(zhì)預(yù)測(cè)研究[D];東北師范大學(xué);2013年
8 王星;利用聚類后PCA方法的T細(xì)胞表位預(yù)測(cè)研究[D];東北師范大學(xué);2013年
9 魏雅娟;暗視場(chǎng)浮游動(dòng)物圖像自動(dòng)識(shí)別方法研究[D];中國海洋大學(xué);2013年
10 劉毅;基于內(nèi)容的敏感圖像識(shí)別技術(shù)研究[D];北京工業(yè)大學(xué);2013年
本文關(guān)鍵詞:噪聲環(huán)境下的語音檢測(cè)方法研究,由筆耕文化傳播整理發(fā)布。
本文編號(hào):286389
本文鏈接:http://www.sikaile.net/kejilunwen/wltx/286389.html