特定人語音增強算法的研究
本文關(guān)鍵詞:特定人語音增強算法的研究,由筆耕文化傳播整理發(fā)布。
【摘要】:隨著信息化的發(fā)展,語音通信成為人們?nèi)粘W罨镜臏贤ǚ绞?但在實際環(huán)境中會不可避免的受到各種噪聲的影響,導致語音質(zhì)量和系統(tǒng)性能的下降,因此很多學者致力于研究高效的語音增強算法。目前,越來越多的電子設(shè)備被“私有化”,即在日常生活中,僅被一個人或固定的幾個人長期使用,所以根據(jù)這個特點,我們考慮在語音增強算法中引入特定說話人的特征信息,進而提高噪聲的抑制能力。本文通過分析幾種經(jīng)典語音增強算法,給出了一種基于特定人特征的改進算法。在語音存在與否的雙狀態(tài)模型下,最優(yōu)修正的最小均方差對數(shù)幅度譜估計(OMLSA)算法與改進的最小值控制的遞歸平均(IMCRA)算法相結(jié)合的方法,相對于其他經(jīng)典算法在噪聲抑制方面具有明顯優(yōu)勢。因此,本文在IMCRA-OMLSA算法的基礎(chǔ)上,引入特定說話人的特征信息。在特定人語音增強算法中,特定人特征信息是經(jīng)過大量特定人的語音訓練后得到的高斯混合模型(GMM)。根據(jù)語音存在概率對不同信號譜的估計過程和權(quán)重系數(shù)的影響,分別從先驗信噪比估計、IMCRA噪聲估計和OMLSA語音估計三個角度,利用特定人的GMM模型對該算法進行了改進。在多種噪聲類型和輸入信噪比條件下,利用六種客觀評價指標對所提出的特定人語音增強算法和其他經(jīng)典算法進行了對比測試。通過實驗結(jié)果表明,本文所給出的特定人語音增強算法無論在噪聲抑制還是語音失真方面,均優(yōu)于其他經(jīng)典算法。
【關(guān)鍵詞】:語音增強技術(shù) 特定說話人 高斯混合模型 OMLSA
【學位授予單位】:上海交通大學
【學位級別】:碩士
【學位授予年份】:2015
【分類號】:TN912.35
【目錄】:
- 摘要3-4
- ABSTRACT4-11
- 第一章 緒論11-17
- 1.1 研究背景及意義11-12
- 1.2 語音增強算法的研究現(xiàn)狀12-14
- 1.3 課題的研究內(nèi)容及目標14-15
- 1.4 論文結(jié)構(gòu)安排15-17
- 第二章 語音增強技術(shù)的概述17-33
- 2.1 譜減法18-19
- 2.2 維納濾波算法19-21
- 2.3 基于統(tǒng)計的MMSE算法21-25
- 2.3.1 基于短時頻譜幅度的MMSE估計器21-23
- 2.3.2 對數(shù)MMSE估計器23-24
- 2.3.3 結(jié)合語音存在概率的對數(shù)MMSE估計器24-25
- 2.4 噪聲估計算法25-29
- 2.4.1 最小值跟蹤算法26-27
- 2.4.2 最小值控制的遞歸平均MCRA算法27-29
- 2.5 語音增強的其他優(yōu)選算法29-31
- 2.5.1 信號子空間算法30
- 2.5.2 基于HMM的語音增強算法30-31
- 2.6 本章小結(jié)31-33
- 第三章 特定人語音增強系統(tǒng)33-41
- 3.1 特定人語音增強的總體框架33
- 3.2 前端去噪預處理算法33-34
- 3.3 說話人識別算法34-36
- 3.4 基于特定人的語音增強算法36-37
- 3.5 去噪預處理的測試結(jié)果及性能分析37-40
- 3.6 本章小結(jié)40-41
- 第四章 基于GMM和OMLSA的特定人語音增強算法41-61
- 4.1 基于MFCC和GMM的說話人特征提取方法42-43
- 4.1.1 MFCC參數(shù)的GMM模型建立42-43
- 4.1.2 說話人特征信息的頻域轉(zhuǎn)換43
- 4.2 基于特定人特征的IMCRA噪聲估計器43-49
- 4.2.1 IMCRA噪聲估計器44-45
- 4.2.2 基于特定人特征改進的SD-IMCRA方法45-47
- 4.2.3 特征系數(shù)的選取47-49
- 4.2.4 基于特定人的IMCRA噪聲估計性能分析49
- 4.3 基于特定人特征的先驗信噪比估計方法49-53
- 4.3.1 先驗信噪比估計的直接判決法51
- 4.3.2 基于特征人特征改進的先驗信噪比估計SD-DD方法51-52
- 4.3.3 特征系數(shù)的選取及應(yīng)用擴展52-53
- 4.4 基于特定人特征的OMLSA語音估計器53-59
- 4.4.1 OMLSA語音估計器54-56
- 4.4.2 基于特定人信息改進的SD-OMLSA語音估計56-58
- 4.4.3 特征系數(shù)的選取和分析58-59
- 4.5 本章小結(jié)59-61
- 第五章 測試結(jié)果及性能分析61-75
- 5.1 語音增強算法的性能評估方法61-64
- 5.1.1 主觀音質(zhì)評估方法61-63
- 5.1.2 客觀音質(zhì)評估方法63-64
- 5.2 基于特定人的語音增強算法的測試結(jié)果64-73
- 5.2.1 測試環(huán)境64
- 5.2.2 基于特定人的SD-IMCRA-OMLSA算法性能測試64-68
- 5.2.3 基于通用說話人特征的USD-IMCRA-OMLSA算法性能測試68-69
- 5.2.4 基于特定人先驗信噪比的維納濾波算法性能測試69-70
- 5.2.5 特定人語音增強算法性能分析70-73
- 5.3 本章小結(jié)73-75
- 第六章 工作總結(jié)與展望75-77
- 6.1 本文的主要研究成果75-76
- 6.2 后續(xù)研究工作76-77
- 參考文獻77-81
- 攻讀碩士學位期間已發(fā)表或錄用的論文81-83
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 胡光銳,虞曉;基于二階前向結(jié)構(gòu)和信息最大理論的語音增強算法[J];上海交通大學學報;2000年07期
2 姚峰英,張敏;用于語音增強的高頻信噪比度量[J];聲學學報;2002年05期
3 彭煊,劉金福,王炳錫;基于獨立分量分析的語音增強[J];信號處理;2002年05期
4 王金明,張雄偉;一種基于自適應(yīng)模糊濾波的語音增強方法[J];解放軍理工大學學報(自然科學版);2003年01期
5 楊匯軍,鄭海英,王立紅;語音增強方法的研究[J];遼寧工學院學報;2003年05期
6 徐爽,韓芳芳,鄭德忠;基于閾值的小波域語音增強新算法[J];傳感技術(shù)學報;2004年01期
7 孫新德;一種改進的語音增強方法及實現(xiàn)[J];鄭州航空工業(yè)管理學院學報(社會科學版);2005年04期
8 錢國青;趙鶴鳴;;基于改進譜減算法的語音增強新方法[J];計算機工程與應(yīng)用;2005年35期
9 王晶,傅豐林,張運偉;語音增強算法綜述[J];聲學與電子工程;2005年01期
10 楊毅;楊宇;余達太;;語音增強及其消噪能力研究[J];微電子學與計算機;2006年07期
中國重要會議論文全文數(shù)據(jù)庫 前10條
1 陳凱;俞蒙槐;胡上序;付強;;語音增強系統(tǒng)性能評測方法綜述[A];第四屆全國人機語音通訊學術(shù)會議論文集[C];1996年
2 王建波;林本浩;田春明;劉睿;;語音增強及其相關(guān)技術(shù)研究[A];2009通信理論與技術(shù)新發(fā)展——第十四屆全國青年通信學術(shù)會議論文集[C];2009年
3 徐舒;孫洪;;基于融合迭代的語音增強方法[A];第十四屆全國信號處理學術(shù)年會(CCSP-2009)論文集[C];2009年
4 牛剛;任新智;吳國慶;;諧波能量匯集度在語音增強中的應(yīng)用[A];第六屆全國信息獲取與處理學術(shù)會議論文集(2)[C];2008年
5 國雁萌;;一種極低信噪比條件下的語音增強方法[A];第六屆全國人機語音通訊學術(shù)會議論文集[C];2001年
6 江峰;李曉東;;適用于抑制非平穩(wěn)背景噪聲的語音增強算法[A];中國聲學學會2003年青年學術(shù)會議[CYCA'03]論文集[C];2003年
7 閻兆立;杜利民;;維納后濾波語音增強算法研究[A];中國聲學學會2005年青年學術(shù)會議[CYCA'05]論文集[C];2005年
8 劉淑華;胡強;覃團發(fā);萬海斌;;語音增強算法的研究[A];2005通信理論與技術(shù)新進展——第十屆全國青年通信學術(shù)會議論文集[C];2005年
9 魏臻;張景達;陸陽;;嵌入式系統(tǒng)中語音增強改進算法的研究[A];2007'中國儀器儀表與測控技術(shù)交流大會論文集(一)[C];2007年
10 楊威明;;基于閾值的小波變換語音增強方法[A];2007北京地區(qū)高校研究生學術(shù)交流會通信與信息技術(shù)會議論文集(上冊)[C];2008年
中國博士學位論文全文數(shù)據(jù)庫 前10條
1 歐世峰;變換域語音增強算法的研究[D];吉林大學;2008年
2 尹偉;基于模型的語音增強方法及質(zhì)量評估研究[D];武漢大學;2009年
3 王海艷;基于統(tǒng)計模型的語音增強算法研究[D];吉林大學;2011年
4 方瑜;語音增強相關(guān)問題研究[D];北京郵電大學;2012年
5 姚峰英;語音增強系統(tǒng)的研究與實現(xiàn)[D];中國科學院上海冶金研究所;2001年
6 夏丙寅;面向移動通信的單通道語音增強方法研究[D];北京工業(yè)大學;2014年
7 徐勇;基于深層神經(jīng)網(wǎng)絡(luò)的語音增強方法研究[D];中國科學技術(shù)大學;2015年
8 陶智;低信噪比環(huán)境下語音增強的研究[D];蘇州大學;2011年
9 王娜;基于小波變換與約束方差噪聲譜估計的語音增強算法研究[D];燕山大學;2011年
10 趙彥平;基于稀疏表示的語音增強方法研究[D];吉林大學;2014年
中國碩士學位論文全文數(shù)據(jù)庫 前10條
1 肖佩霖;雙通道語音增強系統(tǒng)設(shè)計與實現(xiàn)[D];哈爾濱工業(yè)大學;2011年
2 魏有權(quán);基于噪聲估計的語音增強算法研究[D];昆明理工大學;2015年
3 郭栗;特定人語音增強算法的研究[D];上海交通大學;2015年
4 熊敏;基于巴克域語音增強算法的研究與實現(xiàn)[D];湖南大學;2009年
5 張濤;基于時域濾波器的語音增強算法研究[D];中國科學技術(shù)大學;2009年
6 楊海波;基于耳蝸濾波及諧波特性的語音增強方法研究[D];蘭州大學;2010年
7 靳晨升;語音增強算法的研究[D];太原理工大學;2010年
8 孟靜;語音增強算法性能的評價研究[D];蘭州交通大學;2010年
9 馮巖;基于提升小波的語音增強算法的研究與實現(xiàn)[D];電子科技大學;2010年
10 卓露;語音增強算法的研究與實現(xiàn)[D];湖北工業(yè)大學;2011年
本文關(guān)鍵詞:特定人語音增強算法的研究,,由筆耕文化傳播整理發(fā)布。
本文編號:258495
本文鏈接:http://www.sikaile.net/shoufeilunwen/xixikjs/258495.html