面向語音增強的約束序貫高斯混合模型噪聲功率譜估計
本文選題:高斯混合模型 + 功率譜估計; 參考:《聲學學報》2017年05期
【摘要】:提出了一種基于極大似然的噪聲對數(shù)功率譜估計方法,采用高斯混合模型對每一個頻帶上的功率譜包絡構(gòu)建統(tǒng)計模型,將時序包絡劃分為語音和非語音類,它們分別對應于高斯混合模型的兩個高斯分量,描述語音和非語音的統(tǒng)計分布,其中非語音高斯分量的均值即為噪聲功率譜的最優(yōu)估計.采用序貫學習的方法,在極大似然準則下逐幀更新模型參數(shù),并逐幀給出噪聲功率譜的最優(yōu)估計值。此外,由于序貫更新過程中語音信號長時缺失,容易導致模型失穩(wěn),提出了一種在線的最小描述長度準則(MDL)來判斷語音信號是否長時缺失,從而保證了模型的穩(wěn)定性.實驗表明,算法性能整體優(yōu)于經(jīng)典的MS和IMCRA算法。
[Abstract]:In this paper, a noise logarithmic power spectrum estimation method based on maximum likelihood is proposed. The Gao Si hybrid model is used to construct a statistical model for the power spectrum envelope in each frequency band, and the time series envelope is divided into speech and non-speech classes. They correspond to two Gao Si components of Gao Si mixed model, and describe the statistical distribution of speech and non-speech. The mean value of non-speech Gao Si component is the optimal estimation of noise power spectrum. Using sequential learning method, the model parameters are updated frame by frame under the maximum likelihood criterion, and the optimal estimation of noise power spectrum is given. In addition, due to the long time loss of speech signal in sequential updating process, it is easy to lead to model instability. An online minimum description length criterion (MDL) is proposed to judge whether the speech signal is long time missing or not, so as to ensure the stability of the model. Experiments show that the performance of the algorithm is better than that of the classical MS and IMCRA algorithms.
【作者單位】: 江西理工大學信息工程學院;北京理工大學多元信息系統(tǒng)實驗室;中國科學院聲學研究所語言聲學與內(nèi)容理解重點實驗室;國家計算機網(wǎng)絡應急技術處理協(xié)調(diào)中心;
【基金】:江西省教育廳科技項目(GJJ150681) 江西理工大學自然科學基金項目(NSFJ2015-G21) 國家重點基礎研究發(fā)展計劃項目(2013CB329302) 國家自然科學基金項目(61271426,10925419,90920302,61072124,11074275,11161140319,91120001) 中國科學院戰(zhàn)略性先導科技專項(XDA06030100,XDA06030500);中國科學院重點部署項目(KGZD-EW-103-2)資助
【分類號】:TN912.3
【相似文獻】
相關期刊論文 前10條
1 翟繼友;張鵬;;高斯混合模型參數(shù)估值算法的優(yōu)化[J];計算機技術與發(fā)展;2011年11期
2 王曉晨;姜林;;一種基于高斯混合模型的導譜頻率參數(shù)量化算法[J];電視技術;2014年15期
3 鄭華;裴承鳴;秦淋;;基于高斯混合模型的粒子濾波時頻分析算法[J];測控技術;2011年03期
4 崔瑋;吳成東;張云洲;賈子熙;程龍;;基于高斯混合模型的非視距定位算法[J];通信學報;2014年01期
5 林琳;王樹勛;魏小麗;;基于遺傳模糊高斯混合模型的訓練方法[J];吉林大學學報(工學版);2006年06期
6 張琦;王霞;孫燾;;高斯混合模型下的殘留回波抑制算法[J];西安交通大學學報;2013年04期
7 余清清;李應;李勇;;基于高斯混合模型的自然環(huán)境聲音的識別[J];計算機工程與應用;2011年25期
8 石銳;王博;何慶華;;基于高斯混合模型的咳嗽音檢測方法[J];計算機工程與應用;2011年32期
9 夏玉果;顧明亮;;基于聚類支持矢量機的漢語方言辨識[J];計算機與數(shù)字工程;2012年05期
10 張文英;郭興明;翁漸;;改進的高斯混合模型在心音信號分類識別中應用[J];振動與沖擊;2014年06期
相關會議論文 前3條
1 康永國;雙志偉;陶建華;張維;徐波;;高斯混合模型和碼本映射相結(jié)合的語音轉(zhuǎn)換算法[A];第八屆全國人機語音通訊學術會議論文集[C];2005年
2 應冬文;顏永紅;付強;國雁萌;;基于約束高斯混合模型的噪聲功率譜估計[A];2010年通信理論與信號處理學術年會論文集[C];2010年
3 周潔;;基于高斯混合模型的情感語音轉(zhuǎn)換[A];2011'中國西部聲學學術交流會論文集[C];2011年
相關碩士學位論文 前10條
1 車瀅霞;約束條件下的結(jié)構(gòu)化統(tǒng)計聲學模型及非平行語料語音轉(zhuǎn)換[D];蘇州大學;2015年
2 姚紹芹;基于聲道譜參數(shù)的語音轉(zhuǎn)換算法研究[D];南京郵電大學;2015年
3 蔡超;自動語種識別的研究與應用[D];電子科技大學;2016年
4 蔡桂林;高斯混合模型用于語音情感識別研究[D];廣西師范大學;2016年
5 閆昊;基于高斯混合模型的文本無關說話人年齡識別[D];蘇州大學;2015年
6 于瑩瑩;基于高斯混合模型的頻帶擴展算法的研究[D];北京理工大學;2015年
7 賈楠;基于流形及高斯混合模型的壓縮感知算法研究[D];燕山大學;2013年
8 孫峰;基于高斯混合模型的語種識別技術[D];哈爾濱工程大學;2006年
9 吳杰;基于高斯混合模型的話者識別系統(tǒng)的研究[D];吉林大學;2008年
10 魏開容;高斯混合模型FPGA實現(xiàn)關鍵技術研究[D];解放軍信息工程大學;2011年
,本文編號:2096711
本文鏈接:http://www.sikaile.net/kejilunwen/xinxigongchenglunwen/2096711.html