單聲道語(yǔ)音降噪與去混響研究綜述
發(fā)布時(shí)間:2021-06-24 14:03
語(yǔ)音增強(qiáng)是提高語(yǔ)音質(zhì)量與可懂度的關(guān)鍵技術(shù),在語(yǔ)音識(shí)別、語(yǔ)音通話、電話會(huì)議和聽力輔助等領(lǐng)域具有廣泛應(yīng)用前景與重要研究?jī)r(jià)值.從模型方法、數(shù)據(jù)集、特征、評(píng)估指標(biāo)等方面,對(duì)單聲道語(yǔ)音增強(qiáng)研究工作的發(fā)展現(xiàn)狀進(jìn)行了全面調(diào)研和深入分析.1)對(duì)傳統(tǒng)的與基于機(jī)器學(xué)習(xí)的單聲道語(yǔ)音降噪以及語(yǔ)音去混響的已有研究工作進(jìn)行了梳理分類,簡(jiǎn)要介紹了典型方法的研究思路,并對(duì)不同方法的實(shí)驗(yàn)結(jié)果進(jìn)行了綜合比較;2)對(duì)在實(shí)驗(yàn)與結(jié)果評(píng)估過(guò)程中所涉及到的常用數(shù)據(jù)集、常見特征、學(xué)習(xí)目標(biāo)與評(píng)估指標(biāo)等進(jìn)行了整理與介紹;3)對(duì)目前單聲道語(yǔ)音增強(qiáng)仍然面臨的主要問(wèn)題與挑戰(zhàn)進(jìn)行了總結(jié).
【文章來(lái)源】:計(jì)算機(jī)研究與發(fā)展. 2020,57(05)北大核心EICSCD
【文章頁(yè)數(shù)】:26 頁(yè)
【部分圖文】:
一種混響消除方法[110]
1.1 譜減法譜減法是最早期提出的降噪算法之一,它基于一個(gè)簡(jiǎn)單假設(shè):噪聲是加性噪聲.通過(guò)從帶噪語(yǔ)音譜中減去對(duì)噪聲譜的估計(jì)來(lái)得到降噪后的語(yǔ)音譜,其基本做法如圖1所示,做出這一假設(shè)是基于噪聲的平穩(wěn)性或者是一種慢變的過(guò)程[5].由于實(shí)際噪聲的非平穩(wěn)特性,在使用過(guò)程中,這種方法很容易由于譜減過(guò)程中減去譜成分的過(guò)大或過(guò)小造成語(yǔ)音失真,即產(chǎn)生令人困擾的音樂(lè)噪聲.為減輕由譜減過(guò)程引入的語(yǔ)音失真,最常用的一種方式就是采用過(guò)減因子來(lái)控制失真程度,眾多學(xué)者提出了不同的準(zhǔn)則來(lái)計(jì)算過(guò)減因子[6-8],例如對(duì)差分譜做半波整流(half-wave rectification, HWR)和基于心理聲學(xué)掩蔽閾值的方法.隨著小波技術(shù)的發(fā)展,Zhong等人[9]根據(jù)硬閾值和軟閾值改進(jìn)了基于小波降噪的閾值函數(shù)算法,該方法有效地減少了降噪后信號(hào)中的毛刺現(xiàn)象.但是受到假設(shè)條件的限制,譜減法始終不能有效地解決音樂(lè)噪聲的問(wèn)題.
不同于基于簡(jiǎn)單假設(shè)的譜減法,維納濾波器的提出是基于最小均方誤差意義的最優(yōu)解,通過(guò)求解最優(yōu)化均方誤差計(jì)算得到增強(qiáng)信號(hào)[10],基本流程如圖2所示,但是它的推導(dǎo)仍然是基于所分析信號(hào)具有平穩(wěn)性這一假設(shè),不能有效地處理非平穩(wěn)信號(hào)的情況.在后續(xù)改進(jìn)中,通過(guò)使用卡爾曼(Kalman)濾波器,濾波法成功地被推廣到處理非平穩(wěn)信號(hào)和噪聲的場(chǎng)景下[11-12].Wang等人[13]提出了一種使用卡爾曼濾波器進(jìn)行調(diào)制域語(yǔ)音增強(qiáng)的算法,利用高斯環(huán)統(tǒng)計(jì)模型將語(yǔ)音和噪聲頻譜幅度進(jìn)行結(jié)合,通過(guò)高斯混合來(lái)模擬復(fù)數(shù)傅里葉域中語(yǔ)音和噪聲的先驗(yàn)分布;Andersen等人[14]將多聲道技術(shù),即基于語(yǔ)音失真加權(quán)的幀間維納濾波器(speech-distortion weighted inter-frame Wiener filter)應(yīng)用于單聲道,進(jìn)一步利用二次高分辨率濾波器組(secondary higher resolution filter bank)改進(jìn)了對(duì)幀間相關(guān)性(inter-frame corr-elation, IFC)的估計(jì),更好地在語(yǔ)音降噪和失真之間找到一個(gè)平衡參數(shù),減輕了增強(qiáng)語(yǔ)音失真;Peng等人[15]在線性預(yù)測(cè)殘差域中結(jié)合人類聽覺(jué)系統(tǒng)的掩蔽特性,進(jìn)一步抑制了殘留噪聲.1.3 基于統(tǒng)計(jì)模型的方法
【參考文獻(xiàn)】:
期刊論文
[1]語(yǔ)音去混響技術(shù)的研究進(jìn)展與展望[J]. 張雄偉,李軼南,鄭昌艷,曹鐵勇,孫蒙,閔剛. 數(shù)據(jù)采集與處理. 2017(06)
[2]聯(lián)合長(zhǎng)短時(shí)記憶遞歸神經(jīng)網(wǎng)絡(luò)和非負(fù)矩陣分解的語(yǔ)音混響消除方法[J]. 劉斌,陶建華. 信號(hào)處理. 2017(03)
本文編號(hào):3247237
【文章來(lái)源】:計(jì)算機(jī)研究與發(fā)展. 2020,57(05)北大核心EICSCD
【文章頁(yè)數(shù)】:26 頁(yè)
【部分圖文】:
一種混響消除方法[110]
1.1 譜減法譜減法是最早期提出的降噪算法之一,它基于一個(gè)簡(jiǎn)單假設(shè):噪聲是加性噪聲.通過(guò)從帶噪語(yǔ)音譜中減去對(duì)噪聲譜的估計(jì)來(lái)得到降噪后的語(yǔ)音譜,其基本做法如圖1所示,做出這一假設(shè)是基于噪聲的平穩(wěn)性或者是一種慢變的過(guò)程[5].由于實(shí)際噪聲的非平穩(wěn)特性,在使用過(guò)程中,這種方法很容易由于譜減過(guò)程中減去譜成分的過(guò)大或過(guò)小造成語(yǔ)音失真,即產(chǎn)生令人困擾的音樂(lè)噪聲.為減輕由譜減過(guò)程引入的語(yǔ)音失真,最常用的一種方式就是采用過(guò)減因子來(lái)控制失真程度,眾多學(xué)者提出了不同的準(zhǔn)則來(lái)計(jì)算過(guò)減因子[6-8],例如對(duì)差分譜做半波整流(half-wave rectification, HWR)和基于心理聲學(xué)掩蔽閾值的方法.隨著小波技術(shù)的發(fā)展,Zhong等人[9]根據(jù)硬閾值和軟閾值改進(jìn)了基于小波降噪的閾值函數(shù)算法,該方法有效地減少了降噪后信號(hào)中的毛刺現(xiàn)象.但是受到假設(shè)條件的限制,譜減法始終不能有效地解決音樂(lè)噪聲的問(wèn)題.
不同于基于簡(jiǎn)單假設(shè)的譜減法,維納濾波器的提出是基于最小均方誤差意義的最優(yōu)解,通過(guò)求解最優(yōu)化均方誤差計(jì)算得到增強(qiáng)信號(hào)[10],基本流程如圖2所示,但是它的推導(dǎo)仍然是基于所分析信號(hào)具有平穩(wěn)性這一假設(shè),不能有效地處理非平穩(wěn)信號(hào)的情況.在后續(xù)改進(jìn)中,通過(guò)使用卡爾曼(Kalman)濾波器,濾波法成功地被推廣到處理非平穩(wěn)信號(hào)和噪聲的場(chǎng)景下[11-12].Wang等人[13]提出了一種使用卡爾曼濾波器進(jìn)行調(diào)制域語(yǔ)音增強(qiáng)的算法,利用高斯環(huán)統(tǒng)計(jì)模型將語(yǔ)音和噪聲頻譜幅度進(jìn)行結(jié)合,通過(guò)高斯混合來(lái)模擬復(fù)數(shù)傅里葉域中語(yǔ)音和噪聲的先驗(yàn)分布;Andersen等人[14]將多聲道技術(shù),即基于語(yǔ)音失真加權(quán)的幀間維納濾波器(speech-distortion weighted inter-frame Wiener filter)應(yīng)用于單聲道,進(jìn)一步利用二次高分辨率濾波器組(secondary higher resolution filter bank)改進(jìn)了對(duì)幀間相關(guān)性(inter-frame corr-elation, IFC)的估計(jì),更好地在語(yǔ)音降噪和失真之間找到一個(gè)平衡參數(shù),減輕了增強(qiáng)語(yǔ)音失真;Peng等人[15]在線性預(yù)測(cè)殘差域中結(jié)合人類聽覺(jué)系統(tǒng)的掩蔽特性,進(jìn)一步抑制了殘留噪聲.1.3 基于統(tǒng)計(jì)模型的方法
【參考文獻(xiàn)】:
期刊論文
[1]語(yǔ)音去混響技術(shù)的研究進(jìn)展與展望[J]. 張雄偉,李軼南,鄭昌艷,曹鐵勇,孫蒙,閔剛. 數(shù)據(jù)采集與處理. 2017(06)
[2]聯(lián)合長(zhǎng)短時(shí)記憶遞歸神經(jīng)網(wǎng)絡(luò)和非負(fù)矩陣分解的語(yǔ)音混響消除方法[J]. 劉斌,陶建華. 信號(hào)處理. 2017(03)
本文編號(hào):3247237
本文鏈接:http://www.sikaile.net/kejilunwen/xinxigongchenglunwen/3247237.html
最近更新
教材專著