基于稀疏表示的語音盲解卷積和房間脈沖響應(yīng)建模方法研究
發(fā)布時間:2021-07-04 06:12
語音盲解卷積是語音信號處理領(lǐng)域極具挑戰(zhàn)的研究課題之一。語音盲解卷積的目的是根據(jù)觀測混響信號實現(xiàn)對源信號和聲學(xué)信道的恢復(fù),其意義不僅在于消除混響效應(yīng)對自動語音識別、免提電話、助聽器等應(yīng)用的不利影響,同時通過所估計的聲學(xué)信道還可以獲得系統(tǒng)的聲學(xué)特性,這對聲學(xué)信道相關(guān)的聲重放、語音增強等應(yīng)用至關(guān)重要。然而,由于盲解卷積問題的非適定性,必須要為問題的求解提供一定的先驗信息,如何獲取這樣的信息就成為問題求解的關(guān)鍵。本文研究了單輸入單輸出室內(nèi)聲學(xué)系統(tǒng)的語音盲解卷積問題,從挖掘和利用聲學(xué)信道特性入手,圍繞描述聲學(xué)信道的房間脈沖響應(yīng)展開工作,通過對房間脈沖響應(yīng)施加正則約束和進行聲學(xué)建模兩種方式來獲取先驗信息,求解語音盲解卷積問題。本文主要研究內(nèi)容如下:首先,研究了基于稀疏約束的語音盲解卷積問題。針對混響較低聲學(xué)系統(tǒng),提出了一種基于稀疏約束的語音盲解卷積模型,并給出了相應(yīng)的求解方法。當(dāng)混響較低時,房間脈沖響應(yīng)可認(rèn)為僅包含稀疏的前期反射部分。為此,所提模型采用了一個l1范數(shù)正則項對房間脈沖響應(yīng)的稀疏特性進行約束;還采用了一個指示函數(shù)對源信號的動態(tài)范圍進行約束,以進一步降低解空間維度。實驗結(jié)果表明,所提方法...
【文章來源】:哈爾濱工業(yè)大學(xué)黑龍江省 211工程院校 985工程院校
【文章頁數(shù)】:127 頁
【學(xué)位級別】:博士
【部分圖文】:
圖1-1封閉環(huán)境聲音傳播示例??Fig.?1-1?Illustration?of?sound?propagation?in?an?enclosed?environment??
聲#研宄的核心問題,具有極其重要的研宄價值。而本文工怍則是對源信號和房??間脈沖響應(yīng)進行估計,以及房間脈沖響應(yīng)建模的研宄。??圖1-2給出了一個房間脈沖響應(yīng)信號的縮略示例圖,其中橫坐標(biāo)表示時間、縱??坐標(biāo)表示脈沖信號在該時刻的幅值信息,該圖反映了房間脈沖響應(yīng)信號的幅值隨??時間衰減變化的過程。房間脈沖響應(yīng)通?煞譃槿糠郑簯椷_聲s前期反射和后期??反射(也稱后期混響),它描述了聲音由聲源至麥克風(fēng)的傳播過程。當(dāng)源信號與房??間脈沖響應(yīng)這三部分進行卷積時分別產(chǎn)生接收信號的直達聲.、前期混響和后期混??響。如圖1-2所錄,房間脈沖響應(yīng)前期反射部分的各個脈沖之間具有較明顯的時間??延遲,隨時間建現(xiàn)分立排列;而后期反射部分則在時間上呈現(xiàn)較為密集的連續(xù)分??布。房間脈沖響應(yīng)的反射能量隨時間逐漸衰減,其描述了'聲源停止發(fā)生后,聲音不??斷反射逐漸衰變的過程,通常情況下房間脈沖響應(yīng)的反射能量M指數(shù)衰減?。需??要強調(diào)的是,很多時候房間脈沖響應(yīng)的直達聲和前期反射所組成的前期部分統(tǒng)稱??為前期反射
量和可理解性會因過大的后期反射而降低。通常在一些場景中,如靜音室等經(jīng)過??吸聲處理的低反射聲學(xué)環(huán)境,房間混響相對較低,則可認(rèn)為房間脈沖響應(yīng)僅包含相??對稀疏的前期反射部分(圖2-1中紅色虛線部分),而后期反射部分可以忽略不計,??則該種情況下的聲學(xué)系統(tǒng)是稀疏的。因此,通過借助房間脈沖響應(yīng)的稀疏性,可以??使用稀疏盲解卷積的方法實現(xiàn)語音信號和房間脈沖響應(yīng)的估計。??本章對稀疏聲學(xué)系統(tǒng)進行語音盲解卷積的研究,提出了一種基于稀疏約束的??語音盲解卷積模型。該模型不僅使用了聲學(xué)系統(tǒng)的稀疏特性作為問題求解先驗信??息,同時還使用了信號的動態(tài)范圍以進一步降低盲解卷積解空間的范圍。為了優(yōu)??-13?-??
【參考文獻】:
博士論文
[1]基于深度學(xué)習(xí)的說話人無關(guān)單通道語音分離[D]. 王燕南.中國科學(xué)技術(shù)大學(xué) 2017
[2]基于深層神經(jīng)網(wǎng)絡(luò)的語音增強方法研究[D]. 徐勇.中國科學(xué)技術(shù)大學(xué) 2015
[3]中國民族音樂廳堂ITDG和IACC的主觀優(yōu)選研究[D]. 郭天葵.華南理工大學(xué) 2013
[4]圖像反卷積算法研究[D]. 楊航.吉林大學(xué) 2012
[5]雙耳可聽化質(zhì)量及其影響因素的研究[D]. 饒丹.華南理工大學(xué) 2009
本文編號:3264203
【文章來源】:哈爾濱工業(yè)大學(xué)黑龍江省 211工程院校 985工程院校
【文章頁數(shù)】:127 頁
【學(xué)位級別】:博士
【部分圖文】:
圖1-1封閉環(huán)境聲音傳播示例??Fig.?1-1?Illustration?of?sound?propagation?in?an?enclosed?environment??
聲#研宄的核心問題,具有極其重要的研宄價值。而本文工怍則是對源信號和房??間脈沖響應(yīng)進行估計,以及房間脈沖響應(yīng)建模的研宄。??圖1-2給出了一個房間脈沖響應(yīng)信號的縮略示例圖,其中橫坐標(biāo)表示時間、縱??坐標(biāo)表示脈沖信號在該時刻的幅值信息,該圖反映了房間脈沖響應(yīng)信號的幅值隨??時間衰減變化的過程。房間脈沖響應(yīng)通?煞譃槿糠郑簯椷_聲s前期反射和后期??反射(也稱后期混響),它描述了聲音由聲源至麥克風(fēng)的傳播過程。當(dāng)源信號與房??間脈沖響應(yīng)這三部分進行卷積時分別產(chǎn)生接收信號的直達聲.、前期混響和后期混??響。如圖1-2所錄,房間脈沖響應(yīng)前期反射部分的各個脈沖之間具有較明顯的時間??延遲,隨時間建現(xiàn)分立排列;而后期反射部分則在時間上呈現(xiàn)較為密集的連續(xù)分??布。房間脈沖響應(yīng)的反射能量隨時間逐漸衰減,其描述了'聲源停止發(fā)生后,聲音不??斷反射逐漸衰變的過程,通常情況下房間脈沖響應(yīng)的反射能量M指數(shù)衰減?。需??要強調(diào)的是,很多時候房間脈沖響應(yīng)的直達聲和前期反射所組成的前期部分統(tǒng)稱??為前期反射
量和可理解性會因過大的后期反射而降低。通常在一些場景中,如靜音室等經(jīng)過??吸聲處理的低反射聲學(xué)環(huán)境,房間混響相對較低,則可認(rèn)為房間脈沖響應(yīng)僅包含相??對稀疏的前期反射部分(圖2-1中紅色虛線部分),而后期反射部分可以忽略不計,??則該種情況下的聲學(xué)系統(tǒng)是稀疏的。因此,通過借助房間脈沖響應(yīng)的稀疏性,可以??使用稀疏盲解卷積的方法實現(xiàn)語音信號和房間脈沖響應(yīng)的估計。??本章對稀疏聲學(xué)系統(tǒng)進行語音盲解卷積的研究,提出了一種基于稀疏約束的??語音盲解卷積模型。該模型不僅使用了聲學(xué)系統(tǒng)的稀疏特性作為問題求解先驗信??息,同時還使用了信號的動態(tài)范圍以進一步降低盲解卷積解空間的范圍。為了優(yōu)??-13?-??
【參考文獻】:
博士論文
[1]基于深度學(xué)習(xí)的說話人無關(guān)單通道語音分離[D]. 王燕南.中國科學(xué)技術(shù)大學(xué) 2017
[2]基于深層神經(jīng)網(wǎng)絡(luò)的語音增強方法研究[D]. 徐勇.中國科學(xué)技術(shù)大學(xué) 2015
[3]中國民族音樂廳堂ITDG和IACC的主觀優(yōu)選研究[D]. 郭天葵.華南理工大學(xué) 2013
[4]圖像反卷積算法研究[D]. 楊航.吉林大學(xué) 2012
[5]雙耳可聽化質(zhì)量及其影響因素的研究[D]. 饒丹.華南理工大學(xué) 2009
本文編號:3264203
本文鏈接:http://www.sikaile.net/kejilunwen/xinxigongchenglunwen/3264203.html
最近更新
教材專著