基于非負矩陣分解的語音增強算法研究
發(fā)布時間:2024-02-04 01:29
語音增強技術(shù)作為語音信號前端的預(yù)處理方法之一,是目前數(shù)字語音信號研究領(lǐng)域內(nèi)的一個熱門方向,旨在從含噪語音信號中重構(gòu)出接近原始語音信號的純凈信號。按照采集信號的麥克風(fēng)個數(shù),可將其分為單通道和多通道兩種類型。本文采用多通道中的雙通道情況進行語音增強的研究,因為它既符合人的雙耳特性,又能合理使用語音信號的空間信息。由于機器學(xué)習(xí)方法的出現(xiàn),一些新的語音增強算法先后出現(xiàn)。其中,利用非負矩陣分解方法進行語音增強效果良好,且其非負數(shù)據(jù)特性更具實際含義。論文主要工作是提出了一種無監(jiān)督的廣義互相關(guān)與非負矩陣相結(jié)合的語音增強算法,并根據(jù)實際需求對其不足進行改進,具體如下:1)對幾種典型的語音增強方法進行了簡單的探究,并介紹了基本非負矩陣分解方法的原理和算法特性。闡述了基于多通道的非負矩陣增強算法和麥克風(fēng)陣列聲源定位方法。2)針對傳統(tǒng)單通道語音增強算法沒有利用信號的空間信息這一缺陷,提出了一種將廣義互相關(guān)方法與非負矩陣相結(jié)合的語音增強算法。該方法通過對輸入混合信號進行字典預(yù)學(xué)習(xí),然后隨機初始化激活系數(shù)向量并進行迭代更新,從而可以逐幀推導(dǎo)出輸入混合語音信號預(yù)學(xué)習(xí)字典的激活系數(shù)。此外,使用了最大池化廣義互相關(guān)相...
【文章頁數(shù)】:64 頁
【學(xué)位級別】:碩士
【部分圖文】:
本文編號:3894970
【文章頁數(shù)】:64 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖2.1當(dāng)x=1時,EUC、KL和IS散度圖
圖3.2平均GCC相位譜
第三章基于多通道的NMF語音增強算法28圖3.2平均GCC相位譜3.4基于GCC-NMF的語音增強算法在本節(jié)中,介紹了GCC-NMF分離算法和其軟掩碼方法,并根據(jù)其空間來源進行分組,然后獨立地重建每組原子。3.4.1非負矩陣分解當(dāng)將NMF應(yīng)用到音頻信號中時,假設(shè)輸入語音信號的幅度....
圖3.3NMF在混合語音信號中學(xué)習(xí)的詞典
第三章基于多通道的NMF語音增強算法29Τ|V|WΛHHWI(3.7)ΤΤ|V|HΛWWIH(3.8)其中,矩陣的次方、除法和Hadamard乘積是逐元素計算的,而I是全值為1的矩陣。NMF字典原子通常在每次更新后進行標(biāo)準(zhǔn)化,并且其激活系數(shù)會相應(yīng)縮放。頻率f(Hz)(a)字典矩陣....
圖4.1GCC-NMF在線實時追蹤圖形用戶界面
第四章基于實時性的GCC-NMF語音增強算法34圖4.1GCC-NMF在線實時追蹤圖形用戶界面4.5實驗測試與結(jié)果分析在本節(jié)中,研究了各個指標(biāo)對實時GCC-NMF的客觀語音增強質(zhì)量和語音清晰度的影響。探究了預(yù)學(xué)習(xí)字典大小和用于預(yù)學(xué)習(xí)的數(shù)據(jù)量對該方法的影響,然后研究訓(xùn)練和推理迭代次....
本文編號:3894970
本文鏈接:http://www.sikaile.net/kejilunwen/xinxigongchenglunwen/3894970.html
最近更新
教材專著