基于生成對抗網(wǎng)絡(luò)合成噪聲的語音增強(qiáng)方法研究
發(fā)布時(shí)間:2023-02-15 19:59
在語音增強(qiáng)領(lǐng)域,深度神經(jīng)網(wǎng)絡(luò)通過對大量含有不同噪聲的語音以監(jiān)督學(xué)習(xí)方式進(jìn)行訓(xùn)練建模,從而提升網(wǎng)絡(luò)的語音增強(qiáng)能力。然而不同類型噪聲的獲取成本較大,噪聲類型難以全面采集,影響了模型的泛化能力。針對這個(gè)問題,提出一種基于生成對抗網(wǎng)絡(luò)(Generative Adversarial Networks,GAN)的噪聲數(shù)據(jù)樣本增強(qiáng)方法,該方法對真實(shí)噪聲數(shù)據(jù)進(jìn)行學(xué)習(xí),根據(jù)數(shù)據(jù)特征合成虛擬噪聲,以此擴(kuò)充訓(xùn)練集中噪聲數(shù)據(jù)的數(shù)量和類型。通過實(shí)驗(yàn)驗(yàn)證,所采用的噪聲合成方法能夠有效擴(kuò)展訓(xùn)練集中噪聲來源,增強(qiáng)模型的泛化能力,有效提高語音信號(hào)去噪處理后的信噪比和可理解性。
【文章頁數(shù)】:5 頁
【文章目錄】:
0 引言
1 生成對抗網(wǎng)絡(luò)
1.1 GAN的簡單介紹
1.2 噪聲生成網(wǎng)絡(luò)WGAN
1.2.1 輸入和輸出
1.2.2 網(wǎng)絡(luò)結(jié)構(gòu)
1.3 語音增強(qiáng)網(wǎng)絡(luò)SEGAN
2 實(shí)驗(yàn)
2.1 實(shí)驗(yàn)配置
2.2 實(shí)驗(yàn)結(jié)果
2.2.1 生成噪音數(shù)據(jù)樣本
2.2.2 基于SEGAN模型的語音增強(qiáng)性能比較
3 結(jié)論
本文編號(hào):3743752
【文章頁數(shù)】:5 頁
【文章目錄】:
0 引言
1 生成對抗網(wǎng)絡(luò)
1.1 GAN的簡單介紹
1.2 噪聲生成網(wǎng)絡(luò)WGAN
1.2.1 輸入和輸出
1.2.2 網(wǎng)絡(luò)結(jié)構(gòu)
1.3 語音增強(qiáng)網(wǎng)絡(luò)SEGAN
2 實(shí)驗(yàn)
2.1 實(shí)驗(yàn)配置
2.2 實(shí)驗(yàn)結(jié)果
2.2.1 生成噪音數(shù)據(jù)樣本
2.2.2 基于SEGAN模型的語音增強(qiáng)性能比較
3 結(jié)論
本文編號(hào):3743752
本文鏈接:http://www.sikaile.net/kejilunwen/wltx/3743752.html
最近更新
教材專著