基于SI-SDR優(yōu)化的生成對抗網(wǎng)絡語音增強方法
發(fā)布時間:2025-02-06 19:34
為了解決現(xiàn)有的生成對抗網(wǎng)絡(GAN)語音增強方法模型訓練不穩(wěn)定、生成語音質(zhì)量不高的問題,提出一種尺度不變信號失真比(SI-SDR)優(yōu)化的相對平均生成對抗網(wǎng)絡(Ra GAN)語音增強方法.首先,構(gòu)建一個基于生成對抗網(wǎng)絡的端到端語音增強模型;然后,在模型中加入相對平均判別器,將真實數(shù)據(jù)和生成數(shù)據(jù)得分的差值作為模型訓練的參考,顯著增強了模型訓練的穩(wěn)定性;最后,采用SI-SDR直接度量生成語音的質(zhì)量得分,并改進生成器訓練的損失函數(shù),將提高生成語音質(zhì)量作為模型優(yōu)化的目標.實驗結(jié)果表明:相比基線方法,該方法可以有效提高未知噪聲和低信噪比條件下的語音增強性能,增強后的語音具有更好的聽覺質(zhì)量和可懂性.
【文章頁數(shù)】:7 頁
本文編號:4030804
【文章頁數(shù)】:7 頁
本文編號:4030804
本文鏈接:http://www.sikaile.net/kejilunwen/xinxigongchenglunwen/4030804.html
最近更新
教材專著