基于時間卷積網(wǎng)絡(luò)的深度聚類說話人語音分離
發(fā)布時間:2021-05-20 01:43
"雞尾酒會問題"在語音分離任務(wù)上一直是一個難題,主要因為這個問題屬于一個說話人無關(guān)的語音分離問題,對于說話人事先不知道其先驗信息。通過參考Jonathan等提出的深度聚類方法,在其基礎(chǔ)上進行改進,提出基于時間卷及網(wǎng)絡(luò)的深度聚類模型,以理想二值掩蔽作為分離目標(biāo)并在公開中文語音數(shù)據(jù)集下進行實驗。實驗結(jié)果表明,相比傳統(tǒng)深度聚類模型,所提模型在訓(xùn)練速度、分離后的語音質(zhì)量和語音客觀可懂度方面都得到了提升。
【文章來源】:計算機工程與設(shè)計. 2020,41(09)北大核心
【文章頁數(shù)】:6 頁
【文章目錄】:
0 引 言
1 相關(guān)研究現(xiàn)狀
2 特征提取、分離模型與分離目標(biāo)
2.1 特征提取
2.2 基于時間卷積網(wǎng)絡(luò)的深度聚類模型
2.3 分離目標(biāo)
3 實驗與結(jié)果分析
3.1 數(shù)據(jù)來源
3.2 數(shù)據(jù)預(yù)處理
3.3 網(wǎng)絡(luò)參數(shù)
3.4 評價標(biāo)準(zhǔn)
3.5 結(jié)果與分析
4 結(jié)束語
本文編號:3196833
【文章來源】:計算機工程與設(shè)計. 2020,41(09)北大核心
【文章頁數(shù)】:6 頁
【文章目錄】:
0 引 言
1 相關(guān)研究現(xiàn)狀
2 特征提取、分離模型與分離目標(biāo)
2.1 特征提取
2.2 基于時間卷積網(wǎng)絡(luò)的深度聚類模型
2.3 分離目標(biāo)
3 實驗與結(jié)果分析
3.1 數(shù)據(jù)來源
3.2 數(shù)據(jù)預(yù)處理
3.3 網(wǎng)絡(luò)參數(shù)
3.4 評價標(biāo)準(zhǔn)
3.5 結(jié)果與分析
4 結(jié)束語
本文編號:3196833
本文鏈接:http://www.sikaile.net/kejilunwen/xinxigongchenglunwen/3196833.html
最近更新
教材專著