基于雙耳空間信息的語(yǔ)音分離研究
本文關(guān)鍵詞:基于雙耳空間信息的語(yǔ)音分離研究
更多相關(guān)文章: 雙耳聲源定位 盲源分離 語(yǔ)音分離 二進(jìn)制掩碼 壓縮感知
【摘要】:語(yǔ)音分離技術(shù)尤其是基于人耳聽(tīng)覺(jué)的語(yǔ)音分離技術(shù),在語(yǔ)音增強(qiáng)、語(yǔ)音識(shí)別和助聽(tīng)器等語(yǔ)音信號(hào)處理領(lǐng)域具有重要的地位。本文以雙耳空間信息為基礎(chǔ),結(jié)合語(yǔ)音信號(hào)的稀疏性,提出了兩種基于雙耳定位的語(yǔ)音分離方法:基于時(shí)頻掩蔽的語(yǔ)音分離和基于壓縮感知的語(yǔ)音分離。對(duì)于基于空間信息的多聲源混合語(yǔ)音分離,論文主要做了以下幾方面的工作:(1)分析了雙耳定位的語(yǔ)音分離的研究思路。空間聽(tīng)覺(jué)是人耳聽(tīng)覺(jué)的一個(gè)重要特性,多聲源環(huán)境下,人耳聽(tīng)覺(jué)系統(tǒng)首先整合聲源的空間信息,經(jīng)由大腦的中樞神經(jīng),進(jìn)行定位及分離,本文根據(jù)該特性,提出了先通過(guò)雙耳定位算法對(duì)多聲源進(jìn)行定位,再根據(jù)定位結(jié)果進(jìn)行語(yǔ)音分離的思路。(2)研究了雙耳多聲源定位算法。通過(guò)對(duì)耳間時(shí)間差和耳間強(qiáng)度差兩個(gè)聲源定位線索進(jìn)行模型訓(xùn)練,建立方位映射模型,將多聲源混合語(yǔ)音進(jìn)行參數(shù)提取,通過(guò)耳間時(shí)間差與耳間強(qiáng)度差的聯(lián)合判定,獲取多聲源定位結(jié)果,包括聲源個(gè)數(shù)及其對(duì)應(yīng)的水平面上的角度。實(shí)驗(yàn)結(jié)果表明,該定位算法對(duì)單聲源至多聲源定位有較高的定位準(zhǔn)確度。(3)提出了基于雙耳定位結(jié)果的時(shí)頻掩蔽語(yǔ)音分離算法。在多聲源環(huán)境下,在頻域的同一頻點(diǎn),能量最大的聲源將掩蔽其它能量較小的聲源,最終只有一個(gè)信號(hào)占主導(dǎo),本文依據(jù)語(yǔ)音信號(hào)的頻域稀疏性,根據(jù)聲源定位的結(jié)果,將所有時(shí)頻點(diǎn)都劃分為離該時(shí)頻點(diǎn)距離最近的聲源,將每個(gè)聲源所劃分到的時(shí)頻點(diǎn)進(jìn)行時(shí)域轉(zhuǎn)換,獲得該聲源的分離信號(hào);陔p耳定位的時(shí)頻掩蔽語(yǔ)音分離其實(shí)驗(yàn)結(jié)果要明顯優(yōu)于同類(lèi)算法。(4)提出了基于雙耳定位結(jié)果的壓縮感知語(yǔ)音分離算法。本文分析了基于雙耳的多聲源混合模型,其形式與基本的壓縮感知模型是相一致的,因此,本文利用雙耳定位結(jié)果、聲源的字典信息和混合語(yǔ)音構(gòu)建出壓縮感知模型,采用正交匹配追蹤算法對(duì)多聲源混合語(yǔ)音進(jìn)行重構(gòu),實(shí)驗(yàn)結(jié)果表明,語(yǔ)音分離指標(biāo)SIR、SNR與時(shí)頻掩蔽方法相比獲得有效提高。
【學(xué)位授予單位】:東南大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類(lèi)號(hào)】:TN912.3
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 施劍;杜利民;;基于麥克陣列的實(shí)時(shí)盲語(yǔ)音分離系統(tǒng)[J];微計(jì)算機(jī)應(yīng)用;2008年05期
2 張磊;劉繼芳;項(xiàng)學(xué)智;;基于計(jì)算聽(tīng)覺(jué)場(chǎng)景分析的混合語(yǔ)音分離[J];計(jì)算機(jī)工程;2010年14期
3 楊海濱;張軍;;基于模型的單通道語(yǔ)音分離綜述[J];計(jì)算機(jī)應(yīng)用研究;2010年11期
4 虞曉,胡光銳;基于高斯混合密度函數(shù)估計(jì)的語(yǔ)音分離[J];上海交通大學(xué)學(xué)報(bào);2000年01期
5 虞曉,胡光銳;基于高斯混合密度函數(shù)估計(jì)的語(yǔ)音分離[J];上海交通大學(xué)學(xué)報(bào);2000年02期
6 張雪峰,劉建強(qiáng),馮大政;一種快速的頻域盲語(yǔ)音分離系統(tǒng)[J];信號(hào)處理;2005年05期
7 陳鍇;盧晶;徐柏齡;;基于話者狀態(tài)檢測(cè)的自適應(yīng)語(yǔ)音分離方法的研究[J];聲學(xué)學(xué)報(bào);2006年03期
8 董優(yōu)麗;謝勤嵐;;不確定信號(hào)源個(gè)數(shù)的語(yǔ)音分離[J];現(xiàn)代電子技術(shù);2008年03期
9 徐方鑫;;瑞米茲交替算法在語(yǔ)音分離上的應(yīng)用[J];電腦知識(shí)與技術(shù);2012年03期
10 劉俊良;于鳳芹;;基于分離度變步長(zhǎng)的自然梯度算法的語(yǔ)音分離[J];計(jì)算機(jī)工程與應(yīng)用;2013年21期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前5條
1 史曉非;王憲峰;黃耀P;劉人杰;;一個(gè)推廣參數(shù)矢量算法在語(yǔ)音分離中的應(yīng)用[A];中國(guó)航海學(xué)會(huì)通信導(dǎo)航專業(yè)委員會(huì)2004學(xué)術(shù)年會(huì)論文集[C];2004年
2 劉學(xué)觀;陳雪勤;趙鶴鳴;;基于改進(jìn)遺傳算法的混疊語(yǔ)音分離研究[A];第十屆全國(guó)信號(hào)處理學(xué)術(shù)年會(huì)(CCSP-2001)論文集[C];2001年
3 林靜然;彭啟琮;邵懷宗;;基于麥克風(fēng)陣列的雙波束近場(chǎng)定位及語(yǔ)音分離[A];第二屆全國(guó)信息獲取與處理學(xué)術(shù)會(huì)議論文集[C];2004年
4 茅泉泉;趙力;;基于MIMO的盲信道語(yǔ)音分離技術(shù)[A];2004年全國(guó)物理聲學(xué)會(huì)議論文集[C];2004年
5 李量;杜憶;吳璽宏;Claude Alain;;人類(lèi)聽(tīng)皮層在語(yǔ)音分離中對(duì)頻率線索和空間線索的線性整合[A];增強(qiáng)心理學(xué)服務(wù)社會(huì)的意識(shí)和功能——中國(guó)心理學(xué)會(huì)成立90周年紀(jì)念大會(huì)暨第十四屆全國(guó)心理學(xué)學(xué)術(shù)會(huì)議論文摘要集[C];2011年
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前2條
1 趙立恒;基于計(jì)算聽(tīng)覺(jué)場(chǎng)景分析的單聲道語(yǔ)音分離研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2012年
2 王雨;基于計(jì)算聽(tīng)覺(jué)場(chǎng)景分析的單通道語(yǔ)音分離研究[D];華東理工大學(xué);2013年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 趙訓(xùn)川;基于計(jì)算聽(tīng)覺(jué)場(chǎng)景分析和麥克風(fēng)陣列的語(yǔ)音分離的研究[D];燕山大學(xué);2015年
2 何求知;單通道語(yǔ)音分離關(guān)鍵技術(shù)研究[D];電子科技大學(xué);2015年
3 曹猛;基于計(jì)算聽(tīng)覺(jué)場(chǎng)景分析和深度神經(jīng)網(wǎng)絡(luò)的混響語(yǔ)音分離[D];太原理工大學(xué);2016年
4 李梟雄;基于雙耳空間信息的語(yǔ)音分離研究[D];東南大學(xué);2015年
5 張暉;層疊與深度神經(jīng)網(wǎng)絡(luò)研究及其在語(yǔ)音分離中的應(yīng)用[D];內(nèi)蒙古大學(xué);2014年
6 童開(kāi)國(guó);多聲源環(huán)境下基于聽(tīng)覺(jué)中樞系統(tǒng)的語(yǔ)音分離研究[D];重慶郵電大學(xué);2012年
7 陳雪勤;基于計(jì)算聲場(chǎng)景分析的混疊語(yǔ)音分離研究[D];蘇州大學(xué);2002年
8 丁文;非負(fù)矩陣的分解及其在單聲道語(yǔ)音分離中的應(yīng)用[D];南昌大學(xué);2014年
9 汪健;基于空域?yàn)V波的語(yǔ)音分離研究[D];西南交通大學(xué);2011年
10 劉仙偉;卷積語(yǔ)音盲分離的SOPC實(shí)現(xiàn)[D];大連理工大學(xué);2011年
,本文編號(hào):1235668
本文鏈接:http://www.sikaile.net/kejilunwen/wltx/1235668.html