天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 信息工程論文 >

混響環(huán)境下的遠程語音增強方法研究

發(fā)布時間:2020-04-15 08:00
【摘要】:語音是人與人溝通、人機交互的重要手段之一。在室內(nèi)環(huán)境中除了噪聲,由四壁和上下表面反射引起的混響是造成語音質(zhì)量和可懂度下降的主要原因。期望信號與室內(nèi)聲學脈沖響應進行卷積,麥克風接收的信號為直達信號與混響成分的疊加;祉懺跁r頻域引起的拖尾,往往導致語音信號的包絡和精細結(jié)構(gòu)產(chǎn)生失真。同時噪聲和潛在干擾的存在,以及語音自身的非平穩(wěn)性使得室內(nèi)語音增強問題更為復雜。本文將對室內(nèi)環(huán)境下,麥克風采集的遠程語音信號增強方法展開研究?紤]固定波束形成尤其是差分波束形成在室內(nèi)時變聲學環(huán)境中的局限性,在自適應波束形成的基礎上,本文提出了基于傳遞函數(shù)廣義旁瓣抵消器(Transfer Function-Generalized Sidelobe Canceller,TF-GSC)和改進極小值控制遞歸平均(Improved Minima Controlled Re-cursive Averaging,IMCRA)的遠程語音增強框架,利用空-時聯(lián)合處理方法對混響語音進行去混響和消噪,同時保證去混響方法在噪聲存在下的穩(wěn)健性。不以聲源空間位置和聲學傳遞函數(shù)信息為先驗,本文將TF-GSC結(jié)構(gòu)替換為多通道線性預測(Multichannel Linear Prediction,MCLP)盲去混響框架,介紹了最小絕對值和方法、基于組稀疏性假設的最小絕對值收縮和選擇(Least Absolute Shrinkage and Selection Operator,LASSO)方法和基于最大化對數(shù)似然函數(shù)的歸一化延遲線性預測方法。本文將IMCRA作為以上盲去混響方法的后置濾波器,討論了非相干噪聲對GSC和MCLP語音增強框架的影響。仿真和實驗說明在混響占主導的室內(nèi)環(huán)境下,多通道線性預測框架的語音增強性能優(yōu)于GSC框架,后置濾波為兩種語音增強框架的必要補充。本文設計搭建了一套多通道遠程語音采集處理系統(tǒng),實現(xiàn)實時語音數(shù)據(jù)的采集、處理和發(fā)送,同時以實錄數(shù)據(jù)驗證基于GSC和MCLP框架的遠程語音增強方法的有效性。
【圖文】:

流程圖,語音處理,流程,語音增強


時保證算法穩(wěn)健性。Kinoshita等人[8]從提交至REVERB邋Challenge的近三十篇文獻中,,遴選逡逑出各類針對混響環(huán)境的語音增強識別算法,給出了由這些方法子集組成的混響語音處理流逡逑程,如圖1邋-1所示。其中語音增強部分(Enhancement邋Part)作為識別部分(Recognition邋Part)逡逑的必要前級模塊,包含多通道的語音增強和單通道語音增強/特征提取的子模塊。REVERB逡逑Challenge提供純凈語音集和仿真數(shù)據(jù)集作為訓練集,同時給出仿真和實錄數(shù)據(jù)集作為各類逡逑語音增強算法的驗證集。從圖1-1中可以看到,語音增強部分的輸出作為識別模塊的前級,逡逑Enhancement邋part邐Recognition邋part逡逑邐A邐邋邐A邐逡逑(邋\(邋\逡逑^邐I邋i邐I邋i邐I邋i邐I邋邐逡逑r邋Multi-channel邋lchSE/FE.^邋Robust邋feature邋^邐^邋c0mbinat,0n邋f逡逑SE邐extraction邐3邐/逡逑^^邋^,逡逑AM邋LM邐/逡逑S邋/逡逑Adapt邐I逡逑LZ邐/逡逑圖1-1邋REVERB邋Challenge去混響語音處理流程逡逑其性能的優(yōu)劣直接影響后級中的穩(wěn)健語音特征提取、譯碼模塊以及最終的識別結(jié)果。因此,逡逑2逡逑

均勻分布,室內(nèi)聲學,常見方法,建模


.1邋愿邐(2-17)逡逑由于室內(nèi)混響的復雜本質(zhì),對室內(nèi)b8學的分析和合成需要不同的模型。圖2-1給出了建模逡逑和仿真室內(nèi)聲學的常見方法,圖內(nèi)所示的建模方法可以劃分為:波動(Wave-based)模型、逡逑射線(Ray-based)模型和統(tǒng)計模型,聯(lián)合以上模型能夠?qū)θJ譜(Audio邋Spectrum)進行分逡逑析。然而對于語音信號的有限帶寬性,準確而又簡單的模型更為適用。逡逑2.3統(tǒng)計混響棋型逡逑在室內(nèi)環(huán)境中對聲學過程建模是一a極其復雜的過程,常用的方法為統(tǒng)計室內(nèi)聲學逡逑(SRA)。SRA利用房間體積。、混響時間r6n、臨界距離Dc、聲源-麥克風距離等一系列參數(shù)逡逑紿出對聲學系統(tǒng)傳遞函數(shù)的統(tǒng)計描述。為了描述單夂平面波的福度和相位分布,SRA基于逡逑的重要假設可以歸結(jié)為:在室內(nèi)任意一點產(chǎn)生的聲壓近似隨機,因此聲場均勻分布在整a逡逑12逡逑
【學位授予單位】:浙江大學
【學位級別】:碩士
【學位授予年份】:2019
【分類號】:TN912.35

【相似文獻】

相關(guān)期刊論文 前10條

1 劉鵬;;基于深度學習的語音增強方法研究[J];智能計算機與應用;2019年05期

2 石玲;;基于計算機聲卡的譜相減語音增強系統(tǒng)分析[J];信息與電腦(理論版);2010年02期

3 孫濤;;基于計算機聲卡的譜相減語音增強系統(tǒng)分析[J];南昌教育學院學報;2010年05期

4 張曉雷;;基于深度學習的語音增強簡述[J];網(wǎng)絡新媒體技術(shù);2019年02期

5 李璐君;屈丹;;一種基于組合深層模型的語音增強方法[J];信息工程大學學報;2018年04期

6 袁文浩;婁迎曦;梁春燕;夏斌;;利用生成噪聲提高語音增強方法的泛化能力[J];電子學報;2019年04期

7 陰法明;唐於烽;;基于深度置信網(wǎng)絡的語音增強算法[J];電子器件;2018年05期

8 余華;唐於烽;趙力;;基于改進深度置信網(wǎng)絡的語音增強算法[J];數(shù)據(jù)采集與處理;2018年05期

9 薛慧君;李盛;路國華;張楊;焦騰;王健琪;荊西京;;提升小波用于非接觸語音增強算法的研究[J];醫(yī)療衛(wèi)生裝備;2013年05期

10 胡海波;劉柏森;許銀;;基于小波變換的語音增強研究[J];黑龍江工程學院學報(自然科學版);2011年01期

相關(guān)會議論文 前10條

1 王世偉;胡笑滸;鄭成詩;李曉東;;一種改進的基于能量差語音增強算法[A];中國聲學學會第九屆青年學術(shù)會議論文集[C];2011年

2 江峰;李曉東;;適用于抑制非平穩(wěn)背景噪聲的語音增強算法[A];中國聲學學會2003年青年學術(shù)會議[CYCA'03]論文集[C];2003年

3 閻兆立;杜利民;;維納后濾波語音增強算法研究[A];中國聲學學會2005年青年學術(shù)會議[CYCA'05]論文集[C];2005年

4 童峰;許肖梅;洪青陽;;一種帶階數(shù)估計的語音增強算法[A];第八屆全國人機語音通訊學術(shù)會議論文集[C];2005年

5 袁榕嶸;吳鳴;楊軍;;雙麥克風語音增強快速算法[A];泛在信息社會中的聲學——中國聲學學會2010年全國會員代表大會暨學術(shù)會議論文集[C];2010年

6 國雁萌;;一種極低信噪比條件下的語音增強方法[A];第六屆全國人機語音通訊學術(shù)會議論文集[C];2001年

7 李海峰;韓紀慶;鄭鐵然;;元音、輔音粗判自適應電話語音增強方法[A];第七屆全國人機語音通訊學術(shù)會議(NCMMSC7)論文集[C];2003年

8 高登峰;楊波;郭東岳;;基于深度神經(jīng)網(wǎng)絡的地空通話語音增強方法[A];第一屆空中交通管理系統(tǒng)技術(shù)學術(shù)年會論文集[C];2018年

9 樓廈廈;鄭成詩;李曉東;;濾波器權(quán)值約束對自適應零限波束形成語音增強算法魯棒性影響分析[A];中國聲學學會2007年青年學術(shù)會議論文集(上)[C];2007年

10 任玉寶;;基于聯(lián)合字典學習的語音增強算法[A];中國聲學學會水聲學分會2019年學術(shù)會議論文集[C];2019年

相關(guān)重要報紙文章 前3條

1 ;NMS Sonata Ⅲ/Studio Sound級語音增強系統(tǒng)話音更清晰[N];中國計算機報;2003年

2 本報記者 馬楠;NMS市場目標轉(zhuǎn)向無線服務提供商[N];通信產(chǎn)業(yè)報;2001年

3 ;VoIP服務不只是便宜的通話[N];網(wǎng)絡世界;2002年

相關(guān)博士學位論文 前10條

1 江文斌;面向復雜場景的極低碼率語音編解碼和語音增強關(guān)鍵技術(shù)研究[D];上海交通大學;2018年

2 高天;復雜環(huán)境下基于深度學習的語音信號預處理方法研究[D];中國科學技術(shù)大學;2018年

3 童仁杰;基于信號稀疏特性的語音增強算法研究[D];中國科學技術(shù)大學;2018年

4 王青;基于深層神經(jīng)網(wǎng)絡的多目標學習和融合的語音增強研究[D];中國科學技術(shù)大學;2018年

5 王冬霞;麥克風陣列語音增強的若干方法研究[D];大連理工大學;2007年

6 歐世峰;變換域語音增強算法的研究[D];吉林大學;2008年

7 孫琦;基于子空間的低計算復雜度語音增強算法研究[D];吉林大學;2017年

8 夏丙寅;面向移動通信的單通道語音增強方法研究[D];北京工業(yè)大學;2014年

9 姚峰英;語音增強系統(tǒng)的研究與實現(xiàn)[D];中國科學院上海冶金研究所;2001年

10 張龍;有監(jiān)督學習條件下的單通道語音增強算法研究[D];中國科學技術(shù)大學;2017年

相關(guān)碩士學位論文 前10條

1 許瑞龍;基于自動編碼器和生成對抗網(wǎng)絡的語音增強方法研究[D];江西理工大學;2019年

2 續(xù)嬌;基于自適應波束成形的語音增強算法研究與實現(xiàn)[D];北京交通大學;2019年

3 程澤豐;混響環(huán)境下的遠程語音增強方法研究[D];浙江大學;2019年

4 黃張翼;基于深度神經(jīng)網(wǎng)絡的語音增強方法研究[D];重慶郵電大學;2018年

5 吳佳雯;基于表示學習的語音增強算法研究[D];廈門大學;2017年

6 曾帆;遠距離麥克風陣列語音增強及系統(tǒng)實現(xiàn)[D];廈門大學;2018年

7 許銘;車載環(huán)境下語音處理關(guān)鍵技術(shù)的研究[D];遼寧工業(yè)大學;2019年

8 賈翔宇;基于張量模型的語音增強算法研究[D];中國科學技術(shù)大學;2019年

9 吉慧芳;改進相位譜信息及相位重構(gòu)的語音增強算法研究[D];太原理工大學;2019年

10 王雁;基于深度神經(jīng)網(wǎng)絡的語音增強算法[D];太原理工大學;2019年



本文編號:2628325

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/xinxigongchenglunwen/2628325.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶793b6***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com