天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

低信噪比環(huán)境下語(yǔ)音增強(qiáng)及相關(guān)技術(shù)研究

發(fā)布時(shí)間:2020-08-28 18:29
   語(yǔ)音是人與人之間最直接、最便捷的交流方式,噪聲的存在降低了語(yǔ)音信號(hào)的清晰度和可懂度,影響了人們的正常交流。在低信噪比環(huán)境下,噪聲的干擾給語(yǔ)音信號(hào)處理帶來(lái)很大困難。因此,低信噪比環(huán)境下,人們需要更優(yōu)良的語(yǔ)音增強(qiáng)技術(shù)對(duì)含噪語(yǔ)音進(jìn)行降噪,以便后續(xù)進(jìn)行高效的語(yǔ)音識(shí)別等處理。因此研究低信噪比環(huán)境下的語(yǔ)音增強(qiáng)技術(shù)具有重要的理論意義和實(shí)際價(jià)值。本文的研究目標(biāo)是在低信噪比環(huán)境下降低噪聲對(duì)語(yǔ)音的干擾,提升語(yǔ)音增強(qiáng)的效果。為此,本文首先從語(yǔ)音端點(diǎn)檢測(cè)出發(fā),提出了一種基于MFCC倒譜距離的自適應(yīng)語(yǔ)音端點(diǎn)檢測(cè)方法。接著基于精準(zhǔn)的端點(diǎn)檢測(cè),針對(duì)維納濾波語(yǔ)音增強(qiáng)算法由于端點(diǎn)檢測(cè)不準(zhǔn)確導(dǎo)致增強(qiáng)效果不佳的問(wèn)題,對(duì)檢測(cè)環(huán)節(jié)進(jìn)行了改進(jìn),提升了增強(qiáng)效果。為了解決更復(fù)雜噪聲下的去噪問(wèn)題,文章最后研究了基于深度神經(jīng)網(wǎng)絡(luò)的語(yǔ)音增強(qiáng)技術(shù)。本文所做的工作和創(chuàng)新如下:(1)通過(guò)對(duì)語(yǔ)音增強(qiáng)技術(shù)發(fā)展進(jìn)程的調(diào)研,我們了解了語(yǔ)音增強(qiáng)技術(shù)的發(fā)展近況及其相關(guān)的語(yǔ)音處理技術(shù)。重點(diǎn)對(duì)語(yǔ)音端點(diǎn)檢測(cè)技術(shù)做了一定的研究和調(diào)研工作,介紹了多種常用的語(yǔ)音端點(diǎn)檢測(cè)方法并將他們逐個(gè)實(shí)現(xiàn)以便用于后期的比較。另外,詳述了譜減法、維納濾波法和神經(jīng)網(wǎng)絡(luò)語(yǔ)音增強(qiáng)法的模型框架和實(shí)現(xiàn)過(guò)程。(2)針對(duì)傳統(tǒng)語(yǔ)音端點(diǎn)檢測(cè)算法在惡劣噪聲環(huán)境下難以保證檢測(cè)精度的問(wèn)題,本文提出了一種基于MFCC倒譜距離的結(jié)合多窗譜估計(jì)的自適應(yīng)端點(diǎn)檢測(cè)方法。在語(yǔ)音檢測(cè)階段,首先計(jì)算各幀與無(wú)話(huà)幀之間的MFCC倒譜距離,以此為特征,選取合適的閾值來(lái)進(jìn)行判決。該閾值與前導(dǎo)無(wú)話(huà)幀的MFCC系數(shù)和噪聲的平均MFCC系數(shù)之間的差值密切相關(guān),該算法可以在不同的噪聲環(huán)境中自適應(yīng)的調(diào)整閾值,從而提高了語(yǔ)音端點(diǎn)檢測(cè)精度。實(shí)驗(yàn)數(shù)據(jù)表明,該端點(diǎn)檢測(cè)方法和其他常用檢測(cè)算法相比,在低信噪比環(huán)境下仍具有較高的端點(diǎn)檢測(cè)率,對(duì)噪聲具有強(qiáng)的魯棒性。(3)針對(duì)傳統(tǒng)維納濾波語(yǔ)音增強(qiáng)算法由于端點(diǎn)檢測(cè)不夠精準(zhǔn)導(dǎo)致噪聲估計(jì)不精確從而最終影響語(yǔ)音增強(qiáng)質(zhì)量的問(wèn)題,本文采用基于MFCC倒譜距離的自適應(yīng)端點(diǎn)檢測(cè)方法來(lái)對(duì)維納濾波增強(qiáng)算法的噪聲段進(jìn)行準(zhǔn)確估計(jì)。實(shí)驗(yàn)表明,改進(jìn)后的算法能夠提高增強(qiáng)語(yǔ)音的質(zhì)量。(4)針對(duì)上述方法在非平穩(wěn)噪聲低信噪比下效果欠佳的問(wèn)題,我們搭建了神經(jīng)網(wǎng)絡(luò)語(yǔ)音增強(qiáng)系統(tǒng),取得了不錯(cuò)的語(yǔ)音增強(qiáng)效果。接下來(lái)利用維納濾波語(yǔ)音增強(qiáng)算法對(duì)訓(xùn)練及測(cè)試語(yǔ)音進(jìn)行預(yù)增強(qiáng)后再送入神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練和測(cè)試,即將兩種語(yǔ)音增強(qiáng)方法結(jié)合,進(jìn)一步提升了復(fù)雜噪聲環(huán)境低信噪比下的語(yǔ)音增強(qiáng)效果。
【學(xué)位單位】:南京郵電大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位年份】:2018
【中圖分類(lèi)】:TN912.3
【部分圖文】:

發(fā)生機(jī)理,語(yǔ)音,聲道,鼻腔


究生學(xué)位論文 第二章 語(yǔ)的差異導(dǎo)致的。第三個(gè)部門(mén)叫調(diào)音區(qū),就是對(duì)已經(jīng)產(chǎn)生的聲嘴唇、牙齒、鼻腔等來(lái)完成。我們能分別不同人說(shuō)話(huà)是因?yàn)樵?huà)內(nèi)容以及前鼻音、后鼻音包括輔音等都是經(jīng)由這個(gè)區(qū)域完的口腔和鼻腔即聲道發(fā)出,我們把這個(gè)聲道叫做聲學(xué)共振腔實(shí)是經(jīng)過(guò)多個(gè)器官共同協(xié)作來(lái)完成的。

聽(tīng)覺(jué)系統(tǒng)


圖 2.3 人耳的聽(tīng)覺(jué)系統(tǒng)圖人耳中,都可以用這三個(gè)要素來(lái)進(jìn)行衡量:音色、音調(diào)和響受,它是由振幅決定的。人耳對(duì)音強(qiáng)的感知范圍是 10-16~102者粗的一種感受,人耳能夠聽(tīng)到的聲音的振動(dòng)頻率是 20Hz~,是每個(gè)發(fā)聲的事物最具個(gè)性的屬性,我們可以根據(jù)音色來(lái)的研究成果,以下是一些針對(duì)人耳特性的研究結(jié)論:首先,位不敏感。人耳具有很強(qiáng)的聽(tīng)辨能力,我們時(shí)常在一個(gè)兩人某個(gè)人的聲音,這個(gè)現(xiàn)象俗稱(chēng) 雞尾酒效應(yīng)[41]。比方說(shuō),在聽(tīng)某一種聲音,他可以做到對(duì)周?chē)钠渌肼暢涠宦,但名字時(shí)會(huì)立即引起他的注意。具體來(lái)說(shuō),就是指人的耳朵可能夠無(wú)視除此之外的其他聲音但也自動(dòng)地監(jiān)視著這些外界聲種刺激,能馬上做出反應(yīng)。它與人耳的雙耳輸入效應(yīng)有關(guān),

譜圖,矩形窗,和頻,時(shí)域波形


( ) ( ) ( )ws n s n w n號(hào)處理領(lǐng)域,使用的窗函數(shù)有很多種,目前來(lái)說(shuō)主要有矩形窗、漢明窗、布萊克曼窗等,其中矩形窗、漢明窗和漢寧窗使用的最多。矩形窗窗函數(shù)的時(shí)域可以表示成下列形式:1, 0 ( 1)( )0,n Nw n 其他可以表示為:1( )2sin( )2( )sin( )2Nj Tj TRNTW e eT 時(shí)域波形圖和頻譜圖如圖 2.6 所示。

【參考文獻(xiàn)】

相關(guān)期刊論文 前10條

1 沈曉園;聶紅亮;趙碩;;淺談電氣自動(dòng)化控制中的人工智能技術(shù)[J];化工管理;2015年30期

2 喬寬;楊中豪;;基于深度神經(jīng)網(wǎng)絡(luò)的語(yǔ)音增強(qiáng)研究[J];廣東通信技術(shù);2015年06期

3 張守斌;魏峻山;胡世祥;高鋒亮;秦承華;王洪燕;劉硯華;;中國(guó)環(huán)境噪聲污染防治現(xiàn)狀及建議[J];中國(guó)環(huán)境監(jiān)測(cè);2015年03期

4 孫志軍;薛磊;許陽(yáng)明;王正;;深度學(xué)習(xí)研究綜述[J];計(jì)算機(jī)應(yīng)用研究;2012年08期

5 孫林慧;楊震;;基于數(shù)據(jù)驅(qū)動(dòng)字典和稀疏表示的語(yǔ)音增強(qiáng)[J];信號(hào)處理;2011年12期

6 曹梅雙;曾慶寧;陳芙蓉;;一種基于廣義奇異值分解的語(yǔ)音增強(qiáng)算法[J];微電子學(xué)與計(jì)算機(jī);2010年03期

7 李如瑋;鮑長(zhǎng)春;竇慧晶;;基于雙正交小波包分解的自適應(yīng)閾值語(yǔ)音增強(qiáng)[J];儀器儀表學(xué)報(bào);2008年10期

8 何淵淘;鄧偉;;多層感知器三種學(xué)習(xí)算法的比較[J];蘇州大學(xué)學(xué)報(bào)(工科版);2008年01期

9 唐永鋒;霍春寶;;噪聲環(huán)境下語(yǔ)音信號(hào)端點(diǎn)檢測(cè)算法的研究與改進(jìn)[J];電腦知識(shí)與技術(shù)(學(xué)術(shù)交流);2007年11期

10 武光利;戴玉剛;馬寧;;基于短時(shí)平均幅度和短時(shí)平均過(guò)零率的藏語(yǔ)語(yǔ)音端點(diǎn)檢測(cè)研究[J];福建電腦;2007年03期



本文編號(hào):2807979

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/wltx/2807979.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶(hù)a49a0***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com