天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

語音分離與語音識別關(guān)鍵技術(shù)研究

發(fā)布時間:2022-01-16 16:34
  語音作為人類最為基礎(chǔ)的信息交流媒介,一直以來都是工業(yè)界與學(xué)術(shù)界研究的重點,本文主要針對語音分離與語音識別問題進行研究。其一,由于現(xiàn)實環(huán)境中語音環(huán)境復(fù)雜,語音的可懂度受到較大干擾。語音分離技術(shù)是解決此問題最常用的方法之一,目前的語音分離技術(shù)存在語音信號表征不充分、難以從混合語音中學(xué)習到有用信息等問題;其二,語音識別技術(shù)的目標為將語音信號識別為對應(yīng)的文本序列。然而,許多系統(tǒng)只需要檢測出其中的關(guān)鍵詞即可,這種技術(shù)稱為關(guān)鍵詞識別技術(shù)。目前,隨著深度學(xué)習的興起,基于深度學(xué)習的關(guān)鍵詞識別模型多為按幀標注方法,需要較為成熟的大規(guī)模連續(xù)語音識別系統(tǒng)對訓(xùn)練樣本進行按幀標注,該類模型先決條件較為苛刻,且不靈活。針對語音分離與關(guān)鍵詞識別目前研究存在的問題,本文的研究內(nèi)容主要包括以下兩方面的內(nèi)容:1.針對于語音分離存在的語音信號表征不充分、難以從混合語音中學(xué)習到有用信息的問題,本文提出深層轉(zhuǎn)導(dǎo)式非負矩陣分解(DTNMF)方法,在非負矩陣分解(NMF)的基礎(chǔ)上,引入了全新的深層結(jié)構(gòu),這種深層結(jié)構(gòu)可以非線性地表征語音信號,并引入了轉(zhuǎn)導(dǎo)式學(xué)習的思想,即在識別時聯(lián)合訓(xùn)練數(shù)據(jù)與測試數(shù)據(jù)生成字典,因此同時利用了混合語音信... 

【文章來源】:國防科技大學(xué)湖南省 211工程院校 985工程院校

【文章頁數(shù)】:65 頁

【學(xué)位級別】:碩士

【部分圖文】:

語音分離與語音識別關(guān)鍵技術(shù)研究


頻譜圖

生成過程,聽覺感知,個人特征,聽覺系統(tǒng)


圖 2.1 頻譜圖系統(tǒng)是一個特殊的非線性系統(tǒng),它響應(yīng)不同頻率征的提取上,人類聽覺系統(tǒng)做得非常好,它不說話人的個人特征,這些都是現(xiàn)有的語音識別系統(tǒng)中能模擬人類聽覺感知處理特點,就有可數(shù)(MelFrequencyCepstrumCoefficient,MFCC映射至基于聽覺感知的梅爾非線性頻譜中,進成過程如圖所示:

循環(huán)神經(jīng)網(wǎng)絡(luò),音分,方法,語音分離


國防科技大學(xué)研究生院專業(yè)學(xué)位碩士學(xué)位論文數(shù)據(jù)驅(qū)動的(data-driven)語音分離方法。該類方法利用一定量定的說話人或噪音環(huán)境進行語音分離,在過去的數(shù)十年中,該類的數(shù)據(jù)以及增加計算資源,取得了超越 CASA 以及語音增強方。目前較為有效的數(shù)據(jù)驅(qū)動的語音分離方法包括基于非負矩陣法[50],與基于深度神經(jīng)網(wǎng)絡(luò)的語音分離方法[51]。基于非負矩方法通過 NMF 學(xué)習多個聲源的基矩陣,以表征不同聲源的聲學(xué)基矩陣得到一個詞典,用于對混合語音進行分離,具體方法將在基于深度學(xué)習的語音分離方法,通過神經(jīng)網(wǎng)絡(luò)學(xué)習不同聲源的聲合語音的分離,如圖 2 所示,語音信號的頻域信號 作為輸入,得到聲源 1(Source 1)與聲源 2(Source 2)的近似 與 ,將兩者und-truth 語音信號 與 進行比較,根據(jù)一定的目標函數(shù)訓(xùn)練數(shù)小于某個閾值時,即可認為語音信號可以較好地被還原。

【參考文獻】:
期刊論文
[1]基于GMM-HMM和深層循環(huán)神經(jīng)網(wǎng)絡(luò)的復(fù)雜噪聲環(huán)境下的語音識別[J]. 劉旺玉,SHIRAISHI HIROSHI.  制造業(yè)自動化. 2016(05)
[2]DCT域維納濾波語音增強[J]. 寧礦鳳,王景芳.  計算機工程與應(yīng)用. 2015(08)
[3]低信噪比下基于新型變步長LMS的自適應(yīng)濾波算法[J]. 彭繼慎,劉爽,安麗.  傳感技術(shù)學(xué)報. 2013(08)
[4]基于譜減法和變步長LMS語音增強算法[J]. 徐文超,王光艷,耿艷香,白芳,費騰.  計算機工程與應(yīng)用. 2015(01)
[5]基于語音特征聚類的HMM語音識別系統(tǒng)研究[J]. 姚敏鋒,李心廣,楊佳能.  微計算機信息. 2012(10)
[6]改進的小波變換HMM語音識別算法[J]. 洪淑月,施曉鐘,徐皓.  浙江師范大學(xué)學(xué)報(自然科學(xué)版). 2011(04)
[7]基于壓縮感知重構(gòu)信號的說話人識別系統(tǒng)抗噪方法研究[J]. 葉蕾,郭海燕,楊震.  信號處理. 2010(03)
[8]窄帶噪聲下的子空間語音增強算法[J]. 陳國明,趙力,鄒采榮.  應(yīng)用科學(xué)學(xué)報. 2007(03)
[9]一種基于聽覺掩蔽模型的語音增強算法[J]. 蔡漢添,袁波濤.  通信學(xué)報. 2002(08)



本文編號:3593040

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/wltx/3593040.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶ba661***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com