駕駛環(huán)境下低信噪比語音增強算法研究
發(fā)布時間:2019-08-26 12:54
【摘要】:隨著人工智能技術(shù)的發(fā)展,智能駕駛逐漸成為人們關(guān)注的焦點,便攜式導(dǎo)航儀、智能后視鏡等智能車載電子產(chǎn)品也逐漸走入日常生活。為了減少意外事故的發(fā)生,解放駕駛員的雙手,大部分車載電子產(chǎn)品需要通過語音命令來控制。然而,駕駛環(huán)境是充斥著多種噪聲的復(fù)雜聲學(xué)環(huán)境,現(xiàn)有的語音識別技術(shù)在該環(huán)境下難以滿足人們的要求。因此,駕駛環(huán)境下語音增強技術(shù)的研究對于未來車載電子產(chǎn)品的設(shè)計與發(fā)展有著重要意義。本文研究了駕駛環(huán)境下低信噪比語音增強算法,并重點介紹了基于神經(jīng)網(wǎng)絡(luò)的語音增強算法。論文給出了語音增強算法的基本原理、實現(xiàn)方法及測試結(jié)果,主要工作如下:1.本文針對汽車噪聲與駕駛員語音的特點,結(jié)合受限玻爾茲曼機理論,提出了一種深層神經(jīng)網(wǎng)絡(luò)訓(xùn)練算法的優(yōu)化方案,即將原有的無監(jiān)督的初始化訓(xùn)練方案改為以較高信噪比平行語料作為目標函數(shù)的有監(jiān)督訓(xùn)練方案。與原有訓(xùn)練算法相比,該方案既可以緩解訓(xùn)練集數(shù)據(jù)較少時過擬合的問題,又可以簡化網(wǎng)絡(luò)模型的結(jié)構(gòu),縮短運算時間。2.本文結(jié)合反向傳播神經(jīng)網(wǎng)絡(luò)與徑向基神經(jīng)網(wǎng)絡(luò)的特點,給出一種將兩種網(wǎng)絡(luò)相結(jié)合的訓(xùn)練算法,通過兩種網(wǎng)絡(luò)相結(jié)合,既可以彌補反向傳播網(wǎng)絡(luò)非線性映射能力較弱的不足,又可以盡量減少徑向基網(wǎng)絡(luò)隱層神經(jīng)元的數(shù)量。3.針對本文所提算法在去噪能力與魯棒性上存在的不足,本文還給出了兩方面的優(yōu)化方案。為了提高增強模型的性能,本文對訓(xùn)練集數(shù)據(jù)依據(jù)信噪比不同進行分類訓(xùn)練。在增強時,為了準確而快速地判別帶噪信號信噪比的強弱,本文采用基于能量統(tǒng)計復(fù)雜度的端點檢測算法來檢測語音起點,然后對語音起點之前的純噪聲片段進行分析,以確定帶噪語音所屬類別。為了提高算法的魯棒性,在增強時,本文對與訓(xùn)練集全局均值相差過大的輸入數(shù)據(jù)進行均值移位,以便更好地適應(yīng)增強模型。在語音重構(gòu)過程中,為了減少均值移位產(chǎn)生的音樂噪聲,本文還采用最小值控制遞歸平均噪聲估計算法來估計語音存在概率,然后依據(jù)語音存在概率進行加權(quán)相加。實驗結(jié)果表明,本文算法能夠適用于駕駛環(huán)境下的語音增強,與現(xiàn)有算法相比,在分段信噪比與語音質(zhì)量方面均有較大提高。
【圖文】:
圖2-3高斯混合模型訓(xùn)練圖逡逑Fig.邋2-3邋Trai打ing邋Stage邋of邋GMM邋enhancement邋sys巧m逡逑GMM模型的訓(xùn)練過程如圖2-3所示,首先從純凈與帶噪信號中提取梅爾頻率逡逑倒譜系數(shù),然后采用最大期望算法(Expectation邋Maximization,邋EM)分別對其訓(xùn)練。逡逑語音信號特征序列混合高斯模型的定義如式(2-30)所示:逡逑fCC邋I/0邋=邋。,邋A(C)邐(2-30)逡逑其中M是指高斯概率函數(shù)的個數(shù),,C表示語音信號的特征序列,^邋=逡逑表示高斯混合模型的參數(shù),即每個高斯概率函數(shù)的權(quán)重、均值與協(xié)方差。A(。)是逡逑指語音信號特征在第/個高斯分布下的概率,其計算公式如式口-31)所示:逡逑13逡逑
語音增強算法概述逡逑之一。該測度是上世紀90年代提出的,并取代原來的基于語音感知質(zhì)量的測量被逡逑評選為ITU-P.862建議。PESQ的計算流程如圖2-4所示,首先要對檢測語音信號逡逑和參考信號進行預(yù)處理和時間對齊。預(yù)處理的主要作用是使純凈語音信號與增強逡逑后信號增益均衡,時間對齊部分主要是為感知模型提供時間延遲,主要包括粗延逡逑遲估計和短句分割與對齊兩部分。然后通過聽覺變換將語音信號映射為感知響度,逡逑最后通過擾動計算及時域和頻域的平均等處理求出感知語音質(zhì)量評估巧esq)挪J逡逑度。PESQ的評分范圍與MOS評分類似,一般是在-0.5到4.5之間。逡逑參考信號邋邐邋,邐,邐邐逡逑叫壚S邋 ̄?邐I邋>聽覺變換逡逑*邐I邋P口Q逡逑〔被測系統(tǒng)]邐巴置邐擾動處理邐?時間平均邐?逡逑^邐/邐對齊逡逑t邋n逡逑扮測信Jh預(yù)處理H邐A聽覺變換L.邐逡逑—^—邐識別壞的逡逑尅間間隔逡逑圖2-4感知語音質(zhì)量評估測度流程圖逡逑Kg.邋2-4邋The邋flow邋chart邋of邋PESQ逡逑2.2.2主觀評價指標逡逑一個較好的語音增強算法,處理后的語音不僅要有較高的語音可懂度,而且逡逑還要保持較高的語音質(zhì)量,因為有的增強算法可能存在語音可懂度較高而音質(zhì)較逡逑差的情況。此外
【學(xué)位授予單位】:北京交通大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2017
【分類號】:TN912.35
本文編號:2529313
【圖文】:
圖2-3高斯混合模型訓(xùn)練圖逡逑Fig.邋2-3邋Trai打ing邋Stage邋of邋GMM邋enhancement邋sys巧m逡逑GMM模型的訓(xùn)練過程如圖2-3所示,首先從純凈與帶噪信號中提取梅爾頻率逡逑倒譜系數(shù),然后采用最大期望算法(Expectation邋Maximization,邋EM)分別對其訓(xùn)練。逡逑語音信號特征序列混合高斯模型的定義如式(2-30)所示:逡逑fCC邋I/0邋=邋。,邋A(C)邐(2-30)逡逑其中M是指高斯概率函數(shù)的個數(shù),,C表示語音信號的特征序列,^邋=逡逑表示高斯混合模型的參數(shù),即每個高斯概率函數(shù)的權(quán)重、均值與協(xié)方差。A(。)是逡逑指語音信號特征在第/個高斯分布下的概率,其計算公式如式口-31)所示:逡逑13逡逑
語音增強算法概述逡逑之一。該測度是上世紀90年代提出的,并取代原來的基于語音感知質(zhì)量的測量被逡逑評選為ITU-P.862建議。PESQ的計算流程如圖2-4所示,首先要對檢測語音信號逡逑和參考信號進行預(yù)處理和時間對齊。預(yù)處理的主要作用是使純凈語音信號與增強逡逑后信號增益均衡,時間對齊部分主要是為感知模型提供時間延遲,主要包括粗延逡逑遲估計和短句分割與對齊兩部分。然后通過聽覺變換將語音信號映射為感知響度,逡逑最后通過擾動計算及時域和頻域的平均等處理求出感知語音質(zhì)量評估巧esq)挪J逡逑度。PESQ的評分范圍與MOS評分類似,一般是在-0.5到4.5之間。逡逑參考信號邋邐邋,邐,邐邐逡逑叫壚S邋 ̄?邐I邋>聽覺變換逡逑*邐I邋P口Q逡逑〔被測系統(tǒng)]邐巴置邐擾動處理邐?時間平均邐?逡逑^邐/邐對齊逡逑t邋n逡逑扮測信Jh預(yù)處理H邐A聽覺變換L.邐逡逑—^—邐識別壞的逡逑尅間間隔逡逑圖2-4感知語音質(zhì)量評估測度流程圖逡逑Kg.邋2-4邋The邋flow邋chart邋of邋PESQ逡逑2.2.2主觀評價指標逡逑一個較好的語音增強算法,處理后的語音不僅要有較高的語音可懂度,而且逡逑還要保持較高的語音質(zhì)量,因為有的增強算法可能存在語音可懂度較高而音質(zhì)較逡逑差的情況。此外
【學(xué)位授予單位】:北京交通大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2017
【分類號】:TN912.35
【參考文獻】
相關(guān)期刊論文 前4條
1 陳強;張軍峰;王菲;鄭志祥;;基于OLS-RBF神經(jīng)網(wǎng)絡(luò)的進場飛行時間預(yù)測[J];航空計算技術(shù);2015年04期
2 劉峰濤;賀國光;;基于近似熵和統(tǒng)計復(fù)雜度的交通流復(fù)雜性測度[J];中國公路學(xué)報;2007年04期
3 李洪亮;丁渭平;王務(wù)林;;汽車噪聲控制技術(shù)的最新進展與發(fā)展趨勢[J];汽車技術(shù);2007年04期
4 曹明純;;增強噪聲背景中語言的數(shù)字處理方法[J];電聲技術(shù);1984年05期
相關(guān)博士學(xué)位論文 前1條
1 徐勇;基于深層神經(jīng)網(wǎng)絡(luò)的語音增強方法研究[D];中國科學(xué)技術(shù)大學(xué);2015年
相關(guān)碩士學(xué)位論文 前4條
1 毛瀟宇;高速駕駛環(huán)境中汽車噪聲的語音增強算法[D];北京交通大學(xué);2015年
2 蘇大壯;面向數(shù)字資源聚合平臺的光學(xué)字符識別技術(shù)的研究[D];電子科技大學(xué);2015年
3 王綱金;低信噪比環(huán)境下語音端點檢測方法研究[D];湖南大學(xué);2011年
4 馮炎;基于噪聲估計和先驗信噪比估計的語音增強算法研究[D];西南交通大學(xué);2010年
本文編號:2529313
本文鏈接:http://www.sikaile.net/kejilunwen/xinxigongchenglunwen/2529313.html
最近更新
教材專著