語(yǔ)音增強(qiáng)改進(jìn)算法研究及其DSP的實(shí)現(xiàn)
第一章 緒論
1.1 語(yǔ)音增強(qiáng)研究的背景和意義
隨著現(xiàn)代科學(xué)技術(shù)的迅速發(fā)展,語(yǔ)音通信是當(dāng)前信息時(shí)代重要的信息交互手段。在實(shí)際應(yīng)用中,語(yǔ)音信號(hào)往往會(huì)受到其他背景噪聲的干擾,對(duì)語(yǔ)音通信的正常進(jìn)行造成較大的影響。因此,研究如何在有各種背景噪音干擾的條件下,仍能有效地分離出純凈的語(yǔ)音信息,消除背景噪聲的干擾,越來(lái)越得到了人們的重視。如果語(yǔ)音信號(hào)被不同的噪聲影響和淹沒(méi)后,通過(guò)抑制和降低噪聲影響,以提取有用信號(hào)的技術(shù)被稱(chēng)為語(yǔ)音增強(qiáng),該技術(shù)的主要目的是提高語(yǔ)音質(zhì)量、降低噪聲[2],從而提高信號(hào)的輸出信噪比(Signal ro Noise Ratio,SNR)。實(shí)際應(yīng)用環(huán)境中的噪聲類(lèi)型有很多種,其特性也是多種多樣,純凈語(yǔ)音在噪聲的影響下受到極大破壞。雖然目前語(yǔ)音增強(qiáng)的方法不斷更新,也均取得了一定程度的突破。但是在實(shí)際應(yīng)用中,應(yīng)依據(jù)噪聲變化的多樣性,并參照當(dāng)時(shí)具體的實(shí)際環(huán)境,通過(guò)選取恰當(dāng)?shù)恼Z(yǔ)音增強(qiáng)方法來(lái)保證有較好的語(yǔ)音增強(qiáng)效果。隨著 DSP 技術(shù)和語(yǔ)音增強(qiáng)算法的不斷發(fā)展,目前語(yǔ)音增強(qiáng)技術(shù)被廣泛應(yīng)用在于汽車(chē)電話(huà)、無(wú)線(xiàn)電話(huà)電視會(huì)議、人機(jī)對(duì)話(huà)語(yǔ)音識(shí)別、電子耳蝸、智能家電、戰(zhàn)場(chǎng)通信和軍事竊聽(tīng)等領(lǐng)域。日常生活中,人們之間遠(yuǎn)距離的通信方式基本上都采用電話(huà)方式,例如安裝在汽車(chē)上電話(huà),街道、機(jī)場(chǎng)的公用電話(huà)以及移動(dòng)電話(huà),但是我們?cè)谙硎芸萍歼M(jìn)步帶來(lái)的便利時(shí),也常常會(huì)受到各種背景噪聲的影響,如無(wú)線(xiàn)通信信道的干擾,對(duì)通話(huà)質(zhì)量會(huì)產(chǎn)生嚴(yán)重影響。例如,在雷雨等惡劣天氣接聽(tīng)移動(dòng)電話(huà),會(huì)聽(tīng)到陣陣噪聲。因此,在接收端通過(guò)估計(jì)噪聲干擾模型,濾出噪聲,實(shí)現(xiàn)語(yǔ)音增強(qiáng)并保證通話(huà)質(zhì)量。
........
1.2 語(yǔ)音增強(qiáng)技術(shù)的發(fā)展
語(yǔ)音增強(qiáng)早在 20 世紀(jì) 60 年代就受到了人們的重視,在隨后的四十多年里,國(guó)外學(xué)者對(duì)這一課題進(jìn)行了持續(xù)研究,尤其是 Boll 提出的譜相減法,一直被廣泛應(yīng)用,許多學(xué)者也在此基礎(chǔ)上做出了大量改進(jìn)。國(guó)內(nèi)近年來(lái)也有大量學(xué)者對(duì)語(yǔ)音增強(qiáng)算法進(jìn)行了研究,取得了較好的成果。清華大學(xué)崔瑋瑋將 FDM陣列技術(shù)與單通道 增強(qiáng)方法相結(jié)合,提出了雙通道的語(yǔ)音增強(qiáng)算法,與雙通道相比,信噪比提高,計(jì)算復(fù)雜度被降低[3];大連理工大學(xué)金乃高將系統(tǒng)分析中的子帶技術(shù)和粒子濾波技術(shù)相結(jié)合,提出了一種基于子帶粒子濾波的語(yǔ)音增強(qiáng)方法,提高系統(tǒng)性能的同時(shí)也降低了計(jì)算復(fù)雜度[4]。中國(guó)科技術(shù)大學(xué)的章旭景為提高卡爾曼濾波算法的性能,提出的改進(jìn)語(yǔ)音增強(qiáng)算法用子帶卡爾曼濾波代替卡爾曼濾波,降低了改進(jìn)之前語(yǔ)音增強(qiáng)算法的計(jì)算復(fù)雜度[5];解放軍理工大學(xué)的黃建軍提出時(shí)頻字典學(xué)習(xí)的單通道語(yǔ)音增強(qiáng)算法,解決了非平穩(wěn)環(huán)境下系統(tǒng)性能下降的問(wèn)題[6];太原理工大學(xué)的任永梅提出了基于新閾值函數(shù)的小波語(yǔ)音增強(qiáng)算法 ,較大程度上解決了語(yǔ)音嚴(yán)重失真的問(wèn)題[7];重慶大學(xué)的王瑜林在原有語(yǔ)音增強(qiáng)方法的基礎(chǔ)上,提出 基于自適應(yīng)濾波技術(shù)的單通道語(yǔ)音增強(qiáng)算法 ,一定程度上解決了傳統(tǒng)語(yǔ)音增強(qiáng)算法的兩個(gè)問(wèn)題:適應(yīng)性差和收斂速度慢[8];中國(guó)科學(xué)院聲學(xué)研究所的王玥依據(jù)聽(tīng)覺(jué)掩蔽效應(yīng),提出了聽(tīng)覺(jué)頻域掩蔽效應(yīng)的?自適階貝葉斯感知估計(jì)語(yǔ)音增強(qiáng)算法,平衡了語(yǔ)音失真和噪聲抑制[9];西北工業(yè)大學(xué)的張君昌提出了一種自適應(yīng)時(shí)移與閾值的DCT 音增強(qiáng)方法,其優(yōu)點(diǎn)是提高了系統(tǒng)的魯棒性和輸出信噪比[10];太原理工大學(xué)的郭欣提出了利用子空間改進(jìn)的K ?SVD 語(yǔ)音增強(qiáng)算法,可有效去除白噪聲[11]。數(shù)字信號(hào)處理技術(shù)(Digital Signal Processing,DSP)自 20 世紀(jì) 60 年代以來(lái)[12],隨
著計(jì)算機(jī)技術(shù)的推進(jìn)也快速發(fā)展。該技術(shù)之所以應(yīng)用廣泛,因?yàn)樗壬婕皵?shù)字信號(hào)處理的理論和方法的研究,又涉及各種關(guān)于數(shù)字信號(hào)的處理應(yīng)用。隨著 DSP 技術(shù)的發(fā)展,語(yǔ)言增強(qiáng)的實(shí)時(shí)實(shí)現(xiàn)成為可能,可廣泛用于無(wú)線(xiàn)電話(huà)會(huì)議、手機(jī)、娛樂(lè)系統(tǒng)、多媒體應(yīng)用等領(lǐng)域。在實(shí)際應(yīng)用中,對(duì)語(yǔ)音信號(hào)處理之前會(huì)對(duì)其進(jìn)行預(yù)處理,因此語(yǔ)音增強(qiáng)技術(shù)可廣泛應(yīng)用于各種語(yǔ)音信號(hào)處理領(lǐng)域中。本文對(duì)語(yǔ)音增強(qiáng)算法進(jìn)行了改進(jìn),在 MATLAB環(huán)境下對(duì)其進(jìn)行了仿真驗(yàn)證和在 DSP 環(huán)境下進(jìn)行了實(shí)時(shí)實(shí)現(xiàn),有較大的實(shí)用性。
..........
第二章 語(yǔ)音增強(qiáng)算法理論基礎(chǔ)
在語(yǔ)音信號(hào)分析的基礎(chǔ)上,我們才能多種語(yǔ)音進(jìn)行處理,通過(guò)分析語(yǔ)音信號(hào)可得出其本質(zhì)的參數(shù),通過(guò)它們的本質(zhì)參數(shù)可將語(yǔ)音信號(hào)增強(qiáng)和傳遞。因此語(yǔ)音信號(hào)分析在語(yǔ)音信號(hào)處理和增強(qiáng)中,具有極其重要的作用。
2.1 語(yǔ)音產(chǎn)生模型及其特性分析
語(yǔ)音是在大腦的支配下,通過(guò)肺、喉和聲道的共同協(xié)調(diào)合作產(chǎn)生的。通過(guò)對(duì)發(fā)聲器官和發(fā)音過(guò)程的研究,可進(jìn)一步建立一個(gè)時(shí)域離散的語(yǔ)音信號(hào)產(chǎn)生模型[24-25]。語(yǔ)音產(chǎn)生的模型如圖 2.1 所示,它分為激勵(lì)源、聲道模型和輻射模型三個(gè)模塊。人耳的掩蔽效應(yīng),就是比較弱小的信號(hào)會(huì)被一些強(qiáng)大的信號(hào)衰減掉或者直接屏蔽,導(dǎo)致發(fā)現(xiàn)不到這些弱信號(hào)[29-30]。掩蔽效應(yīng)的程度由聲音強(qiáng)度與頻率二者的關(guān)系決定,人耳對(duì)頻差大的分量的掩蔽遠(yuǎn)高于對(duì)頻率臨近分量的掩蔽。如果聲音 B 的出現(xiàn)可以提高聲音 A 能夠感知的閾值,那么我們就把 B 叫做掩蔽聲音,A 叫做被掩蔽聲音(Masked Tone),掩蔽音剛好能聽(tīng)見(jiàn)時(shí)掩蔽音的強(qiáng)度成為掩蔽閾值。利用掩蔽效應(yīng)改善輸出語(yǔ)音質(zhì)量,在語(yǔ)音編碼中己經(jīng)取得了很大的成效。同時(shí)性掩蔽是聽(tīng)覺(jué)系統(tǒng)的重要特性之一,這是指掩蔽音和被掩蔽音會(huì)出現(xiàn)在同一時(shí)刻。如圖 2.4 為掩蔽曲線(xiàn)。
........
2.2 語(yǔ)音和噪音特性
語(yǔ)音信號(hào)的特征如下:(1)語(yǔ)音信號(hào)具有短時(shí)平穩(wěn)性;(2)語(yǔ)音可以分為濁音和清音;(3)語(yǔ)音信號(hào)的描述可用統(tǒng)計(jì)分析特性來(lái)表示[26-27]。噪聲是指在實(shí)際環(huán)境中人們不需要的聲音,這種聲音對(duì)人們正常休息、學(xué)習(xí)和工作產(chǎn)生了干擾,嚴(yán)重影響了人們的正常生活。此外,雜亂的振幅和頻率,斷續(xù)或統(tǒng)計(jì)上無(wú)規(guī)律的聲振動(dòng)也是噪聲。噪聲有 加性和非加性之分 。一般在理論中,加性噪聲是最常被研究所用的。要想利用非加性噪聲,就必須使其轉(zhuǎn)換為加性噪聲[28]。轉(zhuǎn)換的方式通常采用同態(tài)變換,此類(lèi)方法就可實(shí)現(xiàn)非加性噪聲轉(zhuǎn)換成為加性噪聲。帶噪語(yǔ)音模型如圖 2.2 所示,其表達(dá)式如式(2.4)所示。
........
第三章 語(yǔ)音增強(qiáng)改進(jìn)算法.....12
3.1 改進(jìn)型語(yǔ)音活性檢測(cè)技術(shù).............12
3.2 改進(jìn)型功率譜減法....... 17
3.2.1 功率譜減法........ 17
3.2.2 改進(jìn)型功率譜減法.....20
3.3 本章小結(jié)...... 22
第四章 語(yǔ)音增強(qiáng)系統(tǒng)設(shè)計(jì)與 DSP 實(shí)現(xiàn)......... 23
4.1 語(yǔ)音增強(qiáng)系統(tǒng)結(jié)構(gòu)設(shè)計(jì)........23
4.2 開(kāi)發(fā)環(huán)境概述.......23
4.3 DSP 系統(tǒng)初始化程序設(shè)計(jì)............ 25
4.4 語(yǔ)音增強(qiáng)算法在 DSP 中的實(shí)現(xiàn)............28
4.5 本章小結(jié)...... 31
第五章 語(yǔ)音增強(qiáng)技術(shù)改進(jìn)算法仿真及實(shí)現(xiàn)............32
5.1 語(yǔ)音增強(qiáng)技術(shù)改進(jìn)算法 MATLAB 仿真及結(jié)果分析.............32
5.2 語(yǔ)音增強(qiáng)技術(shù)改進(jìn)算法的 DSP 實(shí)現(xiàn).............37
5.3 本章小結(jié).......... 40
第五章 語(yǔ)音增強(qiáng)技術(shù)改進(jìn)算法仿真及實(shí)現(xiàn)
本章內(nèi)容主要介紹了語(yǔ)音增強(qiáng)技術(shù)的改進(jìn)算法在 MATLAB 環(huán)境下的仿真以及在DSP 上的實(shí)現(xiàn),并對(duì)兩種實(shí)驗(yàn)結(jié)果進(jìn)行了具體分析。
5.1 語(yǔ)音增強(qiáng)技術(shù)改進(jìn)算法 MATLAB 仿真及結(jié)果分析
圖 5.1 可看出,通過(guò)基于短時(shí)能量及過(guò)零率雙門(mén)限的語(yǔ)音活性檢測(cè)技術(shù)可以精確檢測(cè)出語(yǔ)音端點(diǎn)。但是由于在采集語(yǔ)音信號(hào)樣本時(shí),清音并沒(méi)有發(fā)出,只有濁音組成,基于濁音明顯的周期性,所以對(duì)語(yǔ)音的端點(diǎn)可以準(zhǔn)確判斷。和理論研究不同,在實(shí)際環(huán)境運(yùn)算時(shí),為避免因?yàn)槠渌既灰蛩禺a(chǎn)生誤差,所以閾值的確定要準(zhǔn)確判定。所以對(duì)閾值的設(shè)置應(yīng)至少大于噪聲能量,而通常情況下,噪聲能量一般在 50 以上。利用 MATLAB 仿真可以得到增強(qiáng)后的語(yǔ)音波形圖、信噪比等。然后通過(guò)主觀的平均意見(jiàn)得分法進(jìn)行測(cè)試。算法測(cè)試的流程圖如圖 5.2 所示。由于是在 MATLAB 仿真環(huán)境下進(jìn)行實(shí)驗(yàn),所以語(yǔ)音樣本是通過(guò)計(jì)算機(jī)自帶的錄音機(jī)錄制的。字?jǐn)?shù)長(zhǎng)短對(duì)實(shí)驗(yàn)結(jié)果有很大的影響,所以采集樣本時(shí)只選擇了錄制 10 個(gè)字:“長(zhǎng)安大學(xué)信息工程學(xué)院”,噪聲材料則選擇在長(zhǎng)安大學(xué)南二環(huán)路上采集的汽車(chē)噪聲。由第二章語(yǔ)音增強(qiáng)算法基礎(chǔ)理論簡(jiǎn)介可知,在對(duì)語(yǔ)音信號(hào)處理之前,必須對(duì)其進(jìn)行預(yù)處理和加窗處理。所以在本次實(shí)驗(yàn)前采集到的語(yǔ)音和噪聲樣本首先要通過(guò) 8k Hz 的采樣,然后接著是 16bit 的量化過(guò)程,語(yǔ)音信號(hào)轉(zhuǎn)變?yōu)榭商幚淼臄?shù)字信號(hào)。實(shí)驗(yàn)過(guò)程中為了確保驗(yàn)證算法的準(zhǔn)確性,所以對(duì)語(yǔ)音信號(hào)的語(yǔ)音增強(qiáng)處理需要在不同信噪比的環(huán)境下處理。含噪語(yǔ)音應(yīng)當(dāng)為 256 長(zhǎng)度的語(yǔ)音幀,以確保實(shí)驗(yàn)結(jié)果的精確度。如若不是,則要經(jīng)過(guò)加窗處理。
.........
總結(jié)
本文對(duì)基本功率譜的語(yǔ)音增強(qiáng)算法進(jìn)行了研究,并對(duì)基于語(yǔ)音活性檢測(cè)技術(shù)和功率譜減法的算法進(jìn)行了一定的改進(jìn),將兩種方法相結(jié)合。在語(yǔ)音增強(qiáng)處理之前,先采用語(yǔ)音活性檢測(cè)技術(shù)對(duì)其處理,接著用改進(jìn)型功率譜減法對(duì)語(yǔ)音信號(hào)進(jìn)行語(yǔ)音增強(qiáng)處理。關(guān)于硬件系統(tǒng)的選擇,,采用了基于 TMS320C6713 的 DSP 硬件處理系統(tǒng),F(xiàn)對(duì)本文主要完成的工作總結(jié)如下:(1)參考國(guó)內(nèi)外文獻(xiàn),詳細(xì)分析語(yǔ)音增強(qiáng)技術(shù)的應(yīng)用背景和發(fā)展史,并且對(duì)語(yǔ)音增強(qiáng)算法進(jìn)行綜述。(2)了解語(yǔ)音增強(qiáng)算法基礎(chǔ)理論,同時(shí)針對(duì)語(yǔ)音增強(qiáng)的處理效果,引出了兩類(lèi)評(píng)價(jià)方法:主觀評(píng)價(jià)和客觀評(píng)價(jià),為語(yǔ)音增強(qiáng)算法的研究、改進(jìn)和評(píng)測(cè)提供了理論基礎(chǔ)和依據(jù)。(3)本文對(duì)功率譜減法算法的各項(xiàng)特性指標(biāo)進(jìn)行了詳細(xì)的論證,并在此基礎(chǔ)上提出了改進(jìn)的功率譜減法,同時(shí)文章還分析了影響算法性能的幾個(gè)關(guān)鍵因素,完善改進(jìn)型功率譜減法。并且提出了基于短時(shí)過(guò)零率和短時(shí)能量的雙門(mén)限語(yǔ)音活性檢測(cè)技術(shù),提高了對(duì)語(yǔ)音起始點(diǎn)判斷的準(zhǔn)確性。(4)在 CCS 集成開(kāi)發(fā)環(huán)境下,實(shí)現(xiàn)了改進(jìn)型功率譜減法和語(yǔ)音活性檢測(cè)技術(shù)算法,并對(duì)兩種改進(jìn)技術(shù)在 MATLAB 環(huán)境下進(jìn)行仿真,對(duì)兩種仿真結(jié)果進(jìn)行了對(duì)比分析。利用兩種評(píng)價(jià)方法,更加直觀的證明改進(jìn)型算法提高了語(yǔ)音質(zhì)量和系統(tǒng)性能。
.........
參考文獻(xiàn)(略)
本文編號(hào):582930
本文鏈接:http://www.sikaile.net/wenshubaike/kjzx/582930.html