低信噪比條件下的語音端點檢測算法研究
發(fā)布時間:2021-12-11 21:52
語音端點檢測作為各種語音信號處理系統(tǒng)的前端操作,在語音信號處理領(lǐng)域中具有重要的意義。低信噪比條件下的語音端點檢測是語音處理領(lǐng)域的一個技術(shù)難題,阻礙了語音處理技術(shù)向嘈雜環(huán)境、短波通信等應(yīng)用領(lǐng)域的拓展。為探尋一種理想的語音端點檢測算法,既能夠保證在低信噪比的環(huán)境下?lián)碛休^好的正確率,又能夠滿足較少的先驗知識與運算量的要求。本文對低信噪比條件下的語音端點算法進行了研究,并提出相應(yīng)解決思路。本文總結(jié)歸納了近幾十年來語音端點檢測研究的進展和成果,從語音端點檢測的準(zhǔn)確性、穩(wěn)定性、自適應(yīng)性和運算量上對常用的幾種語音端點算法進行分析,發(fā)現(xiàn)在低信噪比條件下,傳統(tǒng)的語音端點檢測算法都存在檢測準(zhǔn)確率急劇下降的問題。針對這一問題,本文從提升降噪效果、提升端點檢測算法魯棒性兩方面開展研究。在語音降噪方面,本文提出了一種改進的譜減降噪算法,該算法采用端點檢測、分段噪聲估計、動態(tài)參數(shù)調(diào)整等辦法,解決了常規(guī)譜減算法存在的無話段估計困難、噪聲估計不精確、音樂噪聲較大等問題。在端點檢測方面,本文提出了一種改進的子帶能熵比端點檢測算法,該算法采用子帶劃分、優(yōu)化能量計算方式、優(yōu)化譜熵計算、兩級平滑處理方式等辦法,有效提升了算法...
【文章來源】:華南理工大學(xué)廣東省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:72 頁
【學(xué)位級別】:碩士
【部分圖文】:
幀長與幀移的示例
圖 2-3 端點判決規(guī)則分類圖處理的主要作用是對端點判決后的結(jié)果進行平滑處理,輸出更加準(zhǔn)確在制定平滑規(guī)則時,我們需要把握以下幾個原則:第一,避免前端Clipping),由于語音信號處理往往對語音的起點要求較高,為了防導(dǎo)致語音的丟失,我們一般需要將語音端點判決的結(jié)果適當(dāng)前推(MSC, Middlespeech Clipping),為了避免將連續(xù)語音中的短暫停,我們可以通過比較靜默長度與最短靜默音幀數(shù)的關(guān)系設(shè)置拖延(OVER),我們還要避免檢測語音終止點相對真實終止點后移導(dǎo)題。短時能量和短時過零率的雙門限端點檢測法原理
華南理工大學(xué)工程碩士學(xué)位論文樣精度 16bit,單聲道,實驗采用的噪聲文件為 NoiseX-92 噪聲庫中選擇較有代表性的white、factory1、hfChannel 等幾類噪聲。實驗一:同一噪聲在不同信噪比條件下對語音文件的影響。具體步驟為選擇比較有代表性的高斯白噪聲與純凈語音文件疊加并生成信噪比為 10dB、0dB、-10dB 的三種帶噪語音文件,并繪制帶噪語音文件的波形圖與語譜圖。實驗結(jié)果如下:
【參考文獻】:
期刊論文
[1]基于譜減法的語音信號降噪改進算法[J]. 金薛冬,李東新. 國外電子測量技術(shù). 2018(05)
[2]語音端點檢測技術(shù)研究進展[J]. 韓立華,王博,段淑鳳. 計算機應(yīng)用研究. 2010(04)
[3]基于熵函數(shù)的語音端點檢測算法研究[J]. 王博,郭英,韓立峰. 信號處理. 2009(03)
[4]低信噪比下基于譜熵的語音端點檢測算法[J]. 李曄,張仁智,崔慧娟,唐昆. 清華大學(xué)學(xué)報(自然科學(xué)版). 2005(10)
[5]基于子帶能量特征的最優(yōu)化語音端點檢測算法研究[J]. 陳振標(biāo),徐波. 聲學(xué)學(xué)報. 2005(02)
[6]端點檢測中的一種新的對數(shù)能量特征[J]. 肖述才,王作英. 電聲技術(shù). 2004(06)
[7]一種基于特征空間能量熵的語音信號端點檢測算法[J]. 徐望,丁琦,王炳錫. 通信學(xué)報. 2003(11)
[8]支持向量機在語音激活檢測中的應(yīng)用研究[J]. 董恩清,趙鶴鳴,周亞同,張曉娣. 通信學(xué)報. 2003(03)
[9]3G系統(tǒng)中復(fù)雜背景噪聲環(huán)境下話音激活檢測算法性能分析[J]. 陳東,匡鏡明. 北京理工大學(xué)學(xué)報. 2001(02)
[10]噪聲環(huán)境中基于HMM模型的語音信號端點檢測方法[J]. 朱杰,韋曉東. 上海交通大學(xué)學(xué)報. 1998(10)
博士論文
[1]基于深度神經(jīng)網(wǎng)絡(luò)的語音識別模型研究[D]. 張仕良.中國科學(xué)技術(shù)大學(xué) 2017
碩士論文
[1]基于卷積神經(jīng)網(wǎng)絡(luò)的語音識別研究[D]. 楊穎.華南理工大學(xué) 2018
[2]噪聲環(huán)境下的語音端點檢測方法研究[D]. 李嘉安娜.華南理工大學(xué) 2015
本文編號:3535463
【文章來源】:華南理工大學(xué)廣東省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:72 頁
【學(xué)位級別】:碩士
【部分圖文】:
幀長與幀移的示例
圖 2-3 端點判決規(guī)則分類圖處理的主要作用是對端點判決后的結(jié)果進行平滑處理,輸出更加準(zhǔn)確在制定平滑規(guī)則時,我們需要把握以下幾個原則:第一,避免前端Clipping),由于語音信號處理往往對語音的起點要求較高,為了防導(dǎo)致語音的丟失,我們一般需要將語音端點判決的結(jié)果適當(dāng)前推(MSC, Middlespeech Clipping),為了避免將連續(xù)語音中的短暫停,我們可以通過比較靜默長度與最短靜默音幀數(shù)的關(guān)系設(shè)置拖延(OVER),我們還要避免檢測語音終止點相對真實終止點后移導(dǎo)題。短時能量和短時過零率的雙門限端點檢測法原理
華南理工大學(xué)工程碩士學(xué)位論文樣精度 16bit,單聲道,實驗采用的噪聲文件為 NoiseX-92 噪聲庫中選擇較有代表性的white、factory1、hfChannel 等幾類噪聲。實驗一:同一噪聲在不同信噪比條件下對語音文件的影響。具體步驟為選擇比較有代表性的高斯白噪聲與純凈語音文件疊加并生成信噪比為 10dB、0dB、-10dB 的三種帶噪語音文件,并繪制帶噪語音文件的波形圖與語譜圖。實驗結(jié)果如下:
【參考文獻】:
期刊論文
[1]基于譜減法的語音信號降噪改進算法[J]. 金薛冬,李東新. 國外電子測量技術(shù). 2018(05)
[2]語音端點檢測技術(shù)研究進展[J]. 韓立華,王博,段淑鳳. 計算機應(yīng)用研究. 2010(04)
[3]基于熵函數(shù)的語音端點檢測算法研究[J]. 王博,郭英,韓立峰. 信號處理. 2009(03)
[4]低信噪比下基于譜熵的語音端點檢測算法[J]. 李曄,張仁智,崔慧娟,唐昆. 清華大學(xué)學(xué)報(自然科學(xué)版). 2005(10)
[5]基于子帶能量特征的最優(yōu)化語音端點檢測算法研究[J]. 陳振標(biāo),徐波. 聲學(xué)學(xué)報. 2005(02)
[6]端點檢測中的一種新的對數(shù)能量特征[J]. 肖述才,王作英. 電聲技術(shù). 2004(06)
[7]一種基于特征空間能量熵的語音信號端點檢測算法[J]. 徐望,丁琦,王炳錫. 通信學(xué)報. 2003(11)
[8]支持向量機在語音激活檢測中的應(yīng)用研究[J]. 董恩清,趙鶴鳴,周亞同,張曉娣. 通信學(xué)報. 2003(03)
[9]3G系統(tǒng)中復(fù)雜背景噪聲環(huán)境下話音激活檢測算法性能分析[J]. 陳東,匡鏡明. 北京理工大學(xué)學(xué)報. 2001(02)
[10]噪聲環(huán)境中基于HMM模型的語音信號端點檢測方法[J]. 朱杰,韋曉東. 上海交通大學(xué)學(xué)報. 1998(10)
博士論文
[1]基于深度神經(jīng)網(wǎng)絡(luò)的語音識別模型研究[D]. 張仕良.中國科學(xué)技術(shù)大學(xué) 2017
碩士論文
[1]基于卷積神經(jīng)網(wǎng)絡(luò)的語音識別研究[D]. 楊穎.華南理工大學(xué) 2018
[2]噪聲環(huán)境下的語音端點檢測方法研究[D]. 李嘉安娜.華南理工大學(xué) 2015
本文編號:3535463
本文鏈接:http://www.sikaile.net/kejilunwen/xinxigongchenglunwen/3535463.html
最近更新
教材專著