基于連續(xù)隱馬爾可夫模型的語(yǔ)音識(shí)別抗噪問(wèn)題研究
發(fā)布時(shí)間:2021-06-16 19:47
隨著信息化時(shí)代的來(lái)臨,隱馬爾可夫模型(HMM)被廣泛應(yīng)用在語(yǔ)音識(shí)別領(lǐng)域,并已成為該領(lǐng)域最受關(guān)注最有效的建模方法之一。隨著人們對(duì)智能化要求越來(lái)越高,基于HMM的語(yǔ)音識(shí)別技術(shù)也在不斷改進(jìn),尤其在噪聲環(huán)境下,原識(shí)別系統(tǒng)與現(xiàn)實(shí)語(yǔ)音無(wú)法高度匹配,這使得系統(tǒng)識(shí)別率大幅降低。因此本文將基于HMM的連續(xù)情形(CHMM)下,研究語(yǔ)音識(shí)別系統(tǒng)的可靠性和抗噪能力。本文首先基于最大互信息(MMI)訓(xùn)練準(zhǔn)則對(duì)CHMM進(jìn)行改進(jìn),初步提高系統(tǒng)的識(shí)別率。之后在信號(hào)空間研究白噪聲背景下,提出基于線性預(yù)測(cè)隱馬爾可夫模型(LPHMM),利用Gaussian有色噪聲白化方法(GCNW)和最小均方誤差估計(jì)(MMSE)得到一種語(yǔ)音增強(qiáng)方法(LWM),比較其與經(jīng)典語(yǔ)音增強(qiáng)算法譜減法(SS)的抗噪效果;在特征空間,基于特征參數(shù)梅爾頻率倒譜系數(shù)(MFCC),通過(guò)加權(quán)對(duì)其實(shí)現(xiàn)優(yōu)化,結(jié)合時(shí)域特征短時(shí)能量(En)和短時(shí)平均過(guò)零率(ZCR)得到一種特征參數(shù)提取方法(MFFEZ);在模型空間,基于對(duì)加性噪聲和信道函數(shù)聯(lián)合補(bǔ)償?shù)哪P脱a(bǔ)償方法(MACA),結(jié)合MFFEZ特征提取,得到MFFEZ-MCAC模型,并比較噪聲環(huán)境下其與MACA模型的識(shí)別率...
【文章來(lái)源】:哈爾濱工業(yè)大學(xué)黑龍江省 211工程院校 985工程院校
【文章頁(yè)數(shù)】:49 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
語(yǔ)音識(shí)別原理圖
哈爾濱工業(yè)大學(xué)理學(xué)碩士學(xué)位論文-7-中可知,預(yù)加重前后語(yǔ)音信號(hào)的高頻部分的幅頻有明顯提升。a)濾波器幅頻特性a)Filteramplitude-frequencycharacteristicsb)濾波器相頻特性b)Filterphasefrequencycharacteristics圖2-2數(shù)字濾波器特性Fig.2-2Digitalfiltercharacteristicsa)原始語(yǔ)音時(shí)域信號(hào)b)預(yù)加重后語(yǔ)音時(shí)域信號(hào)a)Originalvoicetimedomainsignalb)Speechtimedomainsignalafterpre-emphasis
哈爾濱工業(yè)大學(xué)理學(xué)碩士學(xué)位論文-10-112nmZsgnxmsgnxmnm其中,sgnx為符號(hào)函數(shù),其定義為1,01,0xnsgnxnxn由上述定義可知,過(guò)零率易受低頻影響,為解決這一問(wèn)題,通過(guò)設(shè)置門限T,將過(guò)零率更改為跨過(guò)正負(fù)閾值,即1{|[][1]|2|[][1]}nmZsgnxmTsgnxmTsgnxmTsgnxmTnm雙門限端點(diǎn)檢測(cè)的基本思想:首先,將整個(gè)端點(diǎn)檢測(cè)分為四個(gè)部分:靜音部分、過(guò)渡部分、語(yǔ)音部分、結(jié)束。設(shè)置一個(gè)變量用于指示實(shí)驗(yàn)期間的當(dāng)前狀態(tài)。默認(rèn)初始狀態(tài)為靜音部分,若能量或者過(guò)零率超過(guò)低閾值,則標(biāo)記進(jìn)入過(guò)渡部分。當(dāng)兩個(gè)參數(shù)值低于低閾值時(shí),則認(rèn)為返回靜音部分,并且若過(guò)渡部分中兩個(gè)參數(shù)中任何一個(gè)大于高閾值,則認(rèn)為進(jìn)入語(yǔ)音部分。語(yǔ)音段中,當(dāng)參數(shù)均低于低閾值,并且計(jì)時(shí)長(zhǎng)度小于最短時(shí)間門限,則認(rèn)為此段語(yǔ)音是噪音部分,繼續(xù)讀取,否則標(biāo)記終點(diǎn)。如圖2-4所示,此為一段數(shù)字“9”的語(yǔ)音信號(hào),利用雙門限端點(diǎn)檢測(cè)算法檢測(cè)該段信號(hào),其中紅色范圍內(nèi)為尋找的有效語(yǔ)音信號(hào)段。圖2-4能量和過(guò)零率端點(diǎn)檢測(cè)Fig.2-4Energyandzero-crossingrateendpointdetection
【參考文獻(xiàn)】:
期刊論文
[1]魯棒性語(yǔ)音識(shí)別技術(shù)研究綜述[J]. 黃志東. 信息通信. 2019(11)
[2]語(yǔ)音識(shí)別技術(shù)的研究進(jìn)展與展望[J]. 王海坤,潘嘉,劉聰. 電信科學(xué). 2018(02)
[3]基于卷積神經(jīng)網(wǎng)絡(luò)的面罩語(yǔ)音識(shí)別[J]. 王霞,杜桂明,王光艷,張艷. 傳感器與微系統(tǒng). 2017(10)
[4]應(yīng)用于語(yǔ)種識(shí)別的加權(quán)音素對(duì)數(shù)似然比特征[J]. 張健,徐杰,包秀國(guó),周若華,顏永紅. 清華大學(xué)學(xué)報(bào)(自然科學(xué)版). 2017(10)
[5]基于時(shí)頻特征的光纖周界入侵振動(dòng)信號(hào)識(shí)別與定位[J]. 朱程輝,王建平,李奇越,左冬森,李帷韜. 中國(guó)激光. 2016(06)
[6]噪聲魯棒語(yǔ)音識(shí)別研究綜述[J]. 雷建軍,楊震,劉剛,郭軍. 計(jì)算機(jī)應(yīng)用研究. 2009(04)
[7]一種對(duì)加性噪聲和信道函數(shù)聯(lián)合補(bǔ)償?shù)哪P凸烙?jì)方法[J]. 王智國(guó),吳及,戴禮榮,王仁華. 聲學(xué)學(xué)報(bào)(中文版). 2008(03)
[8]基于最大互信息的連續(xù)型隱馬爾可夫模型參數(shù)訓(xùn)練方法[J]. 陳文鋒,李兵,武海鋒. 云南大學(xué)學(xué)報(bào)(自然科學(xué)版). 2006(S1)
[9]連續(xù)隱馬爾可夫模型和神經(jīng)網(wǎng)絡(luò)在說(shuō)話人識(shí)別中的比較[J]. 周茉,劉蓉,陳琦. 計(jì)算機(jī)與數(shù)字工程. 2006(09)
[10]基于段長(zhǎng)分布的HMM語(yǔ)音識(shí)別模型[J]. 王作英,肖熙. 電子學(xué)報(bào). 2004(01)
博士論文
[1]抗噪聲語(yǔ)音識(shí)別新技術(shù)的研究[D]. 寧更新.華南理工大學(xué) 2006
碩士論文
[1]語(yǔ)音識(shí)別抗噪算法的研究[D]. 肖勇.中南大學(xué) 2009
本文編號(hào):3233680
【文章來(lái)源】:哈爾濱工業(yè)大學(xué)黑龍江省 211工程院校 985工程院校
【文章頁(yè)數(shù)】:49 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
語(yǔ)音識(shí)別原理圖
哈爾濱工業(yè)大學(xué)理學(xué)碩士學(xué)位論文-7-中可知,預(yù)加重前后語(yǔ)音信號(hào)的高頻部分的幅頻有明顯提升。a)濾波器幅頻特性a)Filteramplitude-frequencycharacteristicsb)濾波器相頻特性b)Filterphasefrequencycharacteristics圖2-2數(shù)字濾波器特性Fig.2-2Digitalfiltercharacteristicsa)原始語(yǔ)音時(shí)域信號(hào)b)預(yù)加重后語(yǔ)音時(shí)域信號(hào)a)Originalvoicetimedomainsignalb)Speechtimedomainsignalafterpre-emphasis
哈爾濱工業(yè)大學(xué)理學(xué)碩士學(xué)位論文-10-112nmZsgnxmsgnxmnm其中,sgnx為符號(hào)函數(shù),其定義為1,01,0xnsgnxnxn由上述定義可知,過(guò)零率易受低頻影響,為解決這一問(wèn)題,通過(guò)設(shè)置門限T,將過(guò)零率更改為跨過(guò)正負(fù)閾值,即1{|[][1]|2|[][1]}nmZsgnxmTsgnxmTsgnxmTsgnxmTnm雙門限端點(diǎn)檢測(cè)的基本思想:首先,將整個(gè)端點(diǎn)檢測(cè)分為四個(gè)部分:靜音部分、過(guò)渡部分、語(yǔ)音部分、結(jié)束。設(shè)置一個(gè)變量用于指示實(shí)驗(yàn)期間的當(dāng)前狀態(tài)。默認(rèn)初始狀態(tài)為靜音部分,若能量或者過(guò)零率超過(guò)低閾值,則標(biāo)記進(jìn)入過(guò)渡部分。當(dāng)兩個(gè)參數(shù)值低于低閾值時(shí),則認(rèn)為返回靜音部分,并且若過(guò)渡部分中兩個(gè)參數(shù)中任何一個(gè)大于高閾值,則認(rèn)為進(jìn)入語(yǔ)音部分。語(yǔ)音段中,當(dāng)參數(shù)均低于低閾值,并且計(jì)時(shí)長(zhǎng)度小于最短時(shí)間門限,則認(rèn)為此段語(yǔ)音是噪音部分,繼續(xù)讀取,否則標(biāo)記終點(diǎn)。如圖2-4所示,此為一段數(shù)字“9”的語(yǔ)音信號(hào),利用雙門限端點(diǎn)檢測(cè)算法檢測(cè)該段信號(hào),其中紅色范圍內(nèi)為尋找的有效語(yǔ)音信號(hào)段。圖2-4能量和過(guò)零率端點(diǎn)檢測(cè)Fig.2-4Energyandzero-crossingrateendpointdetection
【參考文獻(xiàn)】:
期刊論文
[1]魯棒性語(yǔ)音識(shí)別技術(shù)研究綜述[J]. 黃志東. 信息通信. 2019(11)
[2]語(yǔ)音識(shí)別技術(shù)的研究進(jìn)展與展望[J]. 王海坤,潘嘉,劉聰. 電信科學(xué). 2018(02)
[3]基于卷積神經(jīng)網(wǎng)絡(luò)的面罩語(yǔ)音識(shí)別[J]. 王霞,杜桂明,王光艷,張艷. 傳感器與微系統(tǒng). 2017(10)
[4]應(yīng)用于語(yǔ)種識(shí)別的加權(quán)音素對(duì)數(shù)似然比特征[J]. 張健,徐杰,包秀國(guó),周若華,顏永紅. 清華大學(xué)學(xué)報(bào)(自然科學(xué)版). 2017(10)
[5]基于時(shí)頻特征的光纖周界入侵振動(dòng)信號(hào)識(shí)別與定位[J]. 朱程輝,王建平,李奇越,左冬森,李帷韜. 中國(guó)激光. 2016(06)
[6]噪聲魯棒語(yǔ)音識(shí)別研究綜述[J]. 雷建軍,楊震,劉剛,郭軍. 計(jì)算機(jī)應(yīng)用研究. 2009(04)
[7]一種對(duì)加性噪聲和信道函數(shù)聯(lián)合補(bǔ)償?shù)哪P凸烙?jì)方法[J]. 王智國(guó),吳及,戴禮榮,王仁華. 聲學(xué)學(xué)報(bào)(中文版). 2008(03)
[8]基于最大互信息的連續(xù)型隱馬爾可夫模型參數(shù)訓(xùn)練方法[J]. 陳文鋒,李兵,武海鋒. 云南大學(xué)學(xué)報(bào)(自然科學(xué)版). 2006(S1)
[9]連續(xù)隱馬爾可夫模型和神經(jīng)網(wǎng)絡(luò)在說(shuō)話人識(shí)別中的比較[J]. 周茉,劉蓉,陳琦. 計(jì)算機(jī)與數(shù)字工程. 2006(09)
[10]基于段長(zhǎng)分布的HMM語(yǔ)音識(shí)別模型[J]. 王作英,肖熙. 電子學(xué)報(bào). 2004(01)
博士論文
[1]抗噪聲語(yǔ)音識(shí)別新技術(shù)的研究[D]. 寧更新.華南理工大學(xué) 2006
碩士論文
[1]語(yǔ)音識(shí)別抗噪算法的研究[D]. 肖勇.中南大學(xué) 2009
本文編號(hào):3233680
本文鏈接:http://www.sikaile.net/kejilunwen/xinxigongchenglunwen/3233680.html
最近更新
教材專著