復(fù)雜聲學(xué)場(chǎng)景下魯棒性語(yǔ)音識(shí)別研究
發(fā)布時(shí)間:2021-08-12 08:16
自古以來(lái),語(yǔ)音作為人類(lèi)生活中最常用的溝通方式,大家通過(guò)各自獨(dú)特的語(yǔ)言直抒胸臆,表達(dá)訴求,傳承文明。因此,語(yǔ)音對(duì)人類(lèi)文明的發(fā)展與社會(huì)進(jìn)步有著至關(guān)重要的作用。在人工智能技術(shù)中,語(yǔ)音識(shí)別技術(shù)就是將人類(lèi)的語(yǔ)言信息轉(zhuǎn)變?yōu)闄C(jī)器能夠理解的文本信息,最終實(shí)現(xiàn)人類(lèi)與機(jī)器的交互,使機(jī)器做出正確的反饋。語(yǔ)音識(shí)別技術(shù)是自然人機(jī)交互的重要橋梁,能夠大力地促進(jìn)人工智能的發(fā)展。但是,現(xiàn)實(shí)生活中,不管是機(jī)器還是人類(lèi)接受到的語(yǔ)音信號(hào)都是通過(guò)空氣等媒介才能間接地傳遞過(guò)來(lái),因此,這些聲波信號(hào)極易受到各種噪聲干擾以及不同環(huán)境存在的回聲、混響等影響導(dǎo)致失真,甚在在更復(fù)雜的聲學(xué)場(chǎng)景下,還會(huì)把目標(biāo)語(yǔ)音完全掩蓋,這就對(duì)我們的語(yǔ)音識(shí)別系統(tǒng)在真實(shí)場(chǎng)景中的應(yīng)用提出了巨大的挑戰(zhàn)。本文首先將語(yǔ)音識(shí)別的前端與后端相結(jié)合,通過(guò)語(yǔ)音分離和降噪等增強(qiáng)算法對(duì)其展開(kāi)研究。除此之外,語(yǔ)音識(shí)別在現(xiàn)實(shí)復(fù)雜場(chǎng)景下的魯棒性問(wèn)題,還需要考慮說(shuō)話(huà)人本身的多變性因素,比如語(yǔ)速的快慢等。因此我們還開(kāi)始了針對(duì)語(yǔ)速變化場(chǎng)景的魯棒性研究。論文的主要工作如下:(1)語(yǔ)音識(shí)別基線(xiàn)系統(tǒng)搭建。針對(duì)復(fù)雜聲學(xué)場(chǎng)景的語(yǔ)音識(shí)別魯棒性問(wèn)題,本文在國(guó)際魯棒性語(yǔ)音識(shí)別評(píng)測(cè)任務(wù)CHi ME-5上進(jìn)行算...
【文章來(lái)源】:上海師范大學(xué)上海市
【文章頁(yè)數(shù)】:59 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
語(yǔ)音識(shí)別系統(tǒng)結(jié)構(gòu)框圖
第2章語(yǔ)音識(shí)別系統(tǒng)概述上海師范大學(xué)碩士學(xué)位論文10其中10()()()Qqynhnxnq,Q是濾波器的長(zhǎng)度。圖2-2聲學(xué)回聲消除結(jié)構(gòu)框圖回聲消除算法的主要作用是當(dāng)環(huán)境發(fā)生改變時(shí),要求所描述的傳輸路徑能夠準(zhǔn)確及時(shí)地反映這種變化,從而保證能夠?qū)溈孙L(fēng)中采集的回聲信號(hào)具有良好的消除效果。通?梢允褂貌煌幕芈曄惴▉(lái)解決不同的應(yīng)用場(chǎng)景需求。1)固定參數(shù)回聲消除圖2-3聲學(xué)回聲生成模型如上圖2-3所示,假設(shè)能夠提前準(zhǔn)確地獲得系統(tǒng)的沖激響應(yīng),且該沖激響應(yīng)具有穩(wěn)定性。此時(shí)可以將參考信號(hào)x(n)與該預(yù)知的沖激響應(yīng)進(jìn)行卷積,來(lái)估計(jì)麥克風(fēng)中采集到的回聲信號(hào),進(jìn)而實(shí)現(xiàn)回聲消除處理。公式如下:()=()()()(2-2)
第2章語(yǔ)音識(shí)別系統(tǒng)概述上海師范大學(xué)碩士學(xué)位論文10其中10()()()Qqynhnxnq,Q是濾波器的長(zhǎng)度。圖2-2聲學(xué)回聲消除結(jié)構(gòu)框圖回聲消除算法的主要作用是當(dāng)環(huán)境發(fā)生改變時(shí),要求所描述的傳輸路徑能夠準(zhǔn)確及時(shí)地反映這種變化,從而保證能夠?qū)溈孙L(fēng)中采集的回聲信號(hào)具有良好的消除效果。通?梢允褂貌煌幕芈曄惴▉(lái)解決不同的應(yīng)用場(chǎng)景需求。1)固定參數(shù)回聲消除圖2-3聲學(xué)回聲生成模型如上圖2-3所示,假設(shè)能夠提前準(zhǔn)確地獲得系統(tǒng)的沖激響應(yīng),且該沖激響應(yīng)具有穩(wěn)定性。此時(shí)可以將參考信號(hào)x(n)與該預(yù)知的沖激響應(yīng)進(jìn)行卷積,來(lái)估計(jì)麥克風(fēng)中采集到的回聲信號(hào),進(jìn)而實(shí)現(xiàn)回聲消除處理。公式如下:()=()()()(2-2)
本文編號(hào):3337956
【文章來(lái)源】:上海師范大學(xué)上海市
【文章頁(yè)數(shù)】:59 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
語(yǔ)音識(shí)別系統(tǒng)結(jié)構(gòu)框圖
第2章語(yǔ)音識(shí)別系統(tǒng)概述上海師范大學(xué)碩士學(xué)位論文10其中10()()()Qqynhnxnq,Q是濾波器的長(zhǎng)度。圖2-2聲學(xué)回聲消除結(jié)構(gòu)框圖回聲消除算法的主要作用是當(dāng)環(huán)境發(fā)生改變時(shí),要求所描述的傳輸路徑能夠準(zhǔn)確及時(shí)地反映這種變化,從而保證能夠?qū)溈孙L(fēng)中采集的回聲信號(hào)具有良好的消除效果。通?梢允褂貌煌幕芈曄惴▉(lái)解決不同的應(yīng)用場(chǎng)景需求。1)固定參數(shù)回聲消除圖2-3聲學(xué)回聲生成模型如上圖2-3所示,假設(shè)能夠提前準(zhǔn)確地獲得系統(tǒng)的沖激響應(yīng),且該沖激響應(yīng)具有穩(wěn)定性。此時(shí)可以將參考信號(hào)x(n)與該預(yù)知的沖激響應(yīng)進(jìn)行卷積,來(lái)估計(jì)麥克風(fēng)中采集到的回聲信號(hào),進(jìn)而實(shí)現(xiàn)回聲消除處理。公式如下:()=()()()(2-2)
第2章語(yǔ)音識(shí)別系統(tǒng)概述上海師范大學(xué)碩士學(xué)位論文10其中10()()()Qqynhnxnq,Q是濾波器的長(zhǎng)度。圖2-2聲學(xué)回聲消除結(jié)構(gòu)框圖回聲消除算法的主要作用是當(dāng)環(huán)境發(fā)生改變時(shí),要求所描述的傳輸路徑能夠準(zhǔn)確及時(shí)地反映這種變化,從而保證能夠?qū)溈孙L(fēng)中采集的回聲信號(hào)具有良好的消除效果。通?梢允褂貌煌幕芈曄惴▉(lái)解決不同的應(yīng)用場(chǎng)景需求。1)固定參數(shù)回聲消除圖2-3聲學(xué)回聲生成模型如上圖2-3所示,假設(shè)能夠提前準(zhǔn)確地獲得系統(tǒng)的沖激響應(yīng),且該沖激響應(yīng)具有穩(wěn)定性。此時(shí)可以將參考信號(hào)x(n)與該預(yù)知的沖激響應(yīng)進(jìn)行卷積,來(lái)估計(jì)麥克風(fēng)中采集到的回聲信號(hào),進(jìn)而實(shí)現(xiàn)回聲消除處理。公式如下:()=()()()(2-2)
本文編號(hào):3337956
本文鏈接:http://www.sikaile.net/kejilunwen/xinxigongchenglunwen/3337956.html
最近更新
教材專(zhuān)著