天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 碩博論文 > 信息類博士論文 >

農(nóng)產(chǎn)品市場(chǎng)信息采集的語(yǔ)音識(shí)別魯棒性方法研究

發(fā)布時(shí)間:2021-04-09 17:58

  當(dāng)前語(yǔ)音識(shí)別的研究已取得了較為豐碩的成果,在安靜環(huán)境下性能令人滿意,逐漸被應(yīng)用在諸多人機(jī)交互的場(chǎng)合。然而,由于噪聲的存在,語(yǔ)音識(shí)別系統(tǒng)在實(shí)際環(huán)境下性能急劇下降,如何提高語(yǔ)音識(shí)別的噪聲魯棒性,逐漸成為近年來(lái)語(yǔ)音識(shí)別的研究熱點(diǎn)。本文主要研究農(nóng)產(chǎn)品市場(chǎng)信息采集作業(yè)環(huán)境中的語(yǔ)音識(shí)別噪聲魯棒性問(wèn)題,針對(duì)當(dāng)前缺乏面向農(nóng)產(chǎn)品市場(chǎng)信息采集領(lǐng)域的語(yǔ)音識(shí)別引擎,而通用領(lǐng)域的識(shí)別算法又不適合解決上述問(wèn)題,分析環(huán)境的噪聲特點(diǎn),面向非特定人和中小規(guī)模詞匯量的連續(xù)漢語(yǔ)普通話識(shí)別,訓(xùn)練聲學(xué)模型,研究適用于該環(huán)境下的語(yǔ)音識(shí)別魯棒性方法。本文主要研究的內(nèi)容包括:(1)基于隱馬爾科夫模型(HMM)框架建立了聲學(xué)模型,利用自建的農(nóng)產(chǎn)品市場(chǎng)信息語(yǔ)料庫(kù)進(jìn)行訓(xùn)練和測(cè)試HHM模型,基于HTK工具包建立了農(nóng)產(chǎn)品價(jià)格語(yǔ)音識(shí)別基線系統(tǒng)。(2)在分析農(nóng)產(chǎn)品市場(chǎng)信息采集環(huán)境的噪聲特點(diǎn)的基礎(chǔ)上,從模型空間和特征空間對(duì)系統(tǒng)采取了多種魯棒性方法,包括:在聲學(xué)模型的識(shí)別基元選取上,采用了一種擴(kuò)展的三音素聲韻母模型,有效的解決了音節(jié)內(nèi)部和音節(jié)間的協(xié)同發(fā)音問(wèn)題,大大提高了識(shí)別率;針對(duì)建模后三音子模型數(shù)量急劇增加問(wèn)題,采用了決策樹(shù)狀態(tài)聚類方法,建立了一套二值問(wèn)題規(guī)則集,并將語(yǔ)音學(xué)的專業(yè)知識(shí)融合進(jìn)決策樹(shù),通過(guò)聚類減少了三音子模型的數(shù)量,有效地解決了訓(xùn)練數(shù)據(jù)不充分問(wèn)題;鑒于倒譜均值歸一化(CMN)方法在消除信道卷積噪聲以及加性噪聲方面的良好表現(xiàn),在農(nóng)產(chǎn)品市場(chǎng)信息語(yǔ)音識(shí)別系統(tǒng)中采用,有效緩解了信道噪聲影響。(3)在信號(hào)空間,為了提高輸入語(yǔ)音信號(hào)的信噪比,采用了譜減類算法進(jìn)行語(yǔ)音增強(qiáng),但譜減算法容易帶來(lái)信道失真和“音樂(lè)”噪聲。為了減少這種失真,提出了一種聯(lián)合語(yǔ)音增強(qiáng)與特征補(bǔ)償?shù)聂敯粜苑椒?把倒譜均值方差歸一化方法(CMVN)與譜減類算法進(jìn)行了結(jié)合,二者互為補(bǔ)充。實(shí)驗(yàn)結(jié)果表明,聯(lián)合后的算法能有效提高系統(tǒng)的識(shí)別率,特別是在低信噪比時(shí)效果更為明顯。(4)在統(tǒng)計(jì)估計(jì)理論的框架下,研究了估計(jì)幅度與實(shí)際幅度的最小均方誤差(MMSE)估計(jì)器以及對(duì)數(shù)最小均方誤差(log MMSE)幅度估計(jì)器。在此基礎(chǔ)上提出了一種聯(lián)合MMSE以及l(fā)og MMSE幅度估計(jì)與CMVN失真補(bǔ)償?shù)聂敯粜苑椒ā2煌r(nóng)產(chǎn)品市場(chǎng)信息采集環(huán)境下的實(shí)驗(yàn)證明,該方法具有一定的噪聲魯棒性,多種空間算法的有機(jī)結(jié)合可以提供系統(tǒng)的魯棒性,特別是在低信噪比時(shí)更為明顯。本文的研究為語(yǔ)音識(shí)別在農(nóng)產(chǎn)品市場(chǎng)信息采集環(huán)境中的應(yīng)用建立了一套魯棒性方法,為今后語(yǔ)音識(shí)別在農(nóng)業(yè)信息采集領(lǐng)域的應(yīng)用提供了借鑒。

【學(xué)位授予單位】:中國(guó)農(nóng)業(yè)科學(xué)院

【學(xué)位級(jí)別】:博士

【學(xué)位授予年份】:2015
【分類號(hào)】:TN912.34
【目錄】:

文章目錄
摘要
Abstract
英文縮略表
第一章 引言
    1.1 問(wèn)題的提出及研究意義
    1.2 語(yǔ)音識(shí)別概述
        1.2.1 語(yǔ)音識(shí)別的發(fā)展
        1.2.2 語(yǔ)音識(shí)別的分類
        1.2.3 基于統(tǒng)計(jì)模型的語(yǔ)音識(shí)別
    1.3 影響語(yǔ)音識(shí)別魯棒性的因素
    1.4 語(yǔ)音識(shí)別及聲學(xué)技術(shù)在農(nóng)業(yè)領(lǐng)域的應(yīng)用
        1.4.1 國(guó)外研究情況
        1.4.2 國(guó)內(nèi)研究情況
    1.5 研究?jī)?nèi)容
    1.6 章節(jié)安排
    1.7 小結(jié)
第二章 噪聲魯棒性語(yǔ)音識(shí)別的研究現(xiàn)狀
    2.1 噪聲分類
        2.1.1 加性噪聲與乘性噪聲
        2.1.2 噪聲特性分析
    2.2 噪聲魯棒性方法研究現(xiàn)狀
        2.2.1 語(yǔ)音增強(qiáng)
        2.2.2 魯棒性特征提取
        2.2.3 模型補(bǔ)償
    2.3 小結(jié)
第三章 基于HMM框架的農(nóng)產(chǎn)品價(jià)格語(yǔ)音識(shí)別
    3.1 HMM模型
        3.1.1 HMM的概述
        3.1.2 HMM的數(shù)學(xué)定義
        3.1.3 HMM的三個(gè)基本問(wèn)題
    3.2 基于HTK的實(shí)驗(yàn)平臺(tái)構(gòu)建
        3.2.1 語(yǔ)音數(shù)據(jù)庫(kù)
        3.2.2 MFCC特征提取
        3.2.3 聲學(xué)模型的設(shè)置
        3.2.4 識(shí)別性能的評(píng)價(jià)標(biāo)準(zhǔn)
    3.3 小結(jié)
第四章 系統(tǒng)的三音子模型優(yōu)化及特征規(guī)整
    4.1 擴(kuò)展的聲韻母建;
        4.1.1 漢語(yǔ)語(yǔ)音學(xué)特點(diǎn)
        4.1.2 漢語(yǔ)聲母結(jié)構(gòu)
        4.1.3 漢語(yǔ)韻母結(jié)構(gòu)
        4.1.4 擴(kuò)展的聲韻母識(shí)別基元定義
    4.2 基于決策樹(shù)的狀態(tài)共享
        4.2.1 決策樹(shù)的構(gòu)造
        4.2.2 二值問(wèn)題集的設(shè)計(jì)
        4.2.3 結(jié)點(diǎn)分裂準(zhǔn)則
        4.2.4 結(jié)點(diǎn)停止分裂
        4.2.5 結(jié)點(diǎn)合并
    4.3 增加高斯混合分量
    4.4 倒譜特征歸一化
    4.5 實(shí)驗(yàn)及分析
        4.5.1 實(shí)驗(yàn)一:三音子模型識(shí)別實(shí)驗(yàn)
        4.5.2 實(shí)驗(yàn)二:決策樹(shù)狀態(tài)聚類
        4.5.3 實(shí)驗(yàn)三:高斯混合分量增加
        4.5.4 實(shí)驗(yàn)四:倒譜均值方差(CMVN)歸一化
    4.6 小結(jié)
第五章 聯(lián)合譜減增強(qiáng)和失真補(bǔ)償?shù)聂敯粜苑椒?/div>
    5.1 譜減法
        5.1.1 譜減的基本原理
        5.1.2 使用過(guò)減(over subtraction)技術(shù)的譜減算法
    5.2 多帶(multi band)譜減法
    5.3 MMSE譜減算法
    5.4 實(shí)驗(yàn)
        5.4.1 實(shí)驗(yàn)一:MMSE譜減法參數(shù)優(yōu)化實(shí)驗(yàn)
        5.4.2 實(shí)驗(yàn)二:不同環(huán)境下聯(lián)合算法實(shí)驗(yàn)
    5.5 小結(jié)
第六章 基于統(tǒng)計(jì)模型的前端增強(qiáng)與失真補(bǔ)償?shù)慕Y(jié)合
    6.1 MMSE幅度譜估計(jì)
        6.1.1 MMSE幅度估計(jì)器
        6.1.2 先驗(yàn)SNR的估計(jì)
    6.2 對(duì)數(shù)MMSE估計(jì)器
    6.3 MMSE估計(jì)的實(shí)現(xiàn)
    6.4 實(shí)驗(yàn)
        6.4.1 實(shí)驗(yàn)一:采用MMSE估計(jì)器與logMMSE方法增強(qiáng)
        6.4.2 實(shí)驗(yàn)二:MMSE、logMMSE與CMVN聯(lián)合實(shí)驗(yàn)
        6.4.3 實(shí)驗(yàn)三:實(shí)際環(huán)境語(yǔ)音測(cè)試
    6.5 算法綜合比較
    6.6 小結(jié)
第七章 結(jié)論及展望
    7.1 研究總結(jié)
    7.2 展望
參考文獻(xiàn)
致謝
作者簡(jiǎn)介

【參考文獻(xiàn)】

中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條

1 王易川;李智忠;;基于Mel倒譜和BP神經(jīng)網(wǎng)絡(luò)的船舶目標(biāo)分類研究[J];傳感器與微系統(tǒng);2011年06期

2 郭海燕;楊震;朱衛(wèi)平;;一種新的基于稀疏分解的單通道混合語(yǔ)音分離方法[J];電子學(xué)報(bào);2012年04期

3 白立舜;楊伯鋼;王晴;;森林資源調(diào)查的便攜式野外聲控記錄技術(shù)研究[J];測(cè)繪通報(bào);2013年09期

4 張雪英;賈海蓉;靳晨升;;子空間與維納濾波相結(jié)合的語(yǔ)音增強(qiáng)方法[J];計(jì)算機(jī)工程與應(yīng)用;2011年14期

5 劉放軍;王仁華;;語(yǔ)音識(shí)別前端魯棒性問(wèn)題綜述[J];計(jì)算機(jī)科學(xué);2006年04期

6 王讓定,柴佩琪;語(yǔ)音倒譜特征的研究[J];計(jì)算機(jī)工程;2003年13期

7 舒挺,張國(guó)煊;基于Voice XML技術(shù)的信息服務(wù)集成[J];計(jì)算機(jī)應(yīng)用;2003年06期

8 王曉蘭,周獻(xiàn)中;格式正確的有限命令識(shí)別[J];計(jì)算機(jī)應(yīng)用;2005年10期

9 雷建軍;楊震;劉剛;郭軍;;噪聲魯棒語(yǔ)音識(shí)別研究綜述[J];計(jì)算機(jī)應(yīng)用研究;2009年04期

10 張翠麗;張申生;李磊;;基于統(tǒng)一受理的農(nóng)業(yè)呼叫中心解決方案[J];計(jì)算機(jī)應(yīng)用與軟件;2006年10期

中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前1條

1 胡郁;語(yǔ)音識(shí)別中基于模型補(bǔ)償?shù)脑肼曯敯粜詥?wèn)題研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2009年

中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前2條

1 李金娟;基于HMM模型的語(yǔ)音情感識(shí)別的研究[D];天津大學(xué);2007年

2 周阿轉(zhuǎn);汽車(chē)駕駛環(huán)境中的魯棒性語(yǔ)音識(shí)別[D];蘇州大學(xué);2012年



本文編號(hào):168820


本文鏈接:http://www.sikaile.net/shoufeilunwen/xxkjbs/168820.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶586f6***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com