天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

對感冒語音魯棒的語音指令識(shí)別及嵌入式實(shí)現(xiàn)

發(fā)布時(shí)間:2020-07-24 04:59
【摘要】:近幾年來,語音識(shí)別技術(shù)逐漸進(jìn)入人們的日常生活,而加入了語音識(shí)別技術(shù)的智能家居系統(tǒng)使得人們的生活更加舒適、便利。但是在實(shí)際應(yīng)用場景中,語音識(shí)別準(zhǔn)確性受許多因素的影響,例如環(huán)境噪聲或者說話人本身變音(如感冒、聲帶發(fā)炎、咽喉炎等),從而導(dǎo)致語音識(shí)別系統(tǒng)魯棒性不強(qiáng)。環(huán)境噪聲的因素目前已得到研究人員廣泛關(guān)注并采取各種措施來降低噪聲的影響,但是對說話人本身變音的研究還十分缺乏。因此本文對說話人感冒狀態(tài)下的語音識(shí)別進(jìn)行了研究,其中重點(diǎn)研究了語音識(shí)別系統(tǒng)在保證正常語音識(shí)別率的同時(shí)使得感冒語音識(shí)別率盡量接近正常語音識(shí)別率,從而改善語音識(shí)別系統(tǒng)性能。本論文的主要研究工作和創(chuàng)新如下:(1)建立了感冒語音數(shù)據(jù)庫。根據(jù)智能家居控制語音指令,建立了“感冒非常態(tài)及常態(tài)語音數(shù)據(jù)庫”,該數(shù)據(jù)庫已被中文語言資源聯(lián)盟收錄(No:CLDC-2018-001)。(2)對感冒語音與正常語音的特征進(jìn)行差異分析和特征參數(shù)處理。采用研究對象感冒前、后的語音,對所提取的特征參數(shù)做統(tǒng)計(jì)分析。分析表明研究對象感冒前、后的基音頻率、共振峰、Mel倒譜系數(shù)具有明顯的區(qū)別。根據(jù)特征參數(shù)的差異,本文提出一種基于特征空間軌跡的時(shí)間規(guī)正方法,該方法采用段內(nèi)語音信號(hào)的均值代表語音特征。實(shí)驗(yàn)結(jié)果表明相比Mel倒譜系數(shù)特征,經(jīng)過該方法處理的特征能有效降低正常語音與感冒語音之間的特征差異。(3)考慮到感冒語音與正常語音模板的失配問題,提出了兩種對感冒語音魯棒的語音識(shí)別方案。第一種是基于決策融合的語音識(shí)別方案,該方案通過SVM分類器對輸入語音進(jìn)行正常語音和感冒語音的分類判別。當(dāng)感冒語音與正常語音區(qū)分度較小時(shí),經(jīng)過決策融合方法得出識(shí)別結(jié)果;而區(qū)分度較大時(shí),根據(jù)分類結(jié)果采用對應(yīng)的語音模板得出識(shí)別結(jié)果。該方案彌補(bǔ)了語音判別過程帶來的誤差,提升了感冒語音在語音識(shí)別系統(tǒng)中的識(shí)別率。第二種是基于特征空間軌跡的時(shí)間規(guī)正的語音識(shí)別方案,該方案對感冒語音特征參數(shù)進(jìn)行時(shí)間規(guī)正處理。該方案能有效提高了感冒語音的識(shí)別率和實(shí)時(shí)性。(4)實(shí)現(xiàn)了嵌入式語音識(shí)別系統(tǒng),其中包括語音識(shí)別算法模塊、人機(jī)交互界面模塊及在線學(xué)習(xí)模塊。最后在真實(shí)場景下對系統(tǒng)進(jìn)行測試,系統(tǒng)識(shí)別率在77.52%左右。
【學(xué)位授予單位】:華南理工大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2018
【分類號(hào)】:TN912.34
【圖文】:

結(jié)構(gòu)圖,發(fā)聲器官,人體,結(jié)構(gòu)圖


語 1272 個(gè)、控制指令 1032 個(gè)(8 人),此數(shù)據(jù)集二中感冒語音與正常語音實(shí)驗(yàn)平臺(tái) MATLAB2014a 利用 Voicebox、Pmtk3-master、Lib-SVM 等工具箱搭建一實(shí)驗(yàn)使用的計(jì)算機(jī)為 DELL,該計(jì)算機(jī)內(nèi)核為 Intel(R) Core(TM) i7,安裝indows 操作系統(tǒng)。音信號(hào)的產(chǎn)生過程類產(chǎn)生語音過程分為生理階段和物理階段。在生理階段,大腦將要表達(dá)的的形式,向發(fā)音器官發(fā)送一系列的神經(jīng)指令,在物理階段,聲音經(jīng)過呼官和共鳴器官的共同作用以聲波的形式發(fā)出與傳遞[32]。

短時(shí)自相關(guān)函數(shù),基音提取,基音頻率


圖 2-3 基于短時(shí)自相關(guān)函數(shù)的基音提取.2 感冒前、后基音周期對比采用短時(shí)自相關(guān)函數(shù)法提取基音,在語音信號(hào)有說話聲部分提取的基音頻率或平穩(wěn);糁芷趯Ρ葘(shí)驗(yàn),提取 6 名感冒患者感冒前、后語音,語音來自 PA庫數(shù)據(jù),男生 4 名,女生 2 名。統(tǒng)計(jì) 6 位錄音者感冒前、后的基音頻率,分析

語音信號(hào),共振峰


X k 的包絡(luò)線,在語音信號(hào)的 包絡(luò)線上尋找出幅值的極大值,通過多個(gè)極大值求得共振峰。圖 2-4 是一幀語音信號(hào)的頻譜,頻譜曲線用黑實(shí)線表示,頻譜包絡(luò)線用黑粗線表示,共振峰峰值位置用黑色小圓圈表示。圖中有四個(gè)黑色小圓圈,表示該段語音信號(hào)的 4 個(gè)共振峰 F1、F2、F3、F4 的位置。圖 2-4 語音信號(hào)的共振峰提取圖 2-5 為原始語音信號(hào)的時(shí)域波形圖,圖 2-6 為語音信號(hào)的二維語譜圖,用顏色表示能量值,語譜圖中顏色的深淺表示語音能量的大小,顏色越深,則表示能量越大。語

【參考文獻(xiàn)】

相關(guān)期刊論文 前10條

1 劉佩軍;;關(guān)于普通感冒發(fā)病機(jī)制的新思考[J];醫(yī)學(xué)爭鳴;2015年03期

2 楊瀟亮;;基于安卓操作系統(tǒng)的應(yīng)用軟件開發(fā)[J];電子制作;2014年19期

3 吳勇毅;;智能家居產(chǎn)業(yè)的機(jī)遇與挑戰(zhàn)[J];上海信息化;2014年05期

4 酆勇;李宓;李子明;;文本無關(guān)的說話人識(shí)別研究[J];數(shù)字通信;2013年04期

5 王文娟;楊震;;基于語音壓縮感知觀測序列非重構(gòu)的清濁音判別法[J];數(shù)據(jù)采集與處理;2013年03期

6 張永剛;;我國智能家居現(xiàn)狀與問題[J];智能建筑與城市信息;2012年12期

7 周英;;關(guān)于語音識(shí)別技術(shù)發(fā)展趨勢的分析[J];計(jì)算機(jī)光盤軟件與應(yīng)用;2012年19期

8 朱立;;一種基于Android系統(tǒng)的嵌入式數(shù)據(jù)庫同步方案[J];價(jià)值工程;2011年16期

9 丁世飛;齊丙娟;譚紅艷;;支持向量機(jī)理論與算法研究綜述[J];電子科技大學(xué)學(xué)報(bào);2011年01期

10 嚴(yán)樂貧;奉小慧;;雙模態(tài)車載語音控制仿真系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J];計(jì)算機(jī)與現(xiàn)代化;2010年08期

相關(guān)博士學(xué)位論文 前1條

1 何俊;聲紋身份識(shí)別中非常態(tài)語音應(yīng)對方法研究[D];華南理工大學(xué);2012年

相關(guān)碩士學(xué)位論文 前2條

1 金海;基于深度神經(jīng)網(wǎng)絡(luò)的音頻事件檢測[D];華南理工大學(xué);2016年

2 杜朦旭;感冒病人嗓音的特征提取與識(shí)別研究[D];浙江大學(xué);2016年



本文編號(hào):2768353

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/wltx/2768353.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶c24a8***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請E-mail郵箱bigeng88@qq.com