天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 自動(dòng)化論文 >

基于深度學(xué)習(xí)的音素特征識(shí)別研究

發(fā)布時(shí)間:2021-09-11 16:43
  語(yǔ)音作為日常交流的重要方式,在人類(lèi)發(fā)展歷程中占有無(wú)可替代的地位。21世紀(jì)后,神經(jīng)網(wǎng)絡(luò)的重新提出和互聯(lián)網(wǎng)的快速發(fā)展將語(yǔ)音識(shí)別技術(shù)推進(jìn)到一個(gè)新的階段。由于模式識(shí)別的進(jìn)步,語(yǔ)音識(shí)別作為人機(jī)交互的重要組成是當(dāng)前研究的熱點(diǎn)。在語(yǔ)音的特征提取、聲學(xué)模型識(shí)別和解碼三個(gè)步驟中,特征提取作為語(yǔ)音識(shí)別的第一步尤其重要,隨著深度學(xué)習(xí)在語(yǔ)音識(shí)別領(lǐng)域的成功應(yīng)用,使用神經(jīng)網(wǎng)絡(luò)的深度結(jié)構(gòu)可以實(shí)現(xiàn)對(duì)語(yǔ)音數(shù)據(jù)的復(fù)雜函數(shù)計(jì)算和高維學(xué)習(xí),提取出比淺層結(jié)構(gòu)分類(lèi)效果更好的音素特征。近年來(lái),大量的研究人員提出了多種利用神經(jīng)網(wǎng)絡(luò)的深層結(jié)構(gòu)來(lái)提高語(yǔ)音特征識(shí)別率的方法,盡管在一定程度上取得了較好的效果,但是語(yǔ)音識(shí)別的研究技術(shù)仍存在進(jìn)步的空間。本文為降低語(yǔ)音特征的識(shí)別錯(cuò)誤率,首先,從語(yǔ)音信號(hào)中提取傳統(tǒng)特征,然后對(duì)傳統(tǒng)的特征進(jìn)行音素提取;其次,建立新的串聯(lián)系統(tǒng)模型,通過(guò)相關(guān)狀態(tài)的共享結(jié)構(gòu)來(lái)減少計(jì)算復(fù)雜度,同時(shí)充分利用深度學(xué)習(xí)框架中生成性網(wǎng)絡(luò)的映射方式和學(xué)習(xí)能力,進(jìn)行特征參數(shù)的提取;最后,經(jīng)過(guò)聲學(xué)模型的學(xué)習(xí)識(shí)別與解碼后得到音素識(shí)別錯(cuò)誤率,并以此為指標(biāo)判斷模型的效果。本文主要的研究?jī)?nèi)容如下:(1)子空間高斯混合模型在狀態(tài)空間共享同一結(jié)構(gòu)的情況... 

【文章來(lái)源】:陜西師范大學(xué)陜西省 211工程院校 教育部直屬院校

【文章頁(yè)數(shù)】:62 頁(yè)

【學(xué)位級(jí)別】:碩士

【部分圖文】:

基于深度學(xué)習(xí)的音素特征識(shí)別研究


一人機(jī)交互系統(tǒng)模塊組成

基于深度學(xué)習(xí)的音素特征識(shí)別研究


HMM的組成

序列,孤立詞,序列


?^??觀察序列??圖2-3?HMM的組成??Fig.?2-3?Composition?of?the?Hidden?Markov?Model??隱馬爾可夫模型作為一個(gè)雙內(nèi)嵌形式的隨機(jī)過(guò)程,一個(gè)過(guò)程是無(wú)法觀測(cè)的,??僅可借助另一個(gè)過(guò)程中輸出的觀察序列得到結(jié)果。設(shè)HMM模型的狀態(tài)轉(zhuǎn)移序列??是夕二的…七,符號(hào)輸出為■,則考慮到在HMM中所有可能的狀態(tài)??序列,輸出的符號(hào)序列概率為:??P(0)?=?[P(0|作⑷=[n?外,,?)?(2-7)??S?Si??根據(jù)上面的分析,可以看出聲學(xué)模型HMM由以下5個(gè)參數(shù)決定:??M?=?{S,?O,?n,?A,?B}?(2-8)??式中,S為有限的狀態(tài)集合,O為輸出的可以進(jìn)行觀測(cè)的符號(hào)集合,;r?yàn)槌跏几??率的集合

【參考文獻(xiàn)】:
期刊論文
[1]基于改進(jìn)深度置信網(wǎng)絡(luò)的語(yǔ)音增強(qiáng)算法[J]. 余華,唐於烽,趙力.  數(shù)據(jù)采集與處理. 2018(05)
[2]面向中文語(yǔ)音情感識(shí)別的改進(jìn)棧式自編碼結(jié)構(gòu)[J]. 朱芳枚,趙力,梁瑞宇,王青云,鄒采榮.  東南大學(xué)學(xué)報(bào)(自然科學(xué)版). 2017(04)
[3]深度學(xué)習(xí)在語(yǔ)音識(shí)別中的研究進(jìn)展綜述[J]. 侯一民,周慧瓊,王政一.  計(jì)算機(jī)應(yīng)用研究. 2017(08)
[4]LVCSR系統(tǒng)中一種基于區(qū)分性和自適應(yīng)瓶頸深度置信網(wǎng)絡(luò)的特征提取方法[J]. 陳雷,楊俊安,王一,王龍.  信號(hào)處理. 2015(03)
[5]非齊次語(yǔ)音識(shí)別HMM模型和THED語(yǔ)音識(shí)別與理解系統(tǒng)[J]. 王作英.  電信科學(xué). 1993(04)
[6]用圖樣匹配法在計(jì)算機(jī)上自動(dòng)識(shí)別語(yǔ)音[J]. 俞鐵城.  物理學(xué)報(bào). 1977(05)
[7]漢語(yǔ)標(biāo)準(zhǔn)頻譜[J]. 馬大猷,張家騄.  聲學(xué)學(xué)報(bào). 1965(04)



本文編號(hào):3393356

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/zidonghuakongzhilunwen/3393356.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶21cd4***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com