天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于深度卷積神經(jīng)網(wǎng)絡(luò)的藏語(yǔ)語(yǔ)音識(shí)別研究

發(fā)布時(shí)間:2025-02-11 18:26
  自動(dòng)語(yǔ)音識(shí)別技術(shù)作為一項(xiàng)核心技術(shù)在呼叫中心、醫(yī)療服務(wù)和移動(dòng)應(yīng)用等領(lǐng)域得到了廣泛的應(yīng)用。隨著國(guó)內(nèi)外對(duì)語(yǔ)音識(shí)別技術(shù)研究的快速發(fā)展,漢語(yǔ)、英語(yǔ)等資源豐富語(yǔ)言的語(yǔ)音識(shí)別技術(shù)已經(jīng)達(dá)到了很好的識(shí)別性能,然而,藏語(yǔ)由于其語(yǔ)料庫(kù)構(gòu)建困難和語(yǔ)言本身的特殊性,語(yǔ)音識(shí)別技術(shù)發(fā)展緩慢,提升藏語(yǔ)語(yǔ)音識(shí)別系統(tǒng)的性能是當(dāng)前語(yǔ)音識(shí)別技術(shù)領(lǐng)域的一個(gè)重要研究?jī)?nèi)容。本文主要研究卷積神經(jīng)網(wǎng)絡(luò)在藏語(yǔ)語(yǔ)音識(shí)別中的應(yīng)用,主要工作如下:1.特征提取。將語(yǔ)音信號(hào)轉(zhuǎn)化為語(yǔ)譜圖,盡可能保留語(yǔ)音信號(hào)中的信息,作為深度卷積神經(jīng)網(wǎng)絡(luò)的特征輸入。2.聲學(xué)建模。將圖像識(shí)別中取得良好性能的卷積神經(jīng)網(wǎng)絡(luò)引入到藏語(yǔ)語(yǔ)音識(shí)別中,從而更好地捕捉語(yǔ)譜圖中的局部信息。3.端到端語(yǔ)音識(shí)別。將卷積神經(jīng)網(wǎng)絡(luò)與聯(lián)結(jié)時(shí)序分類方法結(jié)合,設(shè)計(jì)了端到端的藏語(yǔ)語(yǔ)音識(shí)別系統(tǒng)。4.分類器結(jié)構(gòu)優(yōu)化。進(jìn)一步增加卷積神經(jīng)網(wǎng)絡(luò)的層數(shù),使用疊加卷積層的方法,提升網(wǎng)絡(luò)的特征提取能力。對(duì)上述模型在實(shí)驗(yàn)室建立的藏語(yǔ)語(yǔ)料庫(kù)進(jìn)行對(duì)比實(shí)驗(yàn),得出以下結(jié)論:1.將語(yǔ)音轉(zhuǎn)化為頻譜圖作為特征提取方法,可以更好地保留語(yǔ)音信號(hào)時(shí)域中有利于識(shí)別的信息。2.使用卷積神經(jīng)網(wǎng)絡(luò)對(duì)語(yǔ)譜圖進(jìn)行語(yǔ)音特征提取,提升了藏語(yǔ)語(yǔ)音識(shí)別性能。...

【文章頁(yè)數(shù)】:57 頁(yè)

【學(xué)位級(jí)別】:碩士

【部分圖文】:

圖2-2加窗分幀示意圖

圖2-2加窗分幀示意圖

青海師范大學(xué)碩士學(xué)位論文14模型。語(yǔ)音信號(hào)加重,可以有效地減少高頻段的波動(dòng)性,增加高頻段的信噪比,從而減少其受到噪聲的干擾,減少語(yǔ)音信號(hào)的信息損失,保留更多的可以進(jìn)行識(shí)別的信息。提升語(yǔ)音信號(hào)的高頻部分,通常是將語(yǔ)音信號(hào)輸入一階高通濾波器,通過(guò)響應(yīng)函數(shù)對(duì)于語(yǔ)音波形進(jìn)行變換。一階高通....


圖3-1神經(jīng)元模型

圖3-1神經(jīng)元模型

基于深度卷積神經(jīng)網(wǎng)絡(luò)的藏語(yǔ)語(yǔ)音識(shí)別研究17圖3-1神經(jīng)元模型神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方式就是調(diào)參,即將權(quán)值調(diào)整為最適合分類的最佳參數(shù),從而達(dá)到最好的識(shí)別性能。圖3-1中,1x,2x,3x為輸入,箭頭線稱為“連接”,作為傳輸數(shù)據(jù)的通道,1w,2w和3w分別為每一個(gè)“連接”上的一個(gè)權(quán)值,b為偏....


圖4-1語(yǔ)譜原始語(yǔ)音分幀加窗

圖4-1語(yǔ)譜原始語(yǔ)音分幀加窗

基于深度卷積神經(jīng)網(wǎng)絡(luò)的藏語(yǔ)語(yǔ)音識(shí)別研究234.2語(yǔ)譜圖特征提取語(yǔ)譜圖是語(yǔ)音信號(hào)的二維表示方式,使時(shí)域和頻域進(jìn)行結(jié)合,清楚地表示出了語(yǔ)音信號(hào)的頻譜特征隨著時(shí)間的變化而產(chǎn)生的變化。語(yǔ)譜圖的提取過(guò)程如圖4-1所示:圖4-1語(yǔ)譜圖提取過(guò)程圖4-1中語(yǔ)譜圖橫軸表示時(shí)間變量,縱軸表示語(yǔ)音信號(hào)....


圖4-3疊加卷積層深度CNN模型

圖4-3疊加卷積層深度CNN模型

基于深度卷積神經(jīng)網(wǎng)絡(luò)的藏語(yǔ)語(yǔ)音識(shí)別研究25小,本文設(shè)計(jì)了更深層的CNN進(jìn)行藏語(yǔ)語(yǔ)音識(shí)別。本文采用的深度CNN基本架構(gòu)如圖4-3所示:圖4-3疊加卷積層深度CNN模型與傳統(tǒng)CNN結(jié)構(gòu)不同,深度CNN直接使用多卷積層對(duì)整句語(yǔ)音信號(hào)進(jìn)行建模,并在每個(gè)卷積層后再疊加一層相同的卷積層,形成....



本文編號(hào):4033675

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/wenyilunwen/yuyanyishu/4033675.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶33d86***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com