基于深度卷積神經(jīng)網(wǎng)絡(luò)的藏語(yǔ)語(yǔ)音識(shí)別研究
【文章頁(yè)數(shù)】:57 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖2-2加窗分幀示意圖
青海師范大學(xué)碩士學(xué)位論文14模型。語(yǔ)音信號(hào)加重,可以有效地減少高頻段的波動(dòng)性,增加高頻段的信噪比,從而減少其受到噪聲的干擾,減少語(yǔ)音信號(hào)的信息損失,保留更多的可以進(jìn)行識(shí)別的信息。提升語(yǔ)音信號(hào)的高頻部分,通常是將語(yǔ)音信號(hào)輸入一階高通濾波器,通過(guò)響應(yīng)函數(shù)對(duì)于語(yǔ)音波形進(jìn)行變換。一階高通....
圖3-1神經(jīng)元模型
基于深度卷積神經(jīng)網(wǎng)絡(luò)的藏語(yǔ)語(yǔ)音識(shí)別研究17圖3-1神經(jīng)元模型神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方式就是調(diào)參,即將權(quán)值調(diào)整為最適合分類的最佳參數(shù),從而達(dá)到最好的識(shí)別性能。圖3-1中,1x,2x,3x為輸入,箭頭線稱為“連接”,作為傳輸數(shù)據(jù)的通道,1w,2w和3w分別為每一個(gè)“連接”上的一個(gè)權(quán)值,b為偏....
圖4-1語(yǔ)譜原始語(yǔ)音分幀加窗
基于深度卷積神經(jīng)網(wǎng)絡(luò)的藏語(yǔ)語(yǔ)音識(shí)別研究234.2語(yǔ)譜圖特征提取語(yǔ)譜圖是語(yǔ)音信號(hào)的二維表示方式,使時(shí)域和頻域進(jìn)行結(jié)合,清楚地表示出了語(yǔ)音信號(hào)的頻譜特征隨著時(shí)間的變化而產(chǎn)生的變化。語(yǔ)譜圖的提取過(guò)程如圖4-1所示:圖4-1語(yǔ)譜圖提取過(guò)程圖4-1中語(yǔ)譜圖橫軸表示時(shí)間變量,縱軸表示語(yǔ)音信號(hào)....
圖4-3疊加卷積層深度CNN模型
基于深度卷積神經(jīng)網(wǎng)絡(luò)的藏語(yǔ)語(yǔ)音識(shí)別研究25小,本文設(shè)計(jì)了更深層的CNN進(jìn)行藏語(yǔ)語(yǔ)音識(shí)別。本文采用的深度CNN基本架構(gòu)如圖4-3所示:圖4-3疊加卷積層深度CNN模型與傳統(tǒng)CNN結(jié)構(gòu)不同,深度CNN直接使用多卷積層對(duì)整句語(yǔ)音信號(hào)進(jìn)行建模,并在每個(gè)卷積層后再疊加一層相同的卷積層,形成....
本文編號(hào):4033675
本文鏈接:http://www.sikaile.net/wenyilunwen/yuyanyishu/4033675.html