基于自適應(yīng)學(xué)習(xí)和多尺度前向注意力的語音識別研究
【文章頁數(shù)】:69 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖1-1端到端的語音識別系統(tǒng)
哈爾濱工業(yè)大學(xué)工學(xué)碩士學(xué)位論文-5-圖1-1端到端的語音識別系統(tǒng)圖1-2序列到序列模型圖1-2的子圖(a)為CTC模型。在無先驗(yàn)性對齊情況下,該模型能夠度量輸入和輸出序列的相似度,并且能刻畫語音特征和音素序列的相關(guān)性;贑TC的語音識別系統(tǒng)由RNN編碼模塊和CTC損失函數(shù)模塊組....
圖1-3本文統(tǒng)識別
哈爾濱工業(yè)大學(xué)工學(xué)碩士學(xué)位論文-10-外研究現(xiàn)狀,還詳細(xì)描述如何搭建基于注意力機(jī)制的語音識別系統(tǒng)基線,分別在第1章、第2章介紹;第二部分是從編碼器的角度利用CTC損失進(jìn)行改進(jìn),并提出自適應(yīng)多任務(wù)學(xué)習(xí),這將在第3章介紹;第三部分,從注意力機(jī)制的角度提出前向注意力模型和多尺度模型,并....
圖1-3本文的組織結(jié)構(gòu)
哈爾濱工業(yè)大學(xué)工學(xué)碩士學(xué)位論文-10-外研究現(xiàn)狀,還詳細(xì)描述如何搭建基于注意力機(jī)制的語音識別系統(tǒng)基線,分別在第1章、第2章介紹;第二部分是從編碼器的角度利用CTC損失進(jìn)行改進(jìn),并提出自適應(yīng)多任務(wù)學(xué)習(xí),這將在第3章介紹;第三部分,從注意力機(jī)制的角度提出前向注意力模型和多尺度模型,并....
圖2-2二維輸入的有效卷積過程
哈爾濱工業(yè)大學(xué)工學(xué)碩士學(xué)位論文-16-假設(shè)輸入的信號x是一維序列,即xnPù±,n是信號采樣數(shù);卷積濾波器mw,m是濾波器大。粂是卷積操作后的結(jié)果,則:(1)有效卷積11(,,"")((1),...,(),...,(1))()(1)()nmmiconvvalidtnmttii+....
本文編號:3930303
本文鏈接:http://www.sikaile.net/kejilunwen/zidonghuakongzhilunwen/3930303.html