天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 信息工程論文 >

基于深度學習的客家方言語音識別

發(fā)布時間:2021-12-02 01:11
  近年來,由于大數(shù)據(jù)和云計算的高速發(fā)展,在人工智能浪潮的推動下,使用自然語言進行人機交互,這類自動語音識別一直是研究的熱點。同時語音識別也是智能家居和智慧電商等市場的首要研究重點。雖然市場上的語音識別系統(tǒng)眾多,但針對方言的語音識別及研究寥寥無幾。在此背景之下,本文以客家方言語料庫為語料,以神經(jīng)網(wǎng)絡作為模型結(jié)構(gòu),搭建一個基于深度神經(jīng)網(wǎng)絡的客家方言語音識別系統(tǒng),對客家方言的語音識別研究具有實用價值。首先,本文介紹了深度學習相關(guān)的關(guān)鍵技術(shù),包括神經(jīng)網(wǎng)絡、循環(huán)神經(jīng)網(wǎng)絡(Recurrent Neural Networks,RNN)、長短時記憶網(wǎng)絡(Long Short Term Memory Network,LSTM)以及結(jié)構(gòu)更為簡單的門控循環(huán)單元網(wǎng)絡(Gated Recurrent Unit,GRU)。然后,對語音識別系統(tǒng)的結(jié)構(gòu)與技術(shù)進行分析,并著重介紹了語音信號的處理技術(shù)。其次,通過建設客家方言語料庫,詳細地介紹了語料庫的建設過程,包括語料的選取、錄制、整理與核音、語音標注;最后,基于TensorFlow的深度學習框架,選擇了一款開源的語音識別工具,通過對客家方言的語音采集作為語料,結(jié)合當前先... 

【文章來源】:華南理工大學廣東省 211工程院校 985工程院校 教育部直屬院校

【文章頁數(shù)】:77 頁

【學位級別】:碩士

【部分圖文】:

基于深度學習的客家方言語音識別


深度學習人臉識別過程示意圖

結(jié)構(gòu)圖,神經(jīng)元模型,結(jié)構(gòu)圖


華南理工大學碩士學位論文經(jīng)元模型,基于生物神經(jīng)網(wǎng)絡的神經(jīng)元模型誕生[30]。它由心理學家 Warralter Pitts 提出。神經(jīng)元是模仿生物的神經(jīng)元設計的,樹突、軸突體的輸入、輸出和接口,神經(jīng)細胞的工作方式是興奮與抑制,并硬權(quán)限函數(shù))來模擬各種機制。單個神經(jīng)元模型結(jié)構(gòu)如圖 2-2 所

激活函數(shù),參數(shù)修正,損失函數(shù)


(a) sigmod 函數(shù) (b) ReLU 函數(shù)圖 2-3 兩種激活函數(shù)ltilayer Perceptron)是一種單向多層的前饋神經(jīng)網(wǎng)其結(jié)構(gòu)如圖 2-4 所示,包括一個輸入層、一個步驟也就是前向傳播(Forward Pass)過程。前然后經(jīng)過激活函數(shù)處理。經(jīng)過激活函數(shù)后的輸定一個損失函數(shù)對差距大小計算誤差,并根據(jù)傳播和目標輸出相對接近,這種參數(shù)修正的過

【參考文獻】:
期刊論文
[1]語音識別大揭秘:計算機如何處理聲音?[J]. 周弘燁.  中國新通信. 2019(04)
[2]基于深度學習和MFCC特征的腦卒中預測方法[J]. 陳鷗宇,劉怡俊,葉武劍,牟志偉,李琪.  信息與電腦(理論版). 2019(03)
[3]深度學習技術(shù)概述[J]. 張睿哲.  中國新通信. 2018(21)
[4]卷積神經(jīng)網(wǎng)絡算法在語音識別中的應用[J]. 張文宇,劉暢.  信息技術(shù). 2018(10)
[5]語音識別技術(shù)概述[J]. 李志遠.  中國新通信. 2018(17)
[6]基于動態(tài)BLSTM和CTC的瀕危語言語音識別研究[J]. 于重重,陳運兵,孫沁瑤,劉暢,徐世璇,尹蔚彬.  計算機應用研究. 2019(11)
[7]深度學習研究綜述[J]. 張榮,李偉平,莫同.  信息與控制. 2018(04)
[8]語音識別技術(shù)的研究進展與展望[J]. 王海坤,潘嘉,劉聰.  電信科學. 2018(02)
[9]ReLU激活函數(shù)優(yōu)化研究[J]. 蔣昂波,王維維.  傳感器與微系統(tǒng). 2018(02)
[10]重慶方言語音識別系統(tǒng)的設計與實現(xiàn)[J]. 張策,韋鵬程,陸曉燕,石熙.  計算機測量與控制. 2018(01)

博士論文
[1]基于深度神經(jīng)網(wǎng)絡的語音識別模型研究[D]. 張仕良.中國科學技術(shù)大學 2017

碩士論文
[1]基于深度神經(jīng)網(wǎng)絡的蒙古語語音識別系統(tǒng)聲學模型的研究[D]. 張紅偉.內(nèi)蒙古大學 2017
[2]基于深度關(guān)注神經(jīng)網(wǎng)絡的漢語方言辨識[D]. 邱遠航.江蘇師范大學 2017
[3]基于深度學習的藏語拉薩方言語音識別的研究[D]. 張宇聰.西北師范大學 2016



本文編號:3527422

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/xinxigongchenglunwen/3527422.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶e6439***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com