基于深度關(guān)注神經(jīng)網(wǎng)絡(luò)的漢語方言辨識
本文選題:漢語方言辨識 切入點:方言語音庫 出處:《江蘇師范大學(xué)》2017年碩士論文
【摘要】:伴隨科技進步,信息處理智能化成為社會發(fā)展的方向。語音識別是智能信息處理的核心技術(shù),經(jīng)歷近百年的研究發(fā)展,已取得長足進步,但復(fù)雜多語言語音處理系統(tǒng)的真正實現(xiàn)效果不盡如人意。本文研究的漢語方言辨識是利用計算機自動辨別語音片段方言類屬特性的語音處理技術(shù),其在公共安全、信息服務(wù)、言語工程等諸多領(lǐng)域,均有重要的應(yīng)用價值和廣闊的應(yīng)用前景。目前,經(jīng)濟有效的漢語方言辨識方法是利用機器學(xué)習(xí)算法提取方言的類屬特征并設(shè)計建立方言模型,通過模型匹配完成方言類屬判定。但是,由于漢語方言本身的復(fù)雜異變性,該領(lǐng)域仍存在語音庫匱乏、數(shù)據(jù)失衡;特征的類屬特性表征模糊、不穩(wěn)定;模型的學(xué)習(xí)及分類能力不足等諸多問題需要解決。本文針對以上問題展開研究,具體工作如下:(1)完善漢語方言語音庫。在前人已建漢語方言語音庫的基礎(chǔ)上繼續(xù)收錄各方言語音,同時積極尋求各方資源共享,先后增補吳、閩及官話方言近百小時。其次對方言粗語音進行參數(shù)規(guī)整、數(shù)據(jù)平衡、標(biāo)注以及時長自動切分操作,使其符合語音庫標(biāo)準(zhǔn)及實驗要求。(2)提出基于身份認證矢量(Identify vector,I-vector)與韻律特征融合的漢語方言辨識方法。從句法結(jié)構(gòu)上提升方言類屬特性的全局表征效果,增強方言語音的可區(qū)分性。實驗結(jié)果顯示,對比高斯混合模型-通用背景模型(Gaussian Mixture Models-Universal Background Model,GMM-UBM)方法,融合全局信息的方法將漢語方言辨識等錯誤率(Equal Error Rate,EER)相對降低56.32%,性能提升顯著。(3)提出基于深度關(guān)注神經(jīng)網(wǎng)絡(luò)的漢語方言辨識方法。深度神經(jīng)網(wǎng)絡(luò)(Deep Neural Network,DNN)可以有效解決大輸入量、復(fù)雜非線性信號的分類處理問題,關(guān)注機制體現(xiàn)模型對分配資源進一步有效利用。本文設(shè)計不同輸入特征探究深度關(guān)注神經(jīng)網(wǎng)絡(luò)對漢語方言辨識的影響。結(jié)果顯示,深度關(guān)注神經(jīng)網(wǎng)絡(luò)將漢語方言辨識EER相對降低28.3%,提高辨識正確率的同時展現(xiàn)模型高度的穩(wěn)定性。
[Abstract]:With the progress of science and technology, intelligent information processing has become the direction of social development.Speech recognition is the core technology of intelligent information processing. After nearly 100 years of research and development, it has made great progress, but the real effect of complex multilingual speech processing system is not satisfactory.The Chinese dialect recognition studied in this paper is a kind of speech processing technology which can automatically identify the characteristics of speech segment dialects by computer. It is used in many fields, such as public security, information service, speech engineering and so on.It has important application value and broad application prospect.At present, an economical and effective method for identifying Chinese dialects is to extract the generic features of dialects by using machine learning algorithm and to design and establish dialect models, and complete the classification of dialects by model matching.However, due to the complex variability of Chinese dialects, there are still many problems in this field, such as lack of phonetic corpus, unbalance of data, fuzzy and unstable representation of generic characteristics of features, inadequate learning and classification ability of models, and so on.This paper aims at the above problems, the specific work is as follows: 1) perfect the Chinese dialect phonetic corpus.On the basis of the previous Chinese dialect phonetic database, we continue to collect the pronunciation of each dialect, and actively seek the sharing of resources, and supplement Wu, Min and Guanyu dialects for nearly 100 hours.Secondly, the parameters, data balance, tagging and time length automatic segmentation of dialect coarse speech are carried out to meet the standard of phonetic corpus and experimental requirements. (2) an identification method for Chinese dialects based on the fusion of identity authentication vector identifying vector vectoring I-vectorand prosodic features is proposed.From the syntactic structure, we can improve the global representation effect of dialect generic characteristics and enhance the differentiability of dialect pronunciation.The experimental results show that the Gaussian Mixture Models-Universal Background Model GMM-UBM method is compared with Gao Si mixed model and general background model.The method of integrating global information reduces the equal Error rate of Chinese dialect recognition and equal Error error rate by 56.32, and improves the performance significantly. 3) A method of Chinese dialect identification based on the neural network of depth concern is proposed.Deep Neural Network (DNN) can effectively solve the problem of classification and processing of large input and complex nonlinear signals.This paper designs different input features to explore the effects of neural networks on Chinese dialect recognition.The results show that the neural network with deep attention reduces the EER of Chinese dialect recognition by 28.3and improves the accuracy of identification and shows the high stability of the model at the same time.
【學(xué)位授予單位】:江蘇師范大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2017
【分類號】:TN912.3;TP18
【相似文獻】
相關(guān)期刊論文 前10條
1 楊曉帥 ,付玫;神經(jīng)網(wǎng)絡(luò)技術(shù)讓管理更輕松[J];軟件世界;2000年11期
2 云中客;新的神經(jīng)網(wǎng)絡(luò)來自于仿生學(xué)[J];物理;2001年10期
3 唐春明,高協(xié)平;進化神經(jīng)網(wǎng)絡(luò)的研究進展[J];系統(tǒng)工程與電子技術(shù);2001年10期
4 李智;一種基于神經(jīng)網(wǎng)絡(luò)的煤炭調(diào)運優(yōu)化方法[J];長沙鐵道學(xué)院學(xué)報;2003年02期
5 程科,王士同,楊靜宇;新型模糊形態(tài)神經(jīng)網(wǎng)絡(luò)及其應(yīng)用研究[J];計算機工程與應(yīng)用;2004年21期
6 王凡,孟立凡;關(guān)于使用神經(jīng)網(wǎng)絡(luò)推定操作者疲勞的研究[J];人類工效學(xué);2004年03期
7 周麗暉;從統(tǒng)計角度看神經(jīng)網(wǎng)絡(luò)[J];統(tǒng)計教育;2005年06期
8 趙奇 ,劉開第 ,龐彥軍;灰色補償神經(jīng)網(wǎng)絡(luò)及其應(yīng)用研究[J];微計算機信息;2005年14期
9 袁婷;;神經(jīng)網(wǎng)絡(luò)在股票市場預(yù)測中的應(yīng)用[J];軟件導(dǎo)刊;2006年05期
10 尚晉;楊有;;從神經(jīng)網(wǎng)絡(luò)的過去談科學(xué)發(fā)展觀[J];重慶三峽學(xué)院學(xué)報;2006年03期
相關(guān)會議論文 前10條
1 徐春玉;;基于泛集的神經(jīng)網(wǎng)絡(luò)的混沌性[A];1996中國控制與決策學(xué)術(shù)年會論文集[C];1996年
2 周樹德;王巖;孫增圻;孫富春;;量子神經(jīng)網(wǎng)絡(luò)[A];2003年中國智能自動化會議論文集(上冊)[C];2003年
3 羅山;張琳;范文新;;基于神經(jīng)網(wǎng)絡(luò)和簡單規(guī)劃的識別融合算法[A];2009系統(tǒng)仿真技術(shù)及其應(yīng)用學(xué)術(shù)會議論文集[C];2009年
4 郭愛克;馬盡文;丁康;;序言(二)[A];1999年中國神經(jīng)網(wǎng)絡(luò)與信號處理學(xué)術(shù)會議論文集[C];1999年
5 鐘義信;;知識論:神經(jīng)網(wǎng)絡(luò)的新機遇——紀念中國神經(jīng)網(wǎng)絡(luò)10周年[A];1999年中國神經(jīng)網(wǎng)絡(luò)與信號處理學(xué)術(shù)會議論文集[C];1999年
6 許進;保錚;;神經(jīng)網(wǎng)絡(luò)與圖論[A];1999年中國神經(jīng)網(wǎng)絡(luò)與信號處理學(xué)術(shù)會議論文集[C];1999年
7 金龍;朱詩武;趙成志;陳寧;;數(shù)值預(yù)報產(chǎn)品的神經(jīng)網(wǎng)絡(luò)釋用預(yù)報應(yīng)用[A];1999年中國神經(jīng)網(wǎng)絡(luò)與信號處理學(xué)術(shù)會議論文集[C];1999年
8 田金亭;;神經(jīng)網(wǎng)絡(luò)在中學(xué)生創(chuàng)造力評估中的應(yīng)用[A];第十二屆全國心理學(xué)學(xué)術(shù)大會論文摘要集[C];2009年
9 唐墨;王科俊;;自發(fā)展神經(jīng)網(wǎng)絡(luò)的混沌特性研究[A];2009年中國智能自動化會議論文集(第七分冊)[南京理工大學(xué)學(xué)報(增刊)][C];2009年
10 張廣遠;萬強;曹海源;田方濤;;基于遺傳算法優(yōu)化神經(jīng)網(wǎng)絡(luò)的故障診斷方法研究[A];第十二屆全國設(shè)備故障診斷學(xué)術(shù)會議論文集[C];2010年
相關(guān)重要報紙文章 前10條
1 美國明尼蘇達大學(xué)社會學(xué)博士 密西西比州立大學(xué)國家戰(zhàn)略規(guī)劃與分析研究中心資深助理研究員 陳心想;維護好創(chuàng)新的“神經(jīng)網(wǎng)絡(luò)硬件”[N];中國教師報;2014年
2 盧業(yè)忠;腦控電腦 驚世駭俗[N];計算機世界;2001年
3 葛一鳴 路邊文;人工神經(jīng)網(wǎng)絡(luò)將大顯身手[N];中國紡織報;2003年
4 中國科技大學(xué)計算機系 邢方亮;神經(jīng)網(wǎng)絡(luò)挑戰(zhàn)人類大腦[N];計算機世界;2003年
5 記者 孫剛;“神經(jīng)網(wǎng)絡(luò)”:打開復(fù)雜工藝“黑箱”[N];解放日報;2007年
6 本報記者 劉霞;美用DNA制造出首個人造神經(jīng)網(wǎng)絡(luò)[N];科技日報;2011年
7 健康時報特約記者 張獻懷;干細胞移植:修復(fù)受損的神經(jīng)網(wǎng)絡(luò)[N];健康時報;2006年
8 劉力;我半導(dǎo)體神經(jīng)網(wǎng)絡(luò)技術(shù)及應(yīng)用研究達國際先進水平[N];中國電子報;2001年
9 ;神經(jīng)網(wǎng)絡(luò)和模糊邏輯[N];世界金屬導(dǎo)報;2002年
10 鄒麗梅 陳耀群;江蘇科大神經(jīng)網(wǎng)絡(luò)應(yīng)用研究通過鑒定[N];中國船舶報;2006年
相關(guān)博士學(xué)位論文 前10條
1 楊旭華;神經(jīng)網(wǎng)絡(luò)及其在控制中的應(yīng)用研究[D];浙江大學(xué);2004年
2 李素芳;基于神經(jīng)網(wǎng)絡(luò)的無線通信算法研究[D];山東大學(xué);2015年
3 石艷超;憶阻神經(jīng)網(wǎng)絡(luò)的混沌性及幾類時滯神經(jīng)網(wǎng)絡(luò)的同步研究[D];電子科技大學(xué);2014年
4 王新迎;基于隨機映射神經(jīng)網(wǎng)絡(luò)的多元時間序列預(yù)測方法研究[D];大連理工大學(xué);2015年
5 付愛民;極速學(xué)習(xí)機的訓(xùn)練殘差、穩(wěn)定性及泛化能力研究[D];中國農(nóng)業(yè)大學(xué);2015年
6 李輝;基于粒計算的神經(jīng)網(wǎng)絡(luò)及集成方法研究[D];中國礦業(yè)大學(xué);2015年
7 王衛(wèi)蘋;復(fù)雜網(wǎng)絡(luò)幾類同步控制策略研究及穩(wěn)定性分析[D];北京郵電大學(xué);2015年
8 張海軍;基于云計算的神經(jīng)網(wǎng)絡(luò)并行實現(xiàn)及其學(xué)習(xí)方法研究[D];華南理工大學(xué);2015年
9 李艷晴;風(fēng)速時間序列預(yù)測算法研究[D];北京科技大學(xué);2016年
10 陳輝;多維超精密定位系統(tǒng)建模與控制關(guān)鍵技術(shù)研究[D];東南大學(xué);2015年
相關(guān)碩士學(xué)位論文 前10條
1 章穎;混合不確定性模塊化神經(jīng)網(wǎng)絡(luò)與高校效益預(yù)測的研究[D];華南理工大學(xué);2015年
2 賈文靜;基于改進型神經(jīng)網(wǎng)絡(luò)的風(fēng)力發(fā)電系統(tǒng)預(yù)測及控制研究[D];燕山大學(xué);2015年
3 李慧芳;基于憶阻器的渦卷混沌系統(tǒng)及其電路仿真[D];西南大學(xué);2015年
4 陳彥至;神經(jīng)網(wǎng)絡(luò)降維算法研究與應(yīng)用[D];華南理工大學(xué);2015年
5 董哲康;基于憶阻器的組合電路及神經(jīng)網(wǎng)絡(luò)研究[D];西南大學(xué);2015年
6 武創(chuàng)舉;基于神經(jīng)網(wǎng)絡(luò)的遙感圖像分類研究[D];昆明理工大學(xué);2015年
7 李志杰;基于神經(jīng)網(wǎng)絡(luò)的上證指數(shù)預(yù)測研究[D];華南理工大學(xué);2015年
8 陳少吉;基于神經(jīng)網(wǎng)絡(luò)血壓預(yù)測研究與系統(tǒng)實現(xiàn)[D];華南理工大學(xué);2015年
9 張韜;幾類時滯神經(jīng)網(wǎng)絡(luò)穩(wěn)定性分析[D];渤海大學(xué);2015年
10 邵雪瑩;幾類時滯不確定神經(jīng)網(wǎng)絡(luò)的穩(wěn)定性分析[D];渤海大學(xué);2015年
,本文編號:1705997
本文鏈接:http://www.sikaile.net/kejilunwen/zidonghuakongzhilunwen/1705997.html