天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

面向民航陸空通話的語音識(shí)別技術(shù)研究

發(fā)布時(shí)間:2020-08-05 15:11
【摘要】:陸空通話是管制員與飛行員之間的通話,是飛行指導(dǎo)過程的核心部分?罩薪煌ü苤茊T由于工作強(qiáng)度大,通話壞境嘈雜,很容易誤解聽到的語音,從而導(dǎo)致指揮錯(cuò)誤,威脅飛行安全。語音自動(dòng)識(shí)別技術(shù)可以處理管制語音通話,監(jiān)測(cè)管制員的行為,對(duì)由錯(cuò)誤指令造成的危險(xiǎn)進(jìn)行早期告警,是保障陸空通話指令的正確理解、減少事故發(fā)生的一個(gè)重要手段。然而,由于民航陸空通話在發(fā)音、語調(diào)等方面具有其特殊性,目前通用的語音自動(dòng)識(shí)別技術(shù)不能直接使用。另一方面,民航陸空通話的數(shù)據(jù)具有難以采集和難以標(biāo)注等特點(diǎn),識(shí)別難度很大。為此,本文在語音自動(dòng)識(shí)別技術(shù)面向民航領(lǐng)域里的應(yīng)用以及提高識(shí)別準(zhǔn)確率兩方面做深入研究。本文首先深入分析民航陸空通話的特點(diǎn),然后對(duì)常用的一些語音識(shí)別技術(shù)進(jìn)行改進(jìn),使之適用于民航陸空通話的識(shí)別,在此基礎(chǔ)上,采用深度神經(jīng)網(wǎng)絡(luò)、遷移學(xué)習(xí)和語種識(shí)別等技術(shù)來解決民航陸空通話語音識(shí)別中的關(guān)鍵問題,降低識(shí)別的錯(cuò)誤率。本文工作具體如下:1.中英文民航路空通話的語種識(shí)別研究。首先分析了語種識(shí)別的必要性,然后介紹語料庫構(gòu)建的方法,接著在分析比較語種識(shí)別相關(guān)的模型與方法的基礎(chǔ)上,選取適當(dāng)?shù)哪P秃头椒?提出適用于中英文民航陸空通話的語種識(shí)別方法,最后使用中英文民航陸空通話數(shù)據(jù)構(gòu)建了語種識(shí)別系統(tǒng)并進(jìn)行了測(cè)試和評(píng)估。2.基于GMM-HMM的中英文民航陸空通話語音識(shí)別研究。首先對(duì)民航陸空通話的數(shù)據(jù)進(jìn)行分析,然后在卡內(nèi)基梅隆大學(xué)CMUDICT字典和CE-DICT字典基礎(chǔ)上,半自動(dòng)地構(gòu)建了中文、英文民航陸空通話字典,接著采用GMM-HMM模型分別對(duì)民航陸空通話數(shù)據(jù)訓(xùn)練了聲學(xué)模型,最后構(gòu)建了中英文民航陸空通話語音識(shí)別系統(tǒng),并使用測(cè)試數(shù)據(jù)測(cè)試了中英文模型的識(shí)別率。3.基于深度學(xué)習(xí)的中英文民航陸空通話的語音識(shí)別研究。為了進(jìn)一步提高語音識(shí)別系統(tǒng)的識(shí)別率,以深度學(xué)習(xí)為基礎(chǔ),研究了DNN-HMM的聲學(xué)建模方法,提出了一種適用于中英文民航陸空通話的DNN網(wǎng)絡(luò)結(jié)構(gòu)并構(gòu)建了中英文民航陸空通話語音識(shí)別系統(tǒng),并進(jìn)行了實(shí)驗(yàn)和結(jié)果分析。4.基于遷移學(xué)習(xí)的跨語言深度神經(jīng)網(wǎng)絡(luò)聲學(xué)模型的構(gòu)建,以及基于深度學(xué)習(xí)的中英文民航陸空通話語音識(shí)別系統(tǒng)的搭建。針對(duì)中英文民航陸空通話語料數(shù)據(jù)量小的缺點(diǎn),分析比較常用的遷移學(xué)習(xí)方法,提出了一種新的遷移學(xué)習(xí)方法,將領(lǐng)域外知識(shí)遷移至語料資源少的民航陸空通話語音識(shí)別系統(tǒng)中,并在中英文民航陸空通話語音識(shí)別系統(tǒng)中進(jìn)行了實(shí)驗(yàn)和識(shí)別率的對(duì)比分析。
【學(xué)位授予單位】:南京航空航天大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2018
【分類號(hào)】:TN912.34;V355.1
【圖文】:

系統(tǒng)框架,梯度步


L( ) = ( ) 陣為: L( ) = ( ) oid 函數(shù)的參數(shù)向量 w,通常使用的最優(yōu)化算法有:梯度GS 等。由于 L-BFGS 算法不需要選擇梯度步長,而且具的優(yōu)點(diǎn),本文選用使用 L-BFGS算法進(jìn)行參數(shù)估計(jì)。析是 Kaldi。Kaldi 是一個(gè)自由、開源的語音識(shí)別工具庫[42],別系統(tǒng)、文檔和用于構(gòu)建整個(gè)識(shí)別系統(tǒng)的腳本和代碼,其持 GMM、HMM、DNN、Bottleneck、Tandem、RNN、要用于語音識(shí)別的研究,此外,它還被用于其他方面的關(guān)鍵詞搜索等。Kaldi的框架如圖 3.4所示。

拓?fù)浣Y(jié)構(gòu)圖,靜音,拓?fù)浣Y(jié)構(gòu),音素


在進(jìn)行聲學(xué)模型訓(xùn)練之前,先要選擇合適的聲學(xué)建模單元,常用的建模單元有:?jiǎn)卧~、和音素。其中,單詞的粒度最大,但其不能解決一詞多音的問題;而音素的粒度最小,適詞匯量較大的連續(xù)語音識(shí)別系統(tǒng),因此,文本針對(duì)民航陸空通話語料庫的特點(diǎn),選用音素聲學(xué)模型的建模單元。在進(jìn)行單音素模型的訓(xùn)練之前,首先要定義 HMM 的拓?fù)浣Y(jié)構(gòu)。經(jīng)過比較常用的拓?fù)浣Y(jié)文針對(duì)民航陸空通話數(shù)據(jù)集的特點(diǎn),對(duì)靜音音素 HMM 和非靜音音素 HMM 如使用了不同構(gòu),如圖 4.1 和圖 4.2 所示,其中非靜音音素包含 3 個(gè)發(fā)射狀態(tài)和一個(gè)啞狀態(tài),靜音音素 5個(gè)狀態(tài)和啞狀態(tài),啞狀態(tài)又稱為引出狀態(tài),不產(chǎn)生觀測(cè)矢量,只用于連接到下一個(gè)音素圖 4.1 非靜音音素的拓?fù)浣Y(jié)構(gòu)

拓?fù)浣Y(jié)構(gòu)圖,拓?fù)浣Y(jié)構(gòu),音素,陸空


南京航空航天大學(xué)全日制專業(yè)學(xué)位碩士學(xué)位論文2 單音素模型訓(xùn)練進(jìn)行聲學(xué)模型訓(xùn)練之前,先要選擇合適的聲學(xué)建模單元,常用的建模單元有:?jiǎn)嗡。其中,單詞的粒度最大,但其不能解決一詞多音的問題;而音素的粒度最小量較大的連續(xù)語音識(shí)別系統(tǒng),因此,文本針對(duì)民航陸空通話語料庫的特點(diǎn),選用模型的建模單元。進(jìn)行單音素模型的訓(xùn)練之前,首先要定義 HMM 的拓?fù)浣Y(jié)構(gòu)。經(jīng)過比較常用的拓對(duì)民航陸空通話數(shù)據(jù)集的特點(diǎn),對(duì)靜音音素 HMM 和非靜音音素 HMM 如使用了如圖 4.1 和圖 4.2 所示,其中非靜音音素包含 3 個(gè)發(fā)射狀態(tài)和一個(gè)啞狀態(tài),靜音狀態(tài)和啞狀態(tài),啞狀態(tài)又稱為引出狀態(tài),不產(chǎn)生觀測(cè)矢量,只用于連接到下一個(gè)

【參考文獻(xiàn)】

相關(guān)期刊論文 前7條

1 袁偉偉;胡軍;劉萬鳳;;空管模擬訓(xùn)練中指令的語音識(shí)別與合成技術(shù)研究[J];電子設(shè)計(jì)工程;2013年06期

2 王光艷;趙曉群;王霞;;基于MATLAB GUI的語音信號(hào)特征提取系統(tǒng)設(shè)計(jì)[J];河北工業(yè)大學(xué)學(xué)報(bào);2010年04期

3 王安娜;王勤萬;劉俊芳;袁文靜;;改進(jìn)的語音特征提取方法及其應(yīng)用[J];計(jì)算機(jī)工程;2008年05期

4 劉敬偉;肖熙;;實(shí)用環(huán)境語音識(shí)別魯棒性技術(shù)研究與展望[J];計(jì)算機(jī)工程與應(yīng)用;2006年24期

5 彭志勇;王丹霞;;語音識(shí)別技術(shù)在DRS雷達(dá)模擬機(jī)系統(tǒng)中的實(shí)現(xiàn)[J];中國民航飛行學(xué)院學(xué)報(bào);2006年02期

6 揭克堅(jiān),張建偉,游志勝;DRS航管雷達(dá)模擬機(jī)自動(dòng)機(jī)長語音技術(shù)研究[J];計(jì)算機(jī)應(yīng)用;2001年06期

7 吳土星;;飛行安全與空中交通管制指令[J];民航經(jīng)濟(jì)與技術(shù);1994年04期

相關(guān)碩士學(xué)位論文 前5條

1 張志輝;基于民航陸空對(duì)話的語音識(shí)別關(guān)鍵技術(shù)研究[D];中國民航大學(xué);2017年

2 劉萬鳳;語音指令識(shí)別在陸空通話(英語)中的應(yīng)用技術(shù)研究[D];南京航空航天大學(xué);2012年

3 夏拓;基于HTK的嵌入式語音識(shí)別系統(tǒng)設(shè)計(jì)與優(yōu)化[D];華南理工大學(xué);2012年

4 彭志勇;語音識(shí)別功能在DRS2000雷達(dá)模擬機(jī)系統(tǒng)中的設(shè)計(jì)與實(shí)現(xiàn)[D];四川大學(xué);2006年

5 鄒榮;大詞匯量連續(xù)語音識(shí)別系統(tǒng)中統(tǒng)計(jì)語言模型的研究[D];北京郵電大學(xué);2006年



本文編號(hào):2781661

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/wltx/2781661.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶f6096***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com