天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 信息工程論文 >

語音識別置信度特征提取算法研究

發(fā)布時間:2016-09-15 22:00

  本文關(guān)鍵詞:基于混淆網(wǎng)絡(luò)和輔助信息的語音識別技術(shù)研究,由筆耕文化傳播整理發(fā)布。


《北京郵電大學(xué)》 2010年

語音識別置信度特征提取算法研究

國玉晶  

【摘要】: 大規(guī)模連續(xù)語音識別的研究已經(jīng)進行了二十多年,雖已取得了顯著進展,但距離廣泛應(yīng)用還有相當(dāng)?shù)木嚯x。在克服識別算法本身缺陷、追求識別性能提升的過程中,研究者們逐漸引入了置信度的概念,用它來衡量語音識別系統(tǒng)所作決策的可信程度。近年來,語音識別置信度在語音錯誤檢測與錯誤糾正,無監(jiān)督和半監(jiān)督訓(xùn)練、多遍搜索技術(shù)和語料庫中錯誤語料甄選等應(yīng)用中都發(fā)揮了非常重要的作用。 傳統(tǒng)的語音識別置信度標(biāo)注基于不同置信特征或者特征組合進行分類判決,目前常使用的置信特征主要來源于解碼信息。但是,方面現(xiàn)有置信度特征對解碼信息的挖掘仍局限于孤立和靜態(tài),而忽略了詞與周圍環(huán)境之間的關(guān)系;另一方面,目前聲學(xué)特征仍占主要地位,而人類聽覺實驗表明,人在進行語音理解時,大約有30%的信息來自于語法、語義等知識的指導(dǎo)。因此,在置信度特征提取中,如何挖掘出詞與環(huán)境之間的關(guān)系,同時提煉出詞的語法和語義特征,從而提高識別后處理性能,是一個非常值得研究的問題。 基于上述目的,本文在搭建傳統(tǒng)語音識別置信度標(biāo)記系統(tǒng)的基礎(chǔ)上,提出了兩種新的置信度特征,一是環(huán)境特征,分為上下文環(huán)境、動態(tài)環(huán)境、句全局環(huán)境三類,通過對解碼信息的再加工,從空間與時間角度較全面地描述了詞與環(huán)境之間的關(guān)系;二是基于主題相似性的語義層置信特征提取算法TSS (Topic Similarity based Semantic confidence feature extraction algorithm),通過主題模型LDA(Latent Dirichlet Allocation)計算得到識別結(jié)果中詞的主題分布及其上下文的主題分布,并將二者之間的主題相似性作為詞的語義置信特征。實驗表明,本文提出的兩種特征深入挖掘了解碼層的有效信息,又增加了置信特征的信息來源,與解碼層置信特征進行組合后能有效地提高置信度標(biāo)注的精度。

【關(guān)鍵詞】:
【學(xué)位授予單位】:北京郵電大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2010
【分類號】:TN912.34
【目錄】:

  • 摘要4-5
  • ABSTRACT5-11
  • 第一章 緒論11-17
  • 1.1 什么是語音識別的置信度11
  • 1.2 研究語音識別置信度的意義11-12
  • 1.3 國內(nèi)外相關(guān)研究現(xiàn)狀12-14
  • 1.3.1 傳統(tǒng)的置信度特征12-14
  • 1.3.2 基于高層語義信息的置信度特征14
  • 1.4 論文的研究內(nèi)容14-16
  • 1.4.1 環(huán)境特征14-15
  • 1.4.2 基于主題相似性的語義層置信特征15-16
  • 1.5 論文的組織結(jié)構(gòu)16-17
  • 第二章 大規(guī)模連續(xù)語音識別原理17-32
  • 2.1 引言17-27
  • 2.1.1 聲學(xué)特征提取17-19
  • 2.1.2 隱馬爾可夫模型19-27
  • 2.2 語言模型27-32
  • 2.2.1 n-gram語言模型27-28
  • 2.2.2 建立音素級語言模型28-29
  • 2.2.3 穩(wěn)健的語言模型29-32
  • 第三章 基于混淆網(wǎng)絡(luò)的置信度標(biāo)記基線系統(tǒng)32-48
  • 3.1 引言32
  • 3.2 音素網(wǎng)絡(luò)lattice32-36
  • 3.2.1 lattice的結(jié)構(gòu)33-34
  • 3.2.2 基于lattice的關(guān)鍵詞后驗概率估計34-36
  • 3.3 混淆網(wǎng)絡(luò)mesh36-41
  • 3.3.1 混淆網(wǎng)絡(luò)概述36-39
  • 3.3.2 基于lattice的混淆網(wǎng)絡(luò)生成方法39-41
  • 3.4 基于SVM的置信度標(biāo)記41-48
  • 3.4.1 SVM支撐向量機41-45
  • 3.4.2 基于SVM的置信度標(biāo)記與評價標(biāo)準(zhǔn)45-48
  • 第四章 環(huán)境特征48-53
  • 4.1 引言48
  • 4.2 環(huán)境特征48-50
  • 4.2.1 上下文特征48-49
  • 4.2.2 動態(tài)特征49-50
  • 4.2.3 句全局特征50
  • 4.3 實驗設(shè)計50-51
  • 4.3.1 系統(tǒng)框架50
  • 4.3.2 實驗數(shù)據(jù)50-51
  • 4.4 實驗結(jié)果51-52
  • 4.5 結(jié)論與展望52-53
  • 第五章 基于主題相似度的語義層特征53-66
  • 5.1 引言53
  • 5.2 LDA模型53-55
  • 5.3 基于主題相似性的語義層特征提取算法55-58
  • 5.3.1 詞的主題分布56
  • 5.3.2 上下文主題分布56-57
  • 5.3.3 主題相似性57-58
  • 5.4 實驗設(shè)計58-63
  • 5.4.1 系統(tǒng)框架58
  • 5.4.2 實驗數(shù)據(jù)58-59
  • 5.4.3 基于主題相似性的語義層置信特征提取算法參數(shù)選擇59-63
  • 5.5 實驗結(jié)果63-64
  • 5.6 結(jié)論與展望64-66
  • 第六章 總結(jié)與展望66-68
  • 參考文獻68-71
  • 致謝71-72
  • 攻讀碩士學(xué)位期間發(fā)表的論文72
  • 下載全文 更多同類文獻

    CAJ全文下載

    (如何獲取全文? 歡迎:購買知網(wǎng)充值卡、在線充值、在線咨詢)

    CAJViewer閱讀器支持CAJ、PDF文件格式


    【引證文獻】

    中國碩士學(xué)位論文全文數(shù)據(jù)庫 前1條

    1 陳國興;基于音節(jié)片Lattice的語音檢索關(guān)鍵問題研究[D];哈爾濱工程大學(xué);2012年

    【同被引文獻】

    中國期刊全文數(shù)據(jù)庫 前10條

    1 常凱;;基于TF*IDF垃圾郵件過濾改進算法的研究[J];電腦知識與技術(shù);2010年25期

    2 張仰森,徐波,曹元大;自然語言處理中的語言模型及其比較研究[J];廣西師范大學(xué)學(xué)報(自然科學(xué)版);2003年01期

    3 饒耀全;吳小培;呂釗;;基于HTK的漢語語音售票系統(tǒng)的設(shè)計與實現(xiàn)[J];工業(yè)控制計算機;2010年10期

    4 王歡良;韓紀(jì)慶;;基于Lattice分段的高質(zhì)量混淆網(wǎng)絡(luò)快速生成方法[J];高技術(shù)通訊;2010年05期

    5 孫成立;;混淆網(wǎng)絡(luò)在音頻文檔檢索系統(tǒng)中的應(yīng)用研究[J];計算機工程與應(yīng)用;2010年28期

    6 吳麗華;羅云鋒;張宏斌;;信息檢索模型及相關(guān)性算法的研究[J];情報雜志;2006年12期

    7 孟莎;余鵬;Frank Seide;劉加;;基于后驗概率詞格的漢語自然對話語音索引[J];清華大學(xué)學(xué)報(自然科學(xué)版);2008年S1期

    8 吳斌;劉剛;郭軍;;漢語大詞匯量連續(xù)語音識別中混淆網(wǎng)絡(luò)算法的研究[J];四川大學(xué)學(xué)報(工程科學(xué)版);2007年S1期

    9 鄭鐵然;韓紀(jì)慶;李海洋;;基于詞片的語言模型及在漢語語音檢索中的應(yīng)用[J];通信學(xué)報;2009年03期

    10 石現(xiàn)峰;張學(xué)智;張峰;;基于HTK的語音識別系統(tǒng)設(shè)計[J];計算機技術(shù)與發(fā)展;2006年10期

    中國博士學(xué)位論文全文數(shù)據(jù)庫 前2條

    1 王歡良;基于混淆網(wǎng)絡(luò)和輔助信息的語音識別技術(shù)研究[D];哈爾濱工業(yè)大學(xué);2007年

    2 鄭鐵然;基于音節(jié)網(wǎng)格的漢語語音文檔檢索方法研究[D];哈爾濱工業(yè)大學(xué);2008年

    中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條

    1 高運霞;基于網(wǎng)格的中文語音文件檢索技術(shù)的研究[D];哈爾濱工程大學(xué);2010年

    2 陳晶;基于詞片網(wǎng)格的語音文檔主題分類[D];哈爾濱工程大學(xué);2010年

    3 劉建舟;術(shù)語自動抽取系統(tǒng)的設(shè)計及關(guān)鍵技術(shù)研究[D];華中師范大學(xué);2004年

    4 侯周國;基于HMM的漢語數(shù)字語音識別系統(tǒng)研究[D];湖南師范大學(xué);2006年

    5 鄭毅;文本挖掘及其在文本檢索中的應(yīng)用[D];中國科學(xué)院研究生院(計算技術(shù)研究所);2002年

    6 蘇敏;一種基于HMM和RBF網(wǎng)絡(luò)混合的語音識別算法研究[D];蘭州理工大學(xué);2007年

    7 劉洋;基于最佳狀態(tài)數(shù)的漢語數(shù)字語音識別系統(tǒng)的研究與實現(xiàn)[D];北京郵電大學(xué);2008年

    8 項勇;基于DSP和HMM的語音識別系統(tǒng)設(shè)計與實現(xiàn)[D];武漢科技大學(xué);2008年

    9 李海洋;基于詞片和Lattice的漢語語音檢索技術(shù)研究[D];哈爾濱工業(yè)大學(xué);2007年

    10 蔣斌;基于停用詞處理的漢語語音檢索方法[D];哈爾濱工業(yè)大學(xué);2008年

    【相似文獻】

    中國期刊全文數(shù)據(jù)庫 前10條

    1 白寶興;管道內(nèi)表面質(zhì)量檢測系統(tǒng)設(shè)計[J];中國圖象圖形學(xué)報;1998年06期

    2 張亮;郭桂蓉;莊釗文;何松華;馬莉波;;雷達(dá)目標(biāo)高分辨距離像數(shù)據(jù)預(yù)處理方法研究[J];電子學(xué)報;1998年06期

    3 沈同圣;任建存;馮亞林;周曉東;;紅外成像制導(dǎo)中目標(biāo)識別方法探討[J];紅外與激光工程;1998年05期

    4 劉守生,丁勇,胡壽松;一種特征提取新方法[J];信號處理;1999年S1期

    5 李平,蔣振剛;神經(jīng)網(wǎng)絡(luò)對手寫字符識別特征的提取[J];長春光學(xué)精密機械學(xué)院學(xué)報;2000年02期

    6 孟國強;基于車輛牌照識別系統(tǒng)字符的特征提取方法研究[J];河南科學(xué);2003年06期

    7 邵云生,徐國華;雷達(dá)艦船目標(biāo)的混合特征提取算法的設(shè)計與實現(xiàn)[J];艦船電子對抗;2004年02期

    8 崔晨旸,石教英;三維模型檢索中的特征提取技術(shù)綜述[J];計算機輔助設(shè)計與圖形學(xué)學(xué)報;2004年07期

    9 張曉東,陳鋒;基于非線性回歸的自適應(yīng)特征提取算法[J];阜陽師范學(xué)院學(xué)報(自然科學(xué)版);2004年02期

    10 夏曉清,馮偉,趙榮椿;CPODW數(shù)字水印技術(shù)中的圖像內(nèi)容提取方法[J];計算機應(yīng)用;2004年S2期

    中國重要會議論文全文數(shù)據(jù)庫 前10條

    1 林土勝;賴聲禮;;視網(wǎng)膜血管特征提取的拆支跟蹤法[A];1999年中國神經(jīng)網(wǎng)絡(luò)與信號處理學(xué)術(shù)會議論文集[C];1999年

    2 錢小聰;鄭寶玉;穆明鑫;;神經(jīng)網(wǎng)絡(luò)聯(lián)機手寫簽名驗證[A];第十屆全國信號處理學(xué)術(shù)年會(CCSP-2001)論文集[C];2001年

    3 張羽;汪源源;王威琪;余建國;林繼耕;;狹窄血管多普勒信號特征提取的實驗研究[A];21世紀(jì)醫(yī)學(xué)工程學(xué)術(shù)研討會論文摘要匯編[C];2001年

    4 柳林霞;陳杰;竇麗華;;不變矩理論及其在目標(biāo)識別中的應(yīng)用[A];2002中國控制與決策學(xué)術(shù)年會論文集[C];2002年

    5 楊日杰;施建禮;林洪文;;一種雷達(dá)視頻回波特征提取方法研究[A];中國航空學(xué)會信號與信息處理專業(yè)全國第八屆學(xué)術(shù)會議論文集[C];2004年

    6 代克杰;張紅梅;盛賽斌;;基于BP網(wǎng)絡(luò)的故障特征提取方法研究[A];2004中國控制與決策學(xué)術(shù)年會論文集[C];2004年

    7 何新;史迎春;周獻中;;一種基于獨立分量分析的音頻分類方法[A];第一屆建立和諧人機環(huán)境聯(lián)合學(xué)術(shù)會議(HHME2005)論文集[C];2005年

    8 朱曉霞;孫同景;陳桂友;;基于支持向量機理論的兩級指紋分類實現(xiàn)方法[A];第16屆中國過程控制學(xué)術(shù)年會暨第4屆全國故障診斷與安全性學(xué)術(shù)會議論文集[C];2005年

    9 范海寧;郭英;吳劍鋒;陳志武;;基于小波包分解的聲信號特征提取方法[A];信號與信息處理技術(shù)第三屆信號與信息處理全國聯(lián)合學(xué)術(shù)會議論文集[C];2004年

    10 郗長青;鄭建明;李言;羅杰;;基于小波包分解的鉆頭磨損特征提取[A];制造技術(shù)自動化學(xué)術(shù)會議論文集[C];2004年

    中國重要報紙全文數(shù)據(jù)庫 前10條

    1 燕海霞;王憶勤;李福鳳;[N];中國醫(yī)藥報;2005年

    2 沈占鋒;[N];計算機世界;2006年

    3 王竣;[N];中國醫(yī)藥報;2007年

    4 北京數(shù)碼空間信息技術(shù)有限公司技術(shù)總監(jiān) 劉斌;[N];計算機世界;2000年

    5 孫哲南 譚鐵牛;[N];計算機世界;2007年

    6 上海 高博;[N];電腦報;2008年

    7 記者 何騰江 通訊員 周匯成;[N];中山日報;2008年

    8 本報記者 劉洪宇;[N];遼寧日報;2008年

    9 林木樹;[N];人民郵電;2004年

    10 中科院自動化所 何鵬 陶建華 譚鐵牛;[N];計算機世界;2005年

    中國博士學(xué)位論文全文數(shù)據(jù)庫 前10條

    1 馮坤;基于內(nèi)積變換的機械故障特征提取原理與早期識別方法研究[D];北京化工大學(xué);2012年

    2 張旗;基于屬性的圖像分類研究[D];大連海事大學(xué);2005年

    3 張立福;通用光譜模式分解算法及植被指數(shù)的建立[D];武漢大學(xué);2005年

    4 蘇彩紅;墻地磚質(zhì)量自動檢測技術(shù)的研究[D];華南理工大學(xué);2004年

    5 宋余慶;醫(yī)學(xué)圖像數(shù)據(jù)挖掘若干技術(shù)研究[D];東南大學(xué);2005年

    6 宋晴;基于液滴分析技術(shù)和液滴指紋圖的液體識別方法的研究[D];天津大學(xué);2005年

    7 吳婷;自發(fā)腦電腦機接口模式識別關(guān)鍵技術(shù)與實驗研究[D];上海交通大學(xué);2008年

    8 孫真真;基于光學(xué)區(qū)雷達(dá)目標(biāo)二維像的目標(biāo)散射特征提取的理論及方法研究[D];中國人民解放軍國防科學(xué)技術(shù)大學(xué);2001年

    9 武子玉;礦物近紅外光譜信息提取及應(yīng)用研究[D];吉林大學(xué);2005年

    10 王承;基于神經(jīng)網(wǎng)絡(luò)的模擬電路故障診斷方法研究[D];電子科技大學(xué);2005年

    中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條

    1 國玉晶;語音識別置信度特征提取算法研究[D];北京郵電大學(xué);2010年

    2 曾紅梅;情緒圖片視覺誘發(fā)EEG特征提取與分析[D];天津大學(xué);2012年

    3 雷自力;基于Pro/E的三維零件參數(shù)化建模和特征提取研究[D];華中科技大學(xué);2011年

    4 林少波;中文文本分類特征提取方法的研究與實現(xiàn)[D];重慶大學(xué);2011年

    5 黃健;履帶式車輛微多普勒效應(yīng)與特征提取[D];國防科學(xué)技術(shù)大學(xué);2009年

    6 趙蕾蕾;基于詞和基本短語模式的特征提取方法[D];河北大學(xué);2009年

    7 欒嵐;基于機理模型判據(jù)的圖像中微弱特征提取方法研究及應(yīng)用[D];東北大學(xué);2009年

    8 王菲;面向肺部CAD的特征提取、選擇及分類方法研究[D];東北大學(xué);2009年

    9 鄭睿;藻類細(xì)胞圖像的特征提取與分類方法研究[D];杭州電子科技大學(xué);2009年

    10 李仁杰;高分辨率SAR圖像目標(biāo)三維特征提取與建模[D];國防科學(xué)技術(shù)大學(xué);2010年


      本文關(guān)鍵詞:基于混淆網(wǎng)絡(luò)和輔助信息的語音識別技術(shù)研究,由筆耕文化傳播整理發(fā)布。

    ,

    本文編號:116056

    資料下載
    論文發(fā)表

    本文鏈接:http://www.sikaile.net/kejilunwen/xinxigongchenglunwen/116056.html


    Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

    版權(quán)申明:資料由用戶bdba0***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com