語音識別置信度特征提取算法研究
本文關(guān)鍵詞:基于混淆網(wǎng)絡(luò)和輔助信息的語音識別技術(shù)研究,由筆耕文化傳播整理發(fā)布。
《北京郵電大學(xué)》 2010年
語音識別置信度特征提取算法研究
國玉晶
【摘要】: 大規(guī)模連續(xù)語音識別的研究已經(jīng)進行了二十多年,雖已取得了顯著進展,但距離廣泛應(yīng)用還有相當(dāng)?shù)木嚯x。在克服識別算法本身缺陷、追求識別性能提升的過程中,研究者們逐漸引入了置信度的概念,用它來衡量語音識別系統(tǒng)所作決策的可信程度。近年來,語音識別置信度在語音錯誤檢測與錯誤糾正,無監(jiān)督和半監(jiān)督訓(xùn)練、多遍搜索技術(shù)和語料庫中錯誤語料甄選等應(yīng)用中都發(fā)揮了非常重要的作用。 傳統(tǒng)的語音識別置信度標(biāo)注基于不同置信特征或者特征組合進行分類判決,目前常使用的置信特征主要來源于解碼信息。但是,方面現(xiàn)有置信度特征對解碼信息的挖掘仍局限于孤立和靜態(tài),而忽略了詞與周圍環(huán)境之間的關(guān)系;另一方面,目前聲學(xué)特征仍占主要地位,而人類聽覺實驗表明,人在進行語音理解時,大約有30%的信息來自于語法、語義等知識的指導(dǎo)。因此,在置信度特征提取中,如何挖掘出詞與環(huán)境之間的關(guān)系,同時提煉出詞的語法和語義特征,從而提高識別后處理性能,是一個非常值得研究的問題。 基于上述目的,本文在搭建傳統(tǒng)語音識別置信度標(biāo)記系統(tǒng)的基礎(chǔ)上,提出了兩種新的置信度特征,一是環(huán)境特征,分為上下文環(huán)境、動態(tài)環(huán)境、句全局環(huán)境三類,通過對解碼信息的再加工,從空間與時間角度較全面地描述了詞與環(huán)境之間的關(guān)系;二是基于主題相似性的語義層置信特征提取算法TSS (Topic Similarity based Semantic confidence feature extraction algorithm),通過主題模型LDA(Latent Dirichlet Allocation)計算得到識別結(jié)果中詞的主題分布及其上下文的主題分布,并將二者之間的主題相似性作為詞的語義置信特征。實驗表明,本文提出的兩種特征深入挖掘了解碼層的有效信息,又增加了置信特征的信息來源,與解碼層置信特征進行組合后能有效地提高置信度標(biāo)注的精度。
【關(guān)鍵詞】:
【學(xué)位授予單位】:北京郵電大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2010
【分類號】:TN912.34
【目錄】:
下載全文 更多同類文獻
CAJ全文下載
(如何獲取全文? 歡迎:購買知網(wǎng)充值卡、在線充值、在線咨詢)
CAJViewer閱讀器支持CAJ、PDF文件格式
【引證文獻】
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前1條
1 陳國興;基于音節(jié)片Lattice的語音檢索關(guān)鍵問題研究[D];哈爾濱工程大學(xué);2012年
【同被引文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 常凱;;基于TF*IDF垃圾郵件過濾改進算法的研究[J];電腦知識與技術(shù);2010年25期
2 張仰森,徐波,曹元大;自然語言處理中的語言模型及其比較研究[J];廣西師范大學(xué)學(xué)報(自然科學(xué)版);2003年01期
3 饒耀全;吳小培;呂釗;;基于HTK的漢語語音售票系統(tǒng)的設(shè)計與實現(xiàn)[J];工業(yè)控制計算機;2010年10期
4 王歡良;韓紀(jì)慶;;基于Lattice分段的高質(zhì)量混淆網(wǎng)絡(luò)快速生成方法[J];高技術(shù)通訊;2010年05期
5 孫成立;;混淆網(wǎng)絡(luò)在音頻文檔檢索系統(tǒng)中的應(yīng)用研究[J];計算機工程與應(yīng)用;2010年28期
6 吳麗華;羅云鋒;張宏斌;;信息檢索模型及相關(guān)性算法的研究[J];情報雜志;2006年12期
7 孟莎;余鵬;Frank Seide;劉加;;基于后驗概率詞格的漢語自然對話語音索引[J];清華大學(xué)學(xué)報(自然科學(xué)版);2008年S1期
8 吳斌;劉剛;郭軍;;漢語大詞匯量連續(xù)語音識別中混淆網(wǎng)絡(luò)算法的研究[J];四川大學(xué)學(xué)報(工程科學(xué)版);2007年S1期
9 鄭鐵然;韓紀(jì)慶;李海洋;;基于詞片的語言模型及在漢語語音檢索中的應(yīng)用[J];通信學(xué)報;2009年03期
10 石現(xiàn)峰;張學(xué)智;張峰;;基于HTK的語音識別系統(tǒng)設(shè)計[J];計算機技術(shù)與發(fā)展;2006年10期
中國博士學(xué)位論文全文數(shù)據(jù)庫 前2條
1 王歡良;基于混淆網(wǎng)絡(luò)和輔助信息的語音識別技術(shù)研究[D];哈爾濱工業(yè)大學(xué);2007年
2 鄭鐵然;基于音節(jié)網(wǎng)格的漢語語音文檔檢索方法研究[D];哈爾濱工業(yè)大學(xué);2008年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 高運霞;基于網(wǎng)格的中文語音文件檢索技術(shù)的研究[D];哈爾濱工程大學(xué);2010年
2 陳晶;基于詞片網(wǎng)格的語音文檔主題分類[D];哈爾濱工程大學(xué);2010年
3 劉建舟;術(shù)語自動抽取系統(tǒng)的設(shè)計及關(guān)鍵技術(shù)研究[D];華中師范大學(xué);2004年
4 侯周國;基于HMM的漢語數(shù)字語音識別系統(tǒng)研究[D];湖南師范大學(xué);2006年
5 鄭毅;文本挖掘及其在文本檢索中的應(yīng)用[D];中國科學(xué)院研究生院(計算技術(shù)研究所);2002年
6 蘇敏;一種基于HMM和RBF網(wǎng)絡(luò)混合的語音識別算法研究[D];蘭州理工大學(xué);2007年
7 劉洋;基于最佳狀態(tài)數(shù)的漢語數(shù)字語音識別系統(tǒng)的研究與實現(xiàn)[D];北京郵電大學(xué);2008年
8 項勇;基于DSP和HMM的語音識別系統(tǒng)設(shè)計與實現(xiàn)[D];武漢科技大學(xué);2008年
9 李海洋;基于詞片和Lattice的漢語語音檢索技術(shù)研究[D];哈爾濱工業(yè)大學(xué);2007年
10 蔣斌;基于停用詞處理的漢語語音檢索方法[D];哈爾濱工業(yè)大學(xué);2008年
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 白寶興;管道內(nèi)表面質(zhì)量檢測系統(tǒng)設(shè)計[J];中國圖象圖形學(xué)報;1998年06期
2 張亮;郭桂蓉;莊釗文;何松華;馬莉波;;雷達(dá)目標(biāo)高分辨距離像數(shù)據(jù)預(yù)處理方法研究[J];電子學(xué)報;1998年06期
3 沈同圣;任建存;馮亞林;周曉東;;紅外成像制導(dǎo)中目標(biāo)識別方法探討[J];紅外與激光工程;1998年05期
4 劉守生,丁勇,胡壽松;一種特征提取新方法[J];信號處理;1999年S1期
5 李平,蔣振剛;神經(jīng)網(wǎng)絡(luò)對手寫字符識別特征的提取[J];長春光學(xué)精密機械學(xué)院學(xué)報;2000年02期
6 孟國強;基于車輛牌照識別系統(tǒng)字符的特征提取方法研究[J];河南科學(xué);2003年06期
7 邵云生,徐國華;雷達(dá)艦船目標(biāo)的混合特征提取算法的設(shè)計與實現(xiàn)[J];艦船電子對抗;2004年02期
8 崔晨旸,石教英;三維模型檢索中的特征提取技術(shù)綜述[J];計算機輔助設(shè)計與圖形學(xué)學(xué)報;2004年07期
9 張曉東,陳鋒;基于非線性回歸的自適應(yīng)特征提取算法[J];阜陽師范學(xué)院學(xué)報(自然科學(xué)版);2004年02期
10 夏曉清,馮偉,趙榮椿;CPODW數(shù)字水印技術(shù)中的圖像內(nèi)容提取方法[J];計算機應(yīng)用;2004年S2期
中國重要會議論文全文數(shù)據(jù)庫 前10條
1 林土勝;賴聲禮;;視網(wǎng)膜血管特征提取的拆支跟蹤法[A];1999年中國神經(jīng)網(wǎng)絡(luò)與信號處理學(xué)術(shù)會議論文集[C];1999年
2 錢小聰;鄭寶玉;穆明鑫;;神經(jīng)網(wǎng)絡(luò)聯(lián)機手寫簽名驗證[A];第十屆全國信號處理學(xué)術(shù)年會(CCSP-2001)論文集[C];2001年
3 張羽;汪源源;王威琪;余建國;林繼耕;;狹窄血管多普勒信號特征提取的實驗研究[A];21世紀(jì)醫(yī)學(xué)工程學(xué)術(shù)研討會論文摘要匯編[C];2001年
4 柳林霞;陳杰;竇麗華;;不變矩理論及其在目標(biāo)識別中的應(yīng)用[A];2002中國控制與決策學(xué)術(shù)年會論文集[C];2002年
5 楊日杰;施建禮;林洪文;;一種雷達(dá)視頻回波特征提取方法研究[A];中國航空學(xué)會信號與信息處理專業(yè)全國第八屆學(xué)術(shù)會議論文集[C];2004年
6 代克杰;張紅梅;盛賽斌;;基于BP網(wǎng)絡(luò)的故障特征提取方法研究[A];2004中國控制與決策學(xué)術(shù)年會論文集[C];2004年
7 何新;史迎春;周獻中;;一種基于獨立分量分析的音頻分類方法[A];第一屆建立和諧人機環(huán)境聯(lián)合學(xué)術(shù)會議(HHME2005)論文集[C];2005年
8 朱曉霞;孫同景;陳桂友;;基于支持向量機理論的兩級指紋分類實現(xiàn)方法[A];第16屆中國過程控制學(xué)術(shù)年會暨第4屆全國故障診斷與安全性學(xué)術(shù)會議論文集[C];2005年
9 范海寧;郭英;吳劍鋒;陳志武;;基于小波包分解的聲信號特征提取方法[A];信號與信息處理技術(shù)第三屆信號與信息處理全國聯(lián)合學(xué)術(shù)會議論文集[C];2004年
10 郗長青;鄭建明;李言;羅杰;;基于小波包分解的鉆頭磨損特征提取[A];制造技術(shù)自動化學(xué)術(shù)會議論文集[C];2004年
中國重要報紙全文數(shù)據(jù)庫 前10條
1 燕海霞;王憶勤;李福鳳;[N];中國醫(yī)藥報;2005年
2 沈占鋒;[N];計算機世界;2006年
3 王竣;[N];中國醫(yī)藥報;2007年
4 北京數(shù)碼空間信息技術(shù)有限公司技術(shù)總監(jiān) 劉斌;[N];計算機世界;2000年
5 孫哲南 譚鐵牛;[N];計算機世界;2007年
6 上海 高博;[N];電腦報;2008年
7 記者 何騰江 通訊員 周匯成;[N];中山日報;2008年
8 本報記者 劉洪宇;[N];遼寧日報;2008年
9 林木樹;[N];人民郵電;2004年
10 中科院自動化所 何鵬 陶建華 譚鐵牛;[N];計算機世界;2005年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 馮坤;基于內(nèi)積變換的機械故障特征提取原理與早期識別方法研究[D];北京化工大學(xué);2012年
2 張旗;基于屬性的圖像分類研究[D];大連海事大學(xué);2005年
3 張立福;通用光譜模式分解算法及植被指數(shù)的建立[D];武漢大學(xué);2005年
4 蘇彩紅;墻地磚質(zhì)量自動檢測技術(shù)的研究[D];華南理工大學(xué);2004年
5 宋余慶;醫(yī)學(xué)圖像數(shù)據(jù)挖掘若干技術(shù)研究[D];東南大學(xué);2005年
6 宋晴;基于液滴分析技術(shù)和液滴指紋圖的液體識別方法的研究[D];天津大學(xué);2005年
7 吳婷;自發(fā)腦電腦機接口模式識別關(guān)鍵技術(shù)與實驗研究[D];上海交通大學(xué);2008年
8 孫真真;基于光學(xué)區(qū)雷達(dá)目標(biāo)二維像的目標(biāo)散射特征提取的理論及方法研究[D];中國人民解放軍國防科學(xué)技術(shù)大學(xué);2001年
9 武子玉;礦物近紅外光譜信息提取及應(yīng)用研究[D];吉林大學(xué);2005年
10 王承;基于神經(jīng)網(wǎng)絡(luò)的模擬電路故障診斷方法研究[D];電子科技大學(xué);2005年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 國玉晶;語音識別置信度特征提取算法研究[D];北京郵電大學(xué);2010年
2 曾紅梅;情緒圖片視覺誘發(fā)EEG特征提取與分析[D];天津大學(xué);2012年
3 雷自力;基于Pro/E的三維零件參數(shù)化建模和特征提取研究[D];華中科技大學(xué);2011年
4 林少波;中文文本分類特征提取方法的研究與實現(xiàn)[D];重慶大學(xué);2011年
5 黃健;履帶式車輛微多普勒效應(yīng)與特征提取[D];國防科學(xué)技術(shù)大學(xué);2009年
6 趙蕾蕾;基于詞和基本短語模式的特征提取方法[D];河北大學(xué);2009年
7 欒嵐;基于機理模型判據(jù)的圖像中微弱特征提取方法研究及應(yīng)用[D];東北大學(xué);2009年
8 王菲;面向肺部CAD的特征提取、選擇及分類方法研究[D];東北大學(xué);2009年
9 鄭睿;藻類細(xì)胞圖像的特征提取與分類方法研究[D];杭州電子科技大學(xué);2009年
10 李仁杰;高分辨率SAR圖像目標(biāo)三維特征提取與建模[D];國防科學(xué)技術(shù)大學(xué);2010年
本文關(guān)鍵詞:基于混淆網(wǎng)絡(luò)和輔助信息的語音識別技術(shù)研究,由筆耕文化傳播整理發(fā)布。
,本文編號:116056
本文鏈接:http://www.sikaile.net/kejilunwen/xinxigongchenglunwen/116056.html