基于隱藏單元條件隨機場的多知識源融合改進自動語音識別置信度
發(fā)布時間:2018-05-27 11:27
本文選題:語音識別 + 置信度估計; 參考:《電子與信息學報》2014年08期
【摘要】:鑒于自動語音識別(ASR)中置信度估計困難的問題,該文提出一種基于多知識源融合的策略來提高置信度的鑒別能力。具體做法是,首先選擇關于識別結(jié)果的聲學層、語言層和語義層等不同層次的信息,然后通過實驗確定這些信息不同的組合方式,并以此為特征在隱藏單元條件隨機場(Hidden-units Conditional Random Fields,HuCRFs)框架下計算識別結(jié)果的條件概率。最后將HuCRFs條件概率作為語音識別結(jié)果置信度的新的估計。實驗首先證明了HuCRFs條件概率是比歸一化的網(wǎng)格后驗概率鑒別能力更強的一種置信度估計方法。同時基于HuCRFs條件概率置信度,對解碼器一遍識別得到的網(wǎng)格重新搜索最佳候選序列,取得了相對一遍識別最佳候選序列絕對近2%的字錯誤率(CER)下降。同時,該文也對比了基于HuCRFs條件概率搜索的最佳候選序列和基于長語言模型網(wǎng)格重估的最佳候選序列的性能,進一步證明了使用HuCRFs條件概率作為置信度估計是一種更好的選擇。
[Abstract]:In view of the difficulty of confidence estimation in automatic speech recognition (ASR), this paper proposes a multi-source fusion strategy to improve the confidence identification ability. The specific approach is to first select different levels of information about the results of the recognition, such as the acoustic layer, the language layer and the semantic layer, and then, through experiments, determine the different combinations of these information. The conditional probability of recognition results is calculated under the framework of Hidden-units Conditional Random FieldsHuCRFs (Hidden-units Conditional Random FieldsHuCRFs). Finally, the HuCRFs conditional probability is used as a new estimation of the confidence of speech recognition results. Firstly, it is proved that the HuCRFs conditional probability is a confidence estimation method which is more powerful than the normalized grid posteriori probability discriminant. At the same time, based on the confidence degree of HuCRFs conditional probability, the best candidate sequence is re-searched for the mesh recognized by the decoder in one pass, and the absolute error rate of nearly 2% is reduced relative to the best candidate sequence in one pass recognition. At the same time, the performance of the best candidate sequence based on HuCRFs conditional probability search and the best candidate sequence based on long language model mesh reestimation is compared. It is further proved that using HuCRFs conditional probability as confidence estimation is a better choice.
【作者單位】: 中國科學院聲學研究所;
【基金】:國家自然科學基金(10925419,90920302,61072124,11074275,11161140319,91120001,61271426) 中國科學院戰(zhàn)略性先導科技專項(XDA06030100,XDA06030500) 國家863計劃項目(2012AA012503) 中科院重點部署項目(KGZD-EW-103-2)資助課題
【分類號】:TN912.34
【共引文獻】
相關期刊論文 前1條
1 李海洋;韓紀慶;鄭貴濱;鄭鐵然;;語音關鍵詞檢測中置信測度方法研究綜述[J];智能計算機與應用;2014年02期
相關博士學位論文 前1條
1 李寶祥;語音關鍵詞檢索若干問題的研究[D];北京郵電大學;2013年
相關碩士學位論文 前1條
1 王勇;基于點過程模型的連續(xù)語音關鍵詞檢測技術研究[D];解放軍信息工程大學;2013年
【相似文獻】
相關博士學位論文 前1條
1 熊英;中文自然語言理解中基于條件隨機場理論的詞法分析研究[D];上海交通大學;2009年
相關碩士學位論文 前4條
1 包森成;基于統(tǒng)計模型的韻律結(jié)構(gòu)預測研究[D];北京郵電大學;2009年
2 鄭明東;語音關鍵詞識別技術研究[D];廣西師范大學;2012年
3 張曉斐;分布式視頻編碼的邊信息融合與重構(gòu)[D];上海交通大學;2010年
4 吳楠;基于主動學習的語音情感識別研究[D];天津師范大學;2012年
,本文編號:1941866
本文鏈接:http://www.sikaile.net/kejilunwen/wltx/1941866.html
最近更新
教材專著