天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于聲學特征空間非線性流形結構的語音識別聲學模型

發(fā)布時間:2017-09-23 17:35

  本文關鍵詞:基于聲學特征空間非線性流形結構的語音識別聲學模型


  更多相關文章: 語音識別 聲學模型 非線性流形 混合因子分析


【摘要】:從語音信號聲學特征空間的非線性流形結構特點出發(fā),利用流形上的壓縮感知原理,構建新的語音識別聲學模型.將特征空間劃分為多個局部區(qū)域,對每個局部區(qū)域用一個低維的因子分析模型進行近似,從而得到混合因子分析模型.將上下文相關狀態(tài)的觀測矢量限定在該非線性低維流形結構上,推導得到其觀測概率模型.最終,每個狀態(tài)由一個服從稀疏約束的權重矢量和若干個服從標準正態(tài)分布的低維局部因子矢量所決定.文中給出了局部區(qū)域潛在維數(shù)的確定準則及模型參數(shù)的迭代估計算法.基于RM語料庫的連續(xù)語音識別實驗表明,相比于傳統(tǒng)的高斯混合模型(Gaussian mixture model,GMM)和子空間高斯混合模型(Subspace Gaussian mixture model,SGMM),新聲學模型在測試集上的平均詞錯誤率(Word error rate,WER)分別相對下降了33.1%和9.2%.
【作者單位】: 解放軍信息工程大學信息系統(tǒng)工程學院;
【關鍵詞】語音識別 聲學模型 非線性流形 混合因子分析
【基金】:國家自然科學基金(61403415,61175017)資助~~
【分類號】:TN912.34
【正文快照】: 在連續(xù)語音識別中,為了反映同一音素在不同上下文環(huán)境中發(fā)音的不同,通常采用上下文相關音素建模方法,即對每一個音素的不同音位變體,分別用一個隱馬爾科夫模型(Hidden Markov model,HMM)進行建模,其中每一個隱含狀態(tài)的觀測概率分布用高斯混合模型(Gaussian mixture model,GMM)

【相似文獻】

中國期刊全文數(shù)據(jù)庫 前10條

1 ;語音識別[J];中國會計電算化;2000年02期

2 雅文;語音識別新天地[J];中國計算機用戶;2000年05期

3 姚文冰,姚天任,韓濤;穩(wěn)健語音識別技術發(fā)展現(xiàn)狀及展望[J];信號處理;2001年06期

4 雙中;語音識別芯片及應用[J];貴州科學;2002年04期

5 何湘智;語音識別的研究與發(fā)展[J];計算機與現(xiàn)代化;2002年03期

6 唐昌文;一種孤立字語音識別的新方法[J];通信技術;2002年08期

7 王玉偉,張磊,韓紀慶;一種基于非線性特征的應力影響下變異語音識別方法[J];信號處理;2002年05期

8 余鵬,王作英;語音識別中空間相關性信息的利用[J];電子學報;2002年07期

9 韓紀慶;一種語音識別中的環(huán)境自適應方法[J];計算機工程與應用;2002年01期

10 王作英,趙蕤;高斯樣本模式混淆度分析及其在語音識別中的應用[J];計算機工程與應用;2002年18期

中國重要會議論文全文數(shù)據(jù)庫 前10條

1 李楨;高萬林;歐文浩;徐山川;;基于關鍵詞語音識別的農(nóng)業(yè)信息語音服務系統(tǒng)的研究與實現(xiàn)[A];中國農(nóng)業(yè)工程學會電氣信息與自動化專業(yè)委員會、中國電機工程學會農(nóng)村電氣化分會科技與教育專委會2010年學術年會論文摘要[C];2010年

2 王承發(fā);趙德彬;金山;苗百利;朱志瑩;;語音識別應用中抗噪聲干擾方法的初步探討[A];第二屆全國人機語音通訊學術會議論文集[C];1992年

3 季宏;劉志文;杜燕玲;黃曾陽;;語音識別中的音字轉(zhuǎn)換[A];第三屆全國人機語音通訊學術會議論文集[C];1994年

4 朱奇峰;俞鐵城;;聽覺中的協(xié)同現(xiàn)象和其對語音識別影響的探討[A];第四屆全國人機語音通訊學術會議論文集[C];1996年

5 姚磊;黃泰翼;陳景東;;一種高魯棒性語音識別的通用自適應方法研究[A];第四屆全國人機語音通訊學術會議論文集[C];1996年

6 潘勝昔;劉加;江金濤;王作英;陸大金;;基于多模式及集成判決的穩(wěn)健電話語音識別算法研究[A];第五屆全國人機語音通訊學術會議論文集[C];1998年

7 杜利民;;語音識別中的魯棒性問題[A];第六屆全國人機語音通訊學術會議論文集[C];2001年

8 葛余博;謝新艷;葛菱南;楊楠;胡波;;計算機語音識別的新參數(shù)[A];第六屆全國人機語音通訊學術會議論文集[C];2001年

9 張化云;韓兆兵;徐波;;電話語音翻譯中的語音識別研究[A];第六屆全國人機語音通訊學術會議論文集[C];2001年

10 張晴晴;潘接林;;模糊發(fā)音字典在方言口音語音識別中的應用[A];第八屆全國人機語音通訊學術會議論文集[C];2005年

中國重要報紙全文數(shù)據(jù)庫 前10條

1 閆婷;語音識別 理想與現(xiàn)實的距離[N];計算機世界;2007年

2 樂天;語音識別:讓你的手機更聰明[N];計算機世界;2011年

3 雨夏;語音識別重在應用[N];計算機世界;2001年

4 王向東 欒煥博 林守勛 錢躍良;語音識別:抗噪音能力有待加強[N];計算機世界;2006年

5 本報記者 操秀英;顏永紅:“搜索”語音識別的未來[N];科技日報;2010年

6 本報記者 李映;語音識別飛入尋常百姓家?[N];中國電子報;2012年

7 清華大學 劉加;語音識別應用促進技術發(fā)展[N];計算機世界;2006年

8 劉權;OSR提升語音識別率[N];中國計算機報;2004年

9 ;Intel涉足語音識別[N];計算機世界;2003年

10 本報記者 馬文方;用互聯(lián)網(wǎng)思維做語音識別[N];中國計算機報;2013年

中國博士學位論文全文數(shù)據(jù)庫 前10條

1 吳斌;語音識別中的后處理技術研究[D];北京郵電大學;2008年

2 奉小慧;音頻噪聲環(huán)境下唇動信息在語音識別中的應用技術研究[D];華南理工大學;2010年

3 孫f,

本文編號:906643


資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/wltx/906643.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶8145c***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com