基于音素的語音可懂度評價方法的研究與實現(xiàn)
【學位授予單位】:北京工業(yè)大學
【學位級別】:碩士
【學位授予年份】:2018
【分類號】:TN912.3
【圖文】:
并對各分類模型在語音識別中的拓展應用進行了簡究所可能存在的問題以及為后續(xù)章節(jié)的研究工作做鋪墊。別技術識別技術的計算機輔助發(fā)音系統(tǒng)(CAPT),其核心技術就,由于英語作為全球最廣為流通以及普遍的語言,其學習者算機輔助英語學習也成為了當今的一大研究熱點。英文發(fā)多種技術來進行研究,研究首先需要了解英語語音的一些基理學過程,并據(jù)此建立合理的模型來描述發(fā)音檢測評價的過類的產生與三部分器官有關:肺部、喉嚨和聲道。經過聲道成人們所能聽到的語音。例如英文單詞“breakfast”的產生st 的音強圖和聲譜圖。
音素,字母,音標都是衡量一個英語學習中的發(fā)音質量以及能否被聽者正確聽懂理解的重要依據(jù)。2.1.2 語音信號處理語音聲學基元是聲學模型構建的基礎,聲學基元的選擇標準一般需要考慮三個標準易訓練、可拓展以及高精度。目前語音識別研究中聲學基元的選擇大多都是詞(word)、音節(jié)(syllable)、半音節(jié)(semi-syllable)以及音素(phone)等。英文語音一般選擇音素作為聲學基元,對于小詞匯語音識別系統(tǒng),通常聲學基元為詞。由于構成英文單詞的單元是字母,而字母又是音素組成的。而與漢語的詞匯發(fā)音不同,漢語大多是基于聲母,韻母所構成的[25][26]。計算機首先將接收到的語音進行預處理操作,處理為語音信號之后才能進行分析。通過計算機進行預處理等操作,可以一定程度上減少因為人類本身和采集設備對語音信號質量所造成的影響。為之后的信號處理提供穩(wěn)定,優(yōu)質的分析參數(shù),從而提高信號處理的質量。語音信號處理流程如圖 2-2 所示。
態(tài)序列不能被直接觀察到,但可以通過觀察向量反映出來;對于任意給定狀態(tài),MM 模型又是一個由隱含狀態(tài)決定觀察值的隨機過程,它會以隨機概率輸出相的觀察向量。HMM 的隨機過程與語音的形成過程類似。HMM 模型能夠很好的模擬語音特性,并對應出合理的數(shù)學解析,且對隨時間不斷變化的語音信號有極強的建能力。HMM 模型可以用以下五組參數(shù)來進行描述,如公式 2-1 所示: { , , , , } (2-1)其中 表示 HMM 模型所包含的有限隱含狀態(tài)的集合; 表示每個隱狀態(tài)所組的集合; 表示狀態(tài)之間的轉移概率,可用一個矩陣來表示; 為相應輸出觀察的概率; 表示由系統(tǒng)初始狀態(tài)概率所構成的集合。HMM 模型用作聲學模型,圖 2-3 為 HMM 的示意圖,其具有 6 個狀態(tài)的 Morkov 過程,狀態(tài) 2┼5 代表間狀態(tài),兩個黑圓圈分別代表入口狀態(tài) 1 和出口狀態(tài) 6。
【相似文獻】
相關期刊論文 前10條
1 陳亞繁;許勇;楊軍;;單通道語音增強對低信噪比漢語可懂度的影響[J];電聲技術;2016年10期
2 陳惠德;;%AL_cons的測試[J];電聲技術;1989年05期
3 姚峰英,張敏;一種增強帶噪語音可懂度的新算法[J];聲學學報;2002年06期
4 胡書孝;提高教材可懂度技術的應用[J];醫(yī)學教育;1992年06期
5 程容荃;;人造舌對全舌切除病人攝食和元音可懂度的影響[J];國外醫(yī)學.耳鼻咽喉科學分冊;1983年04期
6 齊魯;從對話中摘出詞句的可懂度[J];聲學學報;1964年02期
7 齊魯;從流利語言中摘出詞句的可懂度——說話速度和詞句長度的影響[J];聲學學報;1964年02期
8 周篤強,黃端生,牛聰敏,陳善廣,高慧;快速測量漢語語言可懂度方法的研究[J];航天醫(yī)學與醫(yī)學工程;1997年04期
9 吳小平;如何提高物理教材的可懂度[J];技術物理教學;2005年03期
10 蔣斌;匡正;吳鳴;楊軍;;漢語音段反轉言語的可懂度研究[J];聲學學報;2012年06期
相關會議論文 前6條
1 許偉;曾新吾;龔昌超;;不同帶寬和采樣頻率語音可懂度的實驗研究[A];2008年全國聲學學術會議論文集[C];2008年
2 湯朝菊;文森特·范赫恩;;漢語方言互懂度的實驗測試[A];中國社會語言學(2006年第2期)[C];2006年
3 陳凱;俞蒙槐;胡上序;付強;;語音增強系統(tǒng)性能評測方法綜述[A];第四屆全國人機語音通訊學術會議(NCMMSC1996)論文集[C];1996年
4 尹建琪;覃春林;諸維明;;用于語聲識別的自適應去噪[A];第二屆全國人機語音通訊學術會議(NCMMSC1992)論文集[C];1992年
5 黃志華;;共振峰對維吾爾語語音可懂度的影響[A];2018年全國聲學大會論文集 K語言聲學與語音信號處理[C];2018年
6 王康;王鵬;邱小軍;;漢語母語聽者單耳英語通信可懂度受噪聲的影響[A];2016年全國聲學學術會議論文集[C];2016年
相關碩士學位論文 前10條
1 高源;基于音素的語音可懂度評價方法的研究與實現(xiàn)[D];北京工業(yè)大學;2018年
2 高飛;基于音頻特性的語音可懂度評估[D];太原理工大學;2018年
3 劉鵬;高可懂度的信號子空間語音增強算法[D];太原理工大學;2014年
4 彭曉騰;語音可懂度客觀評價策略的研究[D];內蒙古大學;2016年
5 郭利華;具有高可懂度的維納濾波語音增強算法[D];太原理工大學;2014年
6 葉琪;低信噪比環(huán)境下語音可懂度增強算法研究[D];安徽大學;2016年
7 鄺秀玉;多級低速率編解碼級聯(lián)語音可懂度增強算法研究與實現(xiàn)[D];電子科技大學;2011年
8 李娜;有效提高語音可懂度的語音增強方法研究[D];北京工業(yè)大學;2013年
9 徐宇卓;語音可懂度客觀評價方法的研究[D];太原理工大學;2015年
10 羅鈞;G.729與AMR級聯(lián)語音可懂度提高技術研究[D];電子科技大學;2010年
本文編號:2787757
本文鏈接:http://www.sikaile.net/kejilunwen/wltx/2787757.html