【摘要】:在生物學(xué)的定義中,會(huì)說(shuō)話和能夠借助工具是人和其他動(dòng)物最本質(zhì)的差別。語(yǔ)言也是自人類誕生以來(lái)所依賴的重要的交流工具,語(yǔ)言具有自然且方便,簡(jiǎn)潔且明了,準(zhǔn)確且高效等優(yōu)點(diǎn)。語(yǔ)音是語(yǔ)言的外在表示方式,能夠最直觀的體現(xiàn)我們的思維活動(dòng),語(yǔ)音由人的發(fā)音器官產(chǎn)生,承載著非常豐富的信息,是人們思想表達(dá)和情感交互的重要方式。在人們探索語(yǔ)言追本溯源的過程中逐漸形成了語(yǔ)音學(xué),語(yǔ)音學(xué)是語(yǔ)言學(xué)的分支之一,它旨在探索人類的語(yǔ)言聲音,本文所討論的耳語(yǔ)是語(yǔ)音學(xué)的分支之一。耳語(yǔ)發(fā)音模式的語(yǔ)音被叫做耳語(yǔ)音(whisper),又稱之為悄悄話,是日常生活中最普遍的信息交互形式之一。對(duì)比正常的發(fā)音方式,耳語(yǔ)的發(fā)音模式較為獨(dú)特,當(dāng)用耳語(yǔ)發(fā)聲時(shí)發(fā)聲器官不會(huì)產(chǎn)生振動(dòng),而是一種特殊的摩擦激勵(lì)發(fā)聲模式。近代由于通信設(shè)施和科技手段的不斷完善和發(fā)展,耳語(yǔ)的應(yīng)用也更加的廣泛,從最開始的理論研究發(fā)展到當(dāng)下的實(shí)際應(yīng)用。正因?yàn)槎Z(yǔ)發(fā)音的獨(dú)特性,使用耳語(yǔ)音的交流方式可以在很好的保護(hù)個(gè)人隱私的情況下,同時(shí)保證不會(huì)干擾到其他人的正常活動(dòng)~([1]),所以研究耳語(yǔ)音具有重要的研究意義。本文圍繞耳語(yǔ)音檢測(cè)技術(shù)展開討論,耳語(yǔ)音端點(diǎn)檢測(cè)是耳語(yǔ)音識(shí)別的預(yù)處理部分,它非常大的影響了耳語(yǔ)音識(shí)別系統(tǒng)的精確度,本文針對(duì)耳語(yǔ)音在靜音和在噪聲背景下分別使用能零比(Energy to Zero Ratio,EZCR)和經(jīng)驗(yàn)?zāi)J椒纸?Emperial Mode Decomposition,EMD)的方法實(shí)現(xiàn)了耳語(yǔ)的端點(diǎn)檢測(cè)。本文作者通過觀察語(yǔ)音時(shí)域和頻域的基本特征提出了三種具有優(yōu)良區(qū)分性的基本聲學(xué)特征音高、音強(qiáng)和共振峰;通過對(duì)上述特征的分析,提出元音的可能存在方式具有兩種,一種是正常音中的振動(dòng)形式,第二種是耳語(yǔ)音中的無(wú)振動(dòng)的存在形式。并利用三種特征借助機(jī)器學(xué)習(xí)分類算法和高斯混合模型(Gaussian Mixture Model,GMM)統(tǒng)計(jì)學(xué)分類算法來(lái)區(qū)分正常語(yǔ)音和耳語(yǔ)音兩種語(yǔ)音聲效模式,比較了8種分類算法的分類性能,得到K近鄰的分類算法分類性能最優(yōu)的結(jié)論。同時(shí)編譯了離線訓(xùn)練的耳語(yǔ)音檢測(cè)網(wǎng)頁(yè)展示軟件。研究了不同的時(shí)長(zhǎng)段3s,4s,5s,6s,混合時(shí)長(zhǎng)的語(yǔ)音對(duì)檢測(cè)結(jié)果準(zhǔn)確度的影響,并且得到不同時(shí)長(zhǎng)的語(yǔ)音段對(duì)于耳語(yǔ)音和正常語(yǔ)音的分類結(jié)果基本上沒有影響的結(jié)論。最后,分別利用百度API和HTK(Hidden Markov Model Toolkit)工具箱實(shí)現(xiàn)了特定品質(zhì)語(yǔ)音的識(shí)別和耳語(yǔ)音孤立詞的識(shí)別工作。
【圖文】:
圖 3.1 發(fā)音示意圖[8]Figure 3.1 Pronunciation sketch map[8]肺是胸腔內(nèi)的一團(tuán)有彈性的海綿組織,具有儲(chǔ)存空氣的功能,在肺部受到膈膜擠壓排出形成原動(dòng)力。氣管作為通道將氣流運(yùn)輸?shù)窖屎聿课。喉部位于氣管的上方位置,由四塊

圖 3.2 聲門四種狀態(tài)[3]Figure 3.2 Four state graph of the glottis[3]音最小的單元,中文發(fā)音的音節(jié)是由元音和其前后依靠的輔音組素叫做聲母,聲母的后半部分才是元音[2]。自然發(fā)聲時(shí),聲母部發(fā)音的時(shí)候聲帶則沒有阻礙,,而是聲帶相對(duì)靠攏,形成窄縫聲門
【學(xué)位授予單位】:內(nèi)蒙古大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2018
【分類號(hào)】:TN912.3
【參考文獻(xiàn)】
相關(guān)期刊論文 前10條
1 晁浩;宋成;彭維平;;語(yǔ)音識(shí)別中聲效模式的分析及檢測(cè)[J];計(jì)算機(jī)應(yīng)用研究;2015年08期
2 鄭美容;;基于HTML5的Web應(yīng)用研究[J];工業(yè)控制計(jì)算機(jī);2014年12期
3 潘欣裕;趙鶴鳴;;中文耳語(yǔ)元音的聲調(diào)特征研究[J];信號(hào)處理;2011年10期
4 徐坤玉;張彩珍;藥雪崧;;語(yǔ)音信號(hào)的加窗傅里葉變換研究[J];山西師范大學(xué)學(xué)報(bào)(自然科學(xué)版);2011年03期
5 談雪丹;顧濟(jì)華;趙鶴鳴;陶智;韓韜;吳俊;;基于HHT瞬時(shí)能頻值的耳語(yǔ)音端點(diǎn)檢測(cè)[J];計(jì)算機(jī)工程與應(yīng)用;2010年29期
6 韓立華;王博;段淑鳳;;語(yǔ)音端點(diǎn)檢測(cè)技術(shù)研究進(jìn)展[J];計(jì)算機(jī)應(yīng)用研究;2010年04期
7 金峗;趙艷;黃程韋;趙力;;耳語(yǔ)音情感數(shù)據(jù)庫(kù)的設(shè)計(jì)與建立[J];聲學(xué)技術(shù);2010年01期
8 陳雪勤;趙鶴鳴;;基于聽覺模型的漢語(yǔ)耳語(yǔ)音聲調(diào)檢測(cè)[J];電子學(xué)報(bào);2009年04期
9 趙艷;趙力;鄒采榮;;耳語(yǔ)音的語(yǔ)音處理研究綜述[J];聲學(xué)技術(shù);2008年04期
10 茹婷婷;謝湘;;耳語(yǔ)音數(shù)據(jù)庫(kù)的設(shè)計(jì)與采集[J];清華大學(xué)學(xué)報(bào)(自然科學(xué)版);2008年S1期
相關(guān)博士學(xué)位論文 前2條
1 龔呈卉;基于聯(lián)合因子分析的耳語(yǔ)音說(shuō)話人識(shí)別研究[D];蘇州大學(xué);2014年
2 范昕煒;支持向量機(jī)算法的研究及其應(yīng)用[D];浙江大學(xué);2003年
相關(guān)碩士學(xué)位論文 前1條
1 丁愛明;基于MFCC和GMM的說(shuō)話人識(shí)別系統(tǒng)研究[D];河海大學(xué);2006年
本文編號(hào):
2590519
本文鏈接:http://www.sikaile.net/kejilunwen/wltx/2590519.html