語(yǔ)音端點(diǎn)檢測(cè)方法研究
本文關(guān)鍵詞:語(yǔ)音端點(diǎn)檢測(cè)方法研究 出處:《大連理工大學(xué)》2016年碩士論文 論文類型:學(xué)位論文
更多相關(guān)文章: 端點(diǎn)檢測(cè) 子帶譜方差 HMM FCM 前導(dǎo)靜音段
【摘要】:語(yǔ)音端點(diǎn)檢測(cè)是指在背景噪聲存在下,找到一個(gè)單詞或語(yǔ)音段的起始點(diǎn)和結(jié)束點(diǎn)。它在語(yǔ)音識(shí)別、語(yǔ)音編碼和語(yǔ)音傳輸?shù)日Z(yǔ)音信號(hào)處理中起著重要作用。一種有效的端點(diǎn)檢測(cè)方法,不僅能正確標(biāo)識(shí)語(yǔ)音端點(diǎn),而且能減少數(shù)據(jù)處理時(shí)間、提高效率和節(jié)省數(shù)據(jù)存儲(chǔ)空間。本文介紹了語(yǔ)音信號(hào)的產(chǎn)生模型和人耳聽(tīng)覺(jué)特性,分析了語(yǔ)音分幀和加窗這些預(yù)處理過(guò)程。簡(jiǎn)要回顧了常用的端點(diǎn)檢測(cè)方法,如短時(shí)能量和過(guò)零率法、譜方差法、MFCC倒譜距離法和譜熵法等?偨Y(jié)了各種常用算法的思想、流程及特點(diǎn),并給出了各算法所用特征參數(shù)曲線圖。提出了兩種新的端點(diǎn)檢測(cè)算法:(1)提出了一種改進(jìn)的自適應(yīng)子帶譜方差端點(diǎn)檢測(cè)方法。因?yàn)椴煌愋驮肼暤念l率能量集中在不同的頻率帶上,所以可以通過(guò)準(zhǔn)確地去掉這些含有太多噪聲的頻率帶,并自適應(yīng)地選擇有用子帶能量,來(lái)得到更多準(zhǔn)確的語(yǔ)音頻率譜信息。使語(yǔ)音段方差和噪聲段方差之間的區(qū)分度變大,端點(diǎn)檢測(cè)更容易,準(zhǔn)確率更高。同時(shí)有效減少了需處理的語(yǔ)音數(shù)據(jù),提高系統(tǒng)整體性能。并將該算法應(yīng)用到高斯連續(xù)HMM語(yǔ)音識(shí)別系統(tǒng)中,實(shí)驗(yàn)表明,該算法提高了識(shí)別系統(tǒng)準(zhǔn)確率及抗噪性。(2)提出了一種無(wú)前導(dǎo)靜音段語(yǔ)音的端點(diǎn)檢測(cè)算法;陂撝档亩它c(diǎn)檢測(cè)方法假設(shè)語(yǔ)音起始段為無(wú)語(yǔ)音的靜音段,并根據(jù)該無(wú)語(yǔ)音的起始段的特征值設(shè)置閾值。如果檢測(cè)的語(yǔ)音幀的特征值大于閾值,就認(rèn)為該幀是語(yǔ)音幀,否則認(rèn)為該幀是噪聲幀。若該假設(shè)不成立,預(yù)設(shè)的閾值將不可用,最終導(dǎo)致端點(diǎn)檢測(cè)錯(cuò)誤。本文通過(guò)FCM聚類方法避開了閾值設(shè)置問(wèn)題。該算法在檢測(cè)無(wú)前導(dǎo)靜音段語(yǔ)音時(shí),表現(xiàn)出了很好的性能。
[Abstract]:Speech endpoint detection refers to finding the beginning and ending point of a word or speech segment in the presence of background noise. Speech coding and voice transmission play an important role in speech signal processing. An effective endpoint detection method can not only correctly identify speech endpoints, but also reduce data processing time. This paper introduces the speech signal generation model and auditory characteristics, analyzes the preprocessing process of speech framing and windowing, and briefly reviews the common endpoint detection methods. Such as short-time energy and zero-crossing rate method, spectral variance method, MFCC cepstrum distance method and spectral entropy method, etc. The ideas, flow chart and characteristics of various commonly used algorithms are summarized. The graph of characteristic parameters used in each algorithm is given, and two new endpoint detection algorithms: 1) are proposed. An improved adaptive subband spectrum variance endpoint detection method is proposed because the frequency energy of different types of noise is concentrated on different frequency bands. So it is possible to remove the frequency bands which contain too much noise accurately and to select the useful sub-band energy adaptively. In order to get more accurate speech frequency spectrum information, the distinction between the variance of speech segment and the variance of noise segment becomes larger, the endpoint detection is easier and the accuracy is higher. At the same time, the speech data that needs to be processed is reduced effectively. The algorithm is applied to Gao Si continuous HMM speech recognition system. This algorithm improves the accuracy and anti-noiseness of the recognition system. (2) an endpoint detection algorithm for speech without leading mute segment is proposed. The threshold based endpoint detection method assumes that the beginning segment of speech is a voiceless mute segment. If the eigenvalue of the detected speech frame is greater than the threshold value, the frame is considered to be a speech frame, otherwise the frame is considered to be a noisy frame. The preset threshold will not be available, resulting in endpoint detection errors. In this paper, the threshold setting problem is avoided by FCM clustering method. The algorithm shows good performance in detecting speech without leading mute segment.
【學(xué)位授予單位】:大連理工大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:TN912.3
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 陳鳳翥;;基于熵的語(yǔ)音端點(diǎn)檢測(cè)方法探討[J];技術(shù)與市場(chǎng);2008年09期
2 雷鳴;李學(xué)仁;李果;;飛機(jī)艙音背景聲下的魯棒語(yǔ)音端點(diǎn)檢測(cè)[J];振動(dòng)與沖擊;2008年10期
3 韓立華;王博;段淑鳳;;語(yǔ)音端點(diǎn)檢測(cè)技術(shù)研究進(jìn)展[J];計(jì)算機(jī)應(yīng)用研究;2010年04期
4 果永振,何遵文;一種多特征語(yǔ)音端點(diǎn)檢測(cè)算法及實(shí)現(xiàn)[J];通信技術(shù);2003年01期
5 劉鵬,王作英;多模式語(yǔ)音端點(diǎn)檢測(cè)[J];清華大學(xué)學(xué)報(bào)(自然科學(xué)版);2005年07期
6 劉曉明,覃勝,劉宗行,江澤佳;語(yǔ)音端點(diǎn)檢測(cè)的仿真研究[J];系統(tǒng)仿真學(xué)報(bào);2005年08期
7 茹海峰,殷業(yè);基于與圖像相結(jié)合的語(yǔ)音端點(diǎn)檢測(cè)方法研究[J];儀器儀表學(xué)報(bào);2005年S1期
8 張?jiān)?韓子丹;戴志強(qiáng);;普通話孤立詞語(yǔ)音端點(diǎn)檢測(cè)的分形維方法研究[J];中國(guó)傳媒大學(xué)學(xué)報(bào)(自然科學(xué)版);2006年01期
9 趙高峰;張雪英;侯雪梅;;一種基于小波系數(shù)方差的語(yǔ)音端點(diǎn)檢測(cè)方法[J];太原理工大學(xué)學(xué)報(bào);2006年05期
10 沈亞強(qiáng);;低信噪比下基于短時(shí)分形維數(shù)的語(yǔ)音端點(diǎn)檢測(cè)[J];儀器儀表學(xué)報(bào);2006年S3期
相關(guān)會(huì)議論文 前10條
1 王明;劉好新;張歆奕;;一種基于時(shí)頻方差和的語(yǔ)音端點(diǎn)檢測(cè)方法研究[A];教育部中南地區(qū)高等學(xué)校電子電氣基礎(chǔ)課教學(xué)研究會(huì)第二十屆學(xué)術(shù)年會(huì)會(huì)議論文集(下冊(cè))[C];2010年
2 楊雅婷;馬博;王磊;吐?tīng)柡椤の崴韭?李曉;;基于聲頻特征的維吾爾語(yǔ)語(yǔ)音端點(diǎn)檢測(cè)方法[A];第五屆全國(guó)青年計(jì)算語(yǔ)言學(xué)研討會(huì)論文集[C];2010年
3 李軍;張兆寧;王旭芳;;一種強(qiáng)噪聲背景下的語(yǔ)音端點(diǎn)檢測(cè)方法[A];全國(guó)第二屆信號(hào)處理與應(yīng)用學(xué)術(shù)會(huì)議?痆C];2008年
4 茹海峰;殷業(yè);;基于與圖像相結(jié)合的語(yǔ)音端點(diǎn)檢測(cè)方法研究[A];第三屆全國(guó)信息獲取與處理學(xué)術(shù)會(huì)議論文集[C];2005年
5 張曉雷;吳及;呂萍;;基于支持向量機(jī)與多觀測(cè)復(fù)合特征矢量的語(yǔ)音端點(diǎn)檢測(cè)[A];第十一屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集(二)[C];2011年
6 張曉雷;吳及;呂萍;;基于支持向量機(jī)與多觀測(cè)復(fù)合特征矢量的語(yǔ)音端點(diǎn)檢測(cè)[A];第十一屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集(一)[C];2011年
7 劉婕;高鴻斌;王潔;;噪聲環(huán)境下基于關(guān)聯(lián)維的語(yǔ)音端點(diǎn)檢測(cè)(英文)[A];計(jì)算機(jī)技術(shù)與應(yīng)用進(jìn)展·2007——全國(guó)第18屆計(jì)算機(jī)技術(shù)與應(yīng)用(CACIS)學(xué)術(shù)會(huì)議論文集[C];2007年
8 李建民;方棣棠;;語(yǔ)音端點(diǎn)檢測(cè)中門限閾值的自動(dòng)確定及音節(jié)切割的新判據(jù)[A];第一屆全國(guó)語(yǔ)言識(shí)別學(xué)術(shù)報(bào)告與展示會(huì)論文集[C];1990年
9 蔣純綱;屈百達(dá);李金寶;王月;;基于小波變換后的分形理論的語(yǔ)音端點(diǎn)檢測(cè)[A];2007中國(guó)控制與決策學(xué)術(shù)年會(huì)論文集[C];2007年
10 國(guó)雅萌;付強(qiáng);;復(fù)雜噪聲環(huán)境中的語(yǔ)音端點(diǎn)檢測(cè)[A];第八屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C];2005年
相關(guān)碩士學(xué)位論文 前10條
1 王海旭;基于卷積神經(jīng)網(wǎng)絡(luò)的語(yǔ)音端點(diǎn)檢測(cè)方法研究[D];內(nèi)蒙古大學(xué);2015年
2 張松軼;語(yǔ)音端點(diǎn)檢測(cè)技術(shù)及在應(yīng)急通信中的應(yīng)用[D];西安電子科技大學(xué);2009年
3 熊威;復(fù)雜噪聲環(huán)境下語(yǔ)音端點(diǎn)的檢測(cè)算法的研究[D];東華大學(xué);2016年
4 李樂(lè);語(yǔ)音端點(diǎn)檢測(cè)算法的研究及應(yīng)用[D];西安建筑科技大學(xué);2016年
5 張超;語(yǔ)音端點(diǎn)檢測(cè)方法研究[D];大連理工大學(xué);2016年
6 劉洋;基于神經(jīng)網(wǎng)絡(luò)的語(yǔ)音端點(diǎn)檢測(cè)方法研究[D];大連理工大學(xué);2010年
7 趙麗霞;噪聲環(huán)境下基于特征的語(yǔ)音端點(diǎn)檢測(cè)研究[D];湖南大學(xué);2010年
8 夏敏磊;語(yǔ)音端點(diǎn)檢測(cè)技術(shù)研究[D];浙江大學(xué);2005年
9 趙高峰;基于小波分析的語(yǔ)音端點(diǎn)檢測(cè)算法研究[D];太原理工大學(xué);2006年
10 喬峰;基于信息熵和神經(jīng)網(wǎng)絡(luò)的語(yǔ)音端點(diǎn)檢測(cè)算法研究[D];太原理工大學(xué);2007年
,本文編號(hào):1403527
本文鏈接:http://www.sikaile.net/kejilunwen/xinxigongchenglunwen/1403527.html