面向聲音事件的特征提取與識別方法研究
發(fā)布時間:2021-01-22 13:17
由特定物理事件引起的聲波可以稱為聲音事件。對聲音事件的特征提取和識別,可以幫助我們確定聲音事件的類型,獲取環(huán)境信息,從而指導生產和生活。聲音事件識別過程分為特征提取和分類識別兩個部分,現在主流的特征提取方法以傳統(tǒng)語音特征為主,對聲音事件的特征提取缺乏針對性。此外,由于聲音事件受環(huán)境因素影響大,傳統(tǒng)的分類器或分類算法難以對復雜的聲音事件進行特征挖掘,在分類問題中表現一般。基于神經網絡的分類模型效果較好,然而對訓練樣本的數量要求很高,難以在有限的數據集支撐下獲得良好的識別效果。為此,本文在對聲音特征提取與分類器設計的研究基礎上,提出將樣本擴增和數據增強方法同時應用到聲音事件識別中,為聲音事件分類識別研究提供一種新的方法。本文選取生活環(huán)境中常見的動物的聲音、自然聲景和水聲、人類的非語音聲、室內或家庭聲音、戶外或城市噪音等5大類50小類非語音聲音事件為主要研究對象,使用音頻錄音文件作為聲音數據集。本文在聲音事件識別基本原理的基礎上,設計了基于諧波分量和沖激分量分解的多種特征組合的特征表示方法,樣本擴增和數據增強方法,以及基于殘差神經網絡的聲音事件識別總體方案。首先對單通道音頻文件進行諧波分量和...
【文章來源】: 李陽 電子科技大學
【文章頁數】:85 頁
【學位級別】:碩士
【部分圖文】:
原始音頻、諧波分量、沖激分量的時域圖
電子科技大學碩士學位論文22圖3-2原始音頻、諧波分量、沖激分量的時域圖圖3-3原始音頻、諧波分量、沖激分量的梅爾譜圖圖3-2和圖3-3分別為原始音頻經HPSS后的時域圖和梅爾譜圖?梢钥吹浇
電子科技大學碩士學位論文26圖3-6快速傅里葉變換點數為1024時的特征譜圖圖3-7快速傅里葉變換點數為2048時的特征譜圖可以看到,選取不同的窗長,在梅爾譜圖及其一階和二階差分圖的特征細節(jié)上有所區(qū)別,二者有共同之處,也存在信息的互補。
本文編號:2993294
【文章來源】: 李陽 電子科技大學
【文章頁數】:85 頁
【學位級別】:碩士
【部分圖文】:
原始音頻、諧波分量、沖激分量的時域圖
電子科技大學碩士學位論文22圖3-2原始音頻、諧波分量、沖激分量的時域圖圖3-3原始音頻、諧波分量、沖激分量的梅爾譜圖圖3-2和圖3-3分別為原始音頻經HPSS后的時域圖和梅爾譜圖?梢钥吹浇
電子科技大學碩士學位論文26圖3-6快速傅里葉變換點數為1024時的特征譜圖圖3-7快速傅里葉變換點數為2048時的特征譜圖可以看到,選取不同的窗長,在梅爾譜圖及其一階和二階差分圖的特征細節(jié)上有所區(qū)別,二者有共同之處,也存在信息的互補。
本文編號:2993294
本文鏈接:http://www.sikaile.net/kejilunwen/xinxigongchenglunwen/2993294.html