天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 信息工程論文 >

基于深度學(xué)習(xí)的聲學(xué)場(chǎng)景分類與聲音事件檢測(cè)

發(fā)布時(shí)間:2020-10-20 15:58
   聲學(xué)場(chǎng)景分類(Acoustic Scenes Classification,ASC)和聲音事件檢測(cè)(Sound Event Detection,SED)是多媒體分析與檢索、音頻監(jiān)控、智能輔助駕駛等應(yīng)用領(lǐng)域的關(guān)鍵技術(shù),也是目前音頻信號(hào)處理領(lǐng)域的研究熱點(diǎn)之一。本文以復(fù)雜音頻作為分析對(duì)象,探討基于深度學(xué)習(xí)的聲學(xué)場(chǎng)景分類和聲音事件檢測(cè)方法。本文主要工作及創(chuàng)新點(diǎn)如下:(1)提出了基于音頻特征增強(qiáng)的聲學(xué)場(chǎng)景分類方法。本文主要探討音頻特征增強(qiáng)(Audio Feature Augmentation,AFA)對(duì)聲學(xué)場(chǎng)景分類性能的影響。具體包括:對(duì)兩個(gè)通道音頻數(shù)據(jù)的特征進(jìn)行求均值和求差運(yùn)算,得到兩個(gè)通道特征的相同點(diǎn)和差異點(diǎn);對(duì)音頻數(shù)據(jù)均值的頻譜做諧波沖擊源分離(Harmonic Percussive Source Separation,HPSS),得到增強(qiáng)的音頻特征。采用實(shí)驗(yàn)數(shù)據(jù)庫(kù)DCASE2016和DCASE2017進(jìn)行評(píng)測(cè),基于音頻特征增強(qiáng)的聲學(xué)場(chǎng)景分類方法獲得的準(zhǔn)確率分別為85.8%和69.9%,均優(yōu)于沒(méi)有做數(shù)據(jù)增強(qiáng)的方法。此外,與其它聲學(xué)場(chǎng)景分類方法相比,本文方法性能更優(yōu)。(2)提出基于深度特征融合的道路異常聲音事件檢測(cè)方法。首先,采用深度自編碼網(wǎng)絡(luò)(Deep Autoencoder Network,DAN)將梅爾頻率倒譜系數(shù)(Mel Frequency Cepstral Coefficient,MFCC),Bark濾波器組(Bark Filter Bank,BFB)和Gabor濾波器組(Gabor Filter Bank,GFB)三種淺層特征變換為深度特征,然后將上述深度特征的組合再次采用深度自編碼網(wǎng)絡(luò)進(jìn)行變換得到融合的深度特征,最后將融合的深度特征輸入長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)(Long Short Term Memory Network,LSTMN)進(jìn)行判決。實(shí)驗(yàn)結(jié)果表明,融合的深度特征在沒(méi)有添加噪聲時(shí)所得到的異常聲音事件檢測(cè)準(zhǔn)確率為92.15%,F值為91.32%,高于其他單一特征所得到的結(jié)果;在添加噪聲后,當(dāng)信噪比分別為20 dB、10 dB、0 dB、-10dB時(shí),融合的深度特征的性能明顯優(yōu)于其他特征,具有較強(qiáng)的抗噪性。綜上所述,本文提出基于音頻特征增強(qiáng)的聲學(xué)場(chǎng)景分類方法和基于深度特征融合的道路異常聲音事件檢測(cè)方法。從多個(gè)側(cè)面實(shí)驗(yàn)分析本文提出方法的性能,在多種實(shí)驗(yàn)條件下進(jìn)行對(duì)比,驗(yàn)證本文方法的可靠性和有效性。
【學(xué)位單位】:華南理工大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位年份】:2019
【中圖分類】:TN912.3;TP18
【部分圖文】:

頻譜,倒譜系數(shù),提取流程,頻率


圖 2-1 梅爾頻率倒譜系數(shù)提取流程聲音信號(hào)的短時(shí)平穩(wěn)性,在進(jìn)行 40ms,幀移為幀長(zhǎng)的一半左右。與窗函數(shù)相乘。窗函數(shù)為漢明窗 ,,0120.540.46cos()Nnn 后的聲音信號(hào)做傅里葉變換,提取()()0102 XkxnekNnNknj, 信號(hào)的頻譜后,設(shè)計(jì)梅爾濾波器隔分布的三角濾波器組,如圖 2

關(guān)系圖,濾波器組,關(guān)系圖,系統(tǒng)函數(shù)


圖 2-2 梅爾濾波器組關(guān)系圖由此得出梅爾帶通濾波器組的系統(tǒng)函數(shù)為: 0,(1),()(1)(1)()(1),(1)()()(1)(1)0,(1)()kfmfmkfmfmfmfmkfmkfmfmfmkfmkfmHkm(2-5)f (m)為濾波器的中心頻率,定義如下: 1()()()1MBfBfBBfmfNfmhlls(2-6)

流程圖,特征提取,流程圖,聲學(xué)特征


第二章 聲學(xué)特征與分類器 LlmllNMFCCi1lg()cos2(),m(l)為三角濾波器組濾波后輸提取過(guò)程和 MFCC 類似,區(qū)別在于波器組特征采用的是 Bark 濾波器
【參考文獻(xiàn)】

相關(guān)期刊論文 前3條

1 其米克·巴特西;黃浩;王羨慧;;基于深度神經(jīng)網(wǎng)絡(luò)的維吾爾語(yǔ)語(yǔ)音識(shí)別[J];計(jì)算機(jī)工程與設(shè)計(jì);2015年08期

2 何俊;李艷雄;賀前華;李威;;變異特征加權(quán)的異常語(yǔ)音說(shuō)話人識(shí)別算法[J];華南理工大學(xué)學(xué)報(bào)(自然科學(xué)版);2012年03期

3 賀前華;李艷雄;李韜;張虹;楊繼臣;;基于兩步判決的口語(yǔ)中非文字音頻事件檢測(cè)方法[J];華南理工大學(xué)學(xué)報(bào)(自然科學(xué)版);2011年02期



本文編號(hào):2848874

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/xinxigongchenglunwen/2848874.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶12af7***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com