天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 信息工程論文 >

基于深度學(xué)習(xí)的音頻事件檢測(cè)方法研究

發(fā)布時(shí)間:2023-01-30 09:34
  音頻事件檢測(cè)是一種檢測(cè)音頻事件類別及其起止時(shí)間的技術(shù),它在安全監(jiān)控、生物多樣性保護(hù)、多媒體檢索推薦和場(chǎng)景感知等民用與工業(yè)領(lǐng)域中有著廣泛的應(yīng)用。在現(xiàn)實(shí)環(huán)境中,音頻事件可能相互混疊,要檢測(cè)出音頻事件的類別及其起止時(shí)間難度較大,雖然目前國(guó)內(nèi)外不少科研單位都對(duì)此開(kāi)展了研究,但是由于發(fā)展時(shí)間短,起步較晚,目前的檢測(cè)技術(shù)依然不夠成熟,還存在較大的研究空間。在需要檢測(cè)出準(zhǔn)確時(shí)間邊界的應(yīng)用場(chǎng)景中,檢測(cè)方法主要依賴于有監(jiān)督學(xué)習(xí),由于音頻事件的時(shí)間邊界只能依賴于人工標(biāo)注,有監(jiān)督學(xué)習(xí)所用到的數(shù)據(jù)集往往規(guī)模較為有限。在數(shù)據(jù)集有限的情況下,如何構(gòu)建高性能的深度學(xué)習(xí)模型是目前的研究難點(diǎn)。本文開(kāi)展了基于深度學(xué)習(xí)的音頻事件檢測(cè)方法研究,主要從人工特征提取與深度學(xué)習(xí)建模兩個(gè)方面出發(fā),研究了梅爾頻率倒譜系數(shù)和對(duì)數(shù)梅爾譜特征的提取方法,圍繞著深度學(xué)習(xí)的基本理論,對(duì)卷積神經(jīng)網(wǎng)絡(luò)、循環(huán)神經(jīng)網(wǎng)絡(luò)和注意力機(jī)制開(kāi)展了研究,并在街道場(chǎng)景數(shù)據(jù)集上,對(duì)提出的檢測(cè)模型開(kāi)展了檢測(cè)分析。主要做了以下三個(gè)方面的工作:(1)建立了基于卷積神經(jīng)網(wǎng)絡(luò)的檢測(cè)模型,通過(guò)實(shí)驗(yàn)對(duì)四種特征提取方案開(kāi)展了檢測(cè)分析,并探究了梅爾頻段數(shù)對(duì)檢測(cè)性能的影響。采用基于對(duì)數(shù)梅... 

【文章頁(yè)數(shù)】:78 頁(yè)

【學(xué)位級(jí)別】:碩士

【文章目錄】:
摘要
abstract
第一章 緒論
    1.1 研究工作的背景與意義
    1.2 國(guó)內(nèi)外研究現(xiàn)狀
    1.3 本論文的結(jié)構(gòu)安排
第二章 音頻事件檢測(cè)方案設(shè)計(jì)
    2.1 總體方案設(shè)計(jì)
    2.2 評(píng)價(jià)指標(biāo)
        2.2.1 指標(biāo)統(tǒng)計(jì)方式
        2.2.2 準(zhǔn)確率、召回率和F1值
        2.2.3 錯(cuò)誤率
    2.3 數(shù)據(jù)集與交叉驗(yàn)證
    2.4 本章小結(jié)
第三章 基于CNN的音頻事件檢測(cè)方法
    3.1 特征譜圖提取
    3.2 深度學(xué)習(xí)建模
        3.2.1 深度學(xué)習(xí)原理
        3.2.2 隱藏層激活函數(shù)特性對(duì)比與選擇
        3.2.3 輸出層激活函數(shù)特性對(duì)比與選擇
        3.2.4 損失函數(shù)分析與選取
    3.3 基于卷積神經(jīng)網(wǎng)絡(luò)的檢測(cè)模型
        3.3.1 卷積神經(jīng)網(wǎng)絡(luò)原理
        3.3.2 隨機(jī)失活方法原理
    3.4 不同特征提取方案的檢測(cè)分析
    3.5 本章小結(jié)
第四章 基于CNN和 RNN的音頻事件檢測(cè)方法
    4.1 循環(huán)神經(jīng)網(wǎng)絡(luò)原理
    4.2 循環(huán)神經(jīng)單元特性分析與選擇
        4.2.1 長(zhǎng)短期記憶單元
        4.2.2 門控循環(huán)神經(jīng)單元
    4.3 雙向循環(huán)神經(jīng)網(wǎng)絡(luò)特性分析
    4.4 基于CNN和 RNN的神經(jīng)網(wǎng)絡(luò)檢測(cè)分析
    4.5 本章小結(jié)
第五章 基于注意力機(jī)制的改進(jìn)方法
    5.1 注意力機(jī)制
        5.1.1 SE注意力機(jī)制
        5.1.2 CBAM注意力機(jī)制
    5.2 基于SE的改進(jìn)模型檢測(cè)分析
    5.3 基于卷積注意力的改進(jìn)模型檢測(cè)分析
        5.3.1 基于CBAM空間注意力的神經(jīng)網(wǎng)絡(luò)檢測(cè)分析
        5.3.2 基于CBAM通道注意力的神經(jīng)網(wǎng)絡(luò)檢測(cè)分析
        5.3.3 基于CBAM的神經(jīng)網(wǎng)絡(luò)檢測(cè)分析
    5.4 不同檢測(cè)方法的檢測(cè)性能對(duì)比
    5.5 本章小結(jié)
第六章 全文總結(jié)與展望
    6.1 全文總結(jié)
    6.2 后續(xù)工作展望
致謝
參考文獻(xiàn)
攻讀碩士學(xué)位期間取得的成果


【參考文獻(xiàn)】:
期刊論文
[1]基于次聲監(jiān)測(cè)的泥石流實(shí)時(shí)預(yù)警系統(tǒng)[J]. 尚東方,劉敦龍,韓雪,王瑞璽.  計(jì)算機(jī)與現(xiàn)代化. 2020(03)
[2]MFCC-小波神經(jīng)網(wǎng)絡(luò)電氣主設(shè)備音頻監(jiān)控研究[J]. 王林,扈海澤,方夢(mèng)鴿.  電力與能源. 2019(06)
[3]基于水聲環(huán)境空間中多模態(tài)深度融合模型的目標(biāo)識(shí)別方法研究[J]. 李琦,孫桂玲,黃翠,劉頡,常哲,于金花,文洪濤.  海洋技術(shù)學(xué)報(bào). 2019(06)
[4]長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)水下目標(biāo)噪聲智能識(shí)別方法[J]. 張少康,王超,田德艷,張小川.  艦船科學(xué)技術(shù). 2019(23)
[5]基于音頻事件檢測(cè)和分類的音頻監(jiān)控系統(tǒng)背景模型自適應(yīng)方法研究[J]. 張愛(ài)英,倪崇嘉.  計(jì)算機(jī)科學(xué). 2016(09)
[6]基于K-L變換的水下目標(biāo)聲圖像識(shí)別方法研究[J]. 肖璐,馮西安.  計(jì)算機(jī)仿真. 2013(03)

碩士論文
[1]基于深層神經(jīng)網(wǎng)絡(luò)的多聲音事件檢測(cè)方法研究[D]. 劉亞明.中國(guó)科學(xué)技術(shù)大學(xué) 2019



本文編號(hào):3732941

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/xinxigongchenglunwen/3732941.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶fd58c***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com