天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 路橋論文 >

基于CRNN模型的弱標(biāo)簽城市交通工具聲識(shí)別檢測(cè)

發(fā)布時(shí)間:2021-04-10 06:40
  為了實(shí)現(xiàn)智慧城市、智能交通等關(guān)鍵技術(shù),對(duì)城市中交通工具發(fā)出的聲音進(jìn)行識(shí)別檢測(cè)變得日益重要。目前大多數(shù)聲音識(shí)別檢測(cè)的研究都是基于強(qiáng)標(biāo)簽數(shù)據(jù)集,但獲取強(qiáng)標(biāo)簽音頻數(shù)據(jù)比較困難,所以我們需要研究如何在弱標(biāo)簽數(shù)據(jù)集下對(duì)城市交通工具聲進(jìn)行識(shí)別檢測(cè)。論文從AudioSet數(shù)據(jù)庫(kù)中選取了一個(gè)包含17種城市交通工具聲的弱標(biāo)簽數(shù)據(jù)集進(jìn)行研究,該數(shù)據(jù)集中每一類(lèi)聲音的樣本數(shù)分布不平衡,而且數(shù)據(jù)集中的音頻樣本存在弱標(biāo)簽性、多源性的問(wèn)題。論文將圍繞這三個(gè)問(wèn)題,就如何在弱標(biāo)簽數(shù)據(jù)集下提升對(duì)城市交通工具聲的識(shí)別檢測(cè)精度展開(kāi)研究。數(shù)據(jù)集中聲音的弱標(biāo)簽性,使得傳統(tǒng)的聲音識(shí)別檢測(cè)模型不再適用。論文使用聲音的對(duì)數(shù)梅爾頻譜系數(shù)(MFSC)組成的時(shí)頻圖作為特征,并且針對(duì)研究任務(wù)的特點(diǎn)搭建了一種卷積循環(huán)神經(jīng)網(wǎng)絡(luò)(CRNN)作為聲音識(shí)別檢測(cè)系統(tǒng)的基線模型,該模型由卷積神經(jīng)網(wǎng)絡(luò)(CNN)和循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)組合而成,可以更充分地利用聲音特征,適用于弱標(biāo)簽聲音的識(shí)別檢測(cè)任務(wù)。針對(duì)數(shù)據(jù)集中每一類(lèi)聲音樣本分布不平衡的問(wèn)題,論文使用了一種按比例選取訓(xùn)練批次數(shù)據(jù)的方法,該方法可以使模型充分學(xué)習(xí)到每一類(lèi)聲音的特征,緩解了模型訓(xùn)練時(shí)的有偏性問(wèn)題... 

【文章來(lái)源】:西安電子科技大學(xué)陜西省 211工程院校 教育部直屬院校

【文章頁(yè)數(shù)】:93 頁(yè)

【學(xué)位級(jí)別】:碩士

【文章目錄】:
摘要
ABSTRACT
符號(hào)對(duì)照表
縮略語(yǔ)對(duì)照表
第一章 緒論
    1.1 研究背景及意義
    1.2 國(guó)內(nèi)外研究現(xiàn)狀
    1.3 研究?jī)?nèi)容及存在問(wèn)題
    1.4 論文結(jié)構(gòu)安排
第二章 聲音識(shí)別檢測(cè)相關(guān)理論
    2.1 支持向量機(jī)
        2.1.1 SVM分類(lèi)思想
        2.1.2 核函數(shù)
        2.1.3 SVM多分類(lèi)
    2.2 多層感知機(jī)
        2.2.1 前向傳播
        2.2.2 反向傳播
    2.3 卷積神經(jīng)網(wǎng)絡(luò)
        2.3.1 卷積與池化
        2.3.2 CNN反向傳播
    2.4 循環(huán)神經(jīng)網(wǎng)絡(luò)
        2.4.1 RNN前向傳播
        2.4.2 RNN反向傳播
    2.5 本章小結(jié)
第三章 數(shù)據(jù)處理與特征提取
    3.1 數(shù)據(jù)集介紹
    3.2 數(shù)據(jù)預(yù)處理和特征提取
        3.2.1 MFSC特征提取
        3.2.2 MFCC特征提取
    3.3 仿真實(shí)驗(yàn)
        3.3.1 特征選取
        3.3.2 識(shí)別任務(wù)評(píng)估指標(biāo)
        3.3.3 模型參數(shù)設(shè)置
        3.3.4 仿真結(jié)果對(duì)比及分析
    3.4 本章小結(jié)
第四章 聲音識(shí)別檢測(cè)模型
    4.1 卷積循環(huán)神經(jīng)網(wǎng)絡(luò)
        4.1.1 CNN部分
        4.1.2 RNN部分
    4.2 識(shí)別與檢測(cè)
        4.2.1 傳統(tǒng)聲音識(shí)別檢測(cè)方法
        4.2.2 重要性加權(quán)識(shí)別方法
    4.3 仿真實(shí)驗(yàn)
        4.3.1 數(shù)據(jù)平衡方法
        4.3.2 模型結(jié)構(gòu)及參數(shù)設(shè)置
        4.3.3 檢測(cè)任務(wù)評(píng)估指標(biāo)
        4.3.4 仿真結(jié)果及對(duì)比分析
    4.4 本章小結(jié)
第五章 多尺度注意力融合和多滑窗分幀
    5.1 多尺度注意力融合
        5.1.1 注意力門(mén)控機(jī)制
        5.1.2 多尺度卷積融合
    5.2 多滑窗分幀
    5.3 仿真實(shí)驗(yàn)
        5.3.1 模型結(jié)構(gòu)及參數(shù)設(shè)置
        5.3.2 多模型融合
        5.3.3 仿真結(jié)果及對(duì)比分析
    5.4 本章小結(jié)
第六章 總結(jié)與展望
    6.1 工作總結(jié)
    6.2 研究展望
參考文獻(xiàn)
致謝
作者簡(jiǎn)介


【參考文獻(xiàn)】:
期刊論文
[1]基于EEMD的異常聲音多類(lèi)識(shí)別算法[J]. 韋娟,岳鳳麗,仇鵬,寧方立.  華中科技大學(xué)學(xué)報(bào)(自然科學(xué)版). 2018(07)



本文編號(hào):3129158

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/daoluqiaoliang/3129158.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶76cab***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com