天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 信息工程論文 >

基于深度學(xué)習(xí)的聲目標(biāo)識(shí)別方法研究

發(fā)布時(shí)間:2021-04-22 16:03
  聲目標(biāo)識(shí)別是聲音信號(hào)處理領(lǐng)域的熱點(diǎn)研究課題,致力于通過分析聲音信號(hào)中所包含的復(fù)雜特征,識(shí)別其中包含的語義信息,最終實(shí)現(xiàn)聲目標(biāo)的識(shí)別。聲音作為信息的主要載體之一,聲目標(biāo)的識(shí)別可廣泛用于安全監(jiān)管、醫(yī)療監(jiān)護(hù)、生態(tài)系統(tǒng)調(diào)查和反恐防暴等領(lǐng)域。針對(duì)復(fù)雜環(huán)境下多種聲音難以得到有效表征和噪聲環(huán)境下聲目標(biāo)的識(shí)別較易誤判且易受噪聲變化影響的問題,以ESC10、ESC50和UrbanSound8K三個(gè)常用的環(huán)境聲音分類基準(zhǔn)數(shù)據(jù)庫和自建數(shù)據(jù)庫AUDIO-5作為研究對(duì)象,進(jìn)行了噪聲環(huán)境下聲信號(hào)的表征和識(shí)別研究。本文主要研究?jī)?nèi)容和創(chuàng)新性成果如下:(1)大量閱讀并分析整理了聲目標(biāo)識(shí)別的國(guó)內(nèi)外相關(guān)研究現(xiàn)狀,發(fā)現(xiàn)基于深度學(xué)習(xí)的聲目標(biāo)識(shí)別方法往往具有更好的識(shí)別性能,對(duì)多類別的聲音具有更好的泛化能力。此外,現(xiàn)有的聲信號(hào)特征提取方法對(duì)聲音的特征表達(dá)還具有較大的局限性。通過研究有效的聲信號(hào)特征表達(dá)和深度學(xué)習(xí)方法,尋找更優(yōu)的特征提取方法和結(jié)構(gòu)化網(wǎng)絡(luò)模型并在聲目標(biāo)識(shí)別上進(jìn)行實(shí)踐應(yīng)用。(2)針對(duì)現(xiàn)實(shí)環(huán)境中不同場(chǎng)景下的背景噪聲差距較大,采用固定閾值的端點(diǎn)檢測(cè)常出現(xiàn)噪聲和聲目標(biāo)有效特征混淆從而導(dǎo)致檢測(cè)準(zhǔn)確度較低的問題,提出了自適應(yīng)的單參... 

【文章來源】:西南科技大學(xué)四川省

【文章頁數(shù)】:58 頁

【學(xué)位級(jí)別】:碩士

【文章目錄】:
摘要
abstract
1 緒論
    1.1 研究背景和意義
    1.2 國(guó)內(nèi)外研究現(xiàn)狀
    1.3 本文的研究?jī)?nèi)容及組織結(jié)構(gòu)
        1.3.1 主要研究?jī)?nèi)容
        1.3.2 組織結(jié)構(gòu)
2 聲信號(hào)的樣本獲取及預(yù)處理
    2.1 聲信號(hào)的樣本獲取
        2.1.1 公共數(shù)據(jù)庫
        2.1.2 自建數(shù)據(jù)庫
    2.2 聲信號(hào)的預(yù)處理
        2.2.1 預(yù)加重
        2.2.2 分幀加窗
        2.2.3 端點(diǎn)檢測(cè)
    2.3 本章小結(jié)
3 聲信號(hào)的特征參數(shù)提取方法
    3.1 概述
    3.2 常用時(shí)頻特征
        3.2.1 對(duì)數(shù)梅爾特征
        3.2.2 耳蝸圖特征
        3.2.3 恒定Q變換特征
    3.3 多頻率分辨率特征
        3.3.1 基本原理
        3.3.2 參數(shù)選擇依據(jù)
        3.3.3 實(shí)驗(yàn)結(jié)果及分析
    3.4 本章小結(jié)
4 聲目標(biāo)識(shí)別的網(wǎng)絡(luò)模型
    4.1 概述
    4.2 深度可分離卷積
    4.3 具有多特征通道的空間注意力網(wǎng)絡(luò)模型
        4.3.1 基本原理
        4.3.2 網(wǎng)絡(luò)結(jié)構(gòu)
    4.4 實(shí)驗(yàn)平臺(tái)及網(wǎng)絡(luò)訓(xùn)練參數(shù)設(shè)置
    4.5 實(shí)驗(yàn)結(jié)果及分析
    4.6 本章小結(jié)
5 聲目標(biāo)識(shí)別系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)
    5.1 概述
    5.2 聲目標(biāo)識(shí)別系統(tǒng)總體設(shè)計(jì)
    5.3 聲目標(biāo)識(shí)別硬件與軟件系統(tǒng)
        5.3.1 硬件系統(tǒng)
        5.3.2 軟件系統(tǒng)及界面展示
        5.3.3 仿真模式
        5.3.4 學(xué)習(xí)模式
        5.3.5 在線模式
    5.4 聲目標(biāo)識(shí)別測(cè)試方案及結(jié)果
        5.4.1 仿真模式測(cè)試
        5.4.2 學(xué)習(xí)模式測(cè)試
        5.4.3 在線模式測(cè)試
    5.5 本章小結(jié)
總結(jié)與展望
    論文總結(jié)
    研究展望
致謝
參考文獻(xiàn)
攻讀碩士學(xué)位期間取得的研究成果


【參考文獻(xiàn)】:
期刊論文
[1]一種時(shí)頻平滑的深度神經(jīng)網(wǎng)絡(luò)語音增強(qiáng)方法[J]. 袁文浩,梁春燕,婁迎曦,房超,王志強(qiáng).  西安電子科技大學(xué)學(xué)報(bào). 2019(04)
[2]基于特征遷移的多物種鳥聲識(shí)別方法[J]. 劉昊天,姜海燕,舒欣,徐彥,伍艷蓮,郭小清.  數(shù)據(jù)采集與處理. 2017(06)
[3]公共場(chǎng)所典型異常聲音的特征提取[J]. 欒少文,龔衛(wèi)國(guó).  計(jì)算機(jī)工程. 2010(07)
[4]基于MFCC和短時(shí)能量混合的異常聲音識(shí)別算法[J]. 呂霄云,王宏霞.  計(jì)算機(jī)應(yīng)用. 2010(03)



本文編號(hào):3154063

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/xinxigongchenglunwen/3154063.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶c9ba4***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com