天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 信息工程論文 >

基于深度神經(jīng)網(wǎng)絡的音頻事件檢測

發(fā)布時間:2017-10-27 02:05

  本文關(guān)鍵詞:基于深度神經(jīng)網(wǎng)絡的音頻事件檢測


  更多相關(guān)文章: 音頻事件檢測 深度神經(jīng)網(wǎng)絡 深層變換特征 分類器


【摘要】:隨著互聯(lián)網(wǎng)技術(shù)的快速發(fā)展及手持錄音設(shè)備的普及,人們可獲取的音頻數(shù)據(jù)呈爆炸式增長。為了有效管理、利用海量音頻數(shù)據(jù),音頻檢索技術(shù)成為研究熱點。音頻事件檢測是音頻檢索的重要組成部分,其主要任務是將連續(xù)音頻流中感興趣的音頻事件檢測出來。本文采用深度神經(jīng)網(wǎng)絡(Deep Neural Network,DNN)作為深層特征提取器和音頻事件分類器,提出一種基于深度神經(jīng)網(wǎng)絡的音頻事件檢測框架,并比較不同音頻特征及分類器在復雜音頻事件檢測中的性能差異。本文主要工作及貢獻如下:(1)針對傳統(tǒng)音頻特征不能有效刻畫復雜音頻事件之間差異的問題,提出一種基于多流多層深度神經(jīng)網(wǎng)絡的復雜音頻事件深層變換特征提取方法。首先以傳統(tǒng)音頻特征分別作為第一層深度神經(jīng)網(wǎng)絡的輸入并將該層深度神經(jīng)網(wǎng)絡瓶頸層的輸出作為第二層深度神經(jīng)網(wǎng)絡的輸入,然后將第二層深度神經(jīng)網(wǎng)絡瓶頸層的輸出作為深層變換特征。多個傳統(tǒng)音頻特征經(jīng)過多流多層深度神經(jīng)網(wǎng)絡學習變換之后,最終得到的音頻特征融合了傳統(tǒng)音頻特征的優(yōu)勢并進一步挖掘了新的輸入特征信息。采用取自BBC音頻事件數(shù)據(jù)庫和影視劇音頻事件數(shù)據(jù)庫的實驗數(shù)據(jù)進行測試,實驗結(jié)果表明:與目前被廣泛使用的梅爾頻率倒譜系數(shù)(Mel Frequency Cepstral Coefficients,MFCC)和Gabor特征相比,本文提取的特征在區(qū)分復雜音頻事件時獲得更好的分類效果。(2)將深度神經(jīng)網(wǎng)絡作為音頻事件分類器并結(jié)合(1)中提取的深層變換特征,提出一種基于深度神經(jīng)網(wǎng)絡的音頻事件檢測方法,并深入探討深層變換特征在音頻事件檢測時的抗噪性。該方法將深度神經(jīng)網(wǎng)絡既作為特征提取器又作為分類器,旨在利用深度神經(jīng)網(wǎng)絡的數(shù)據(jù)學習能力獲得更優(yōu)的音頻事件檢測性能。采用取自BBC音頻事件數(shù)據(jù)庫和影視劇音頻事件數(shù)據(jù)庫的實驗數(shù)據(jù)進行測試,實驗結(jié)果表明:與目前基于高斯混合模型、基于隱馬爾科夫模型和基于支持向量機的音頻事件檢測方法相比,本文方法獲得了更好的檢測結(jié)果。采用帶有Babble噪聲、Destroyerops噪聲、F16噪聲和Factory1噪聲的影視劇音頻事件數(shù)據(jù)集依次進行測試,深層變換特征比MFCC特征的平均F1值分別提高9.08%、12.01%、6.79%和13.64%;比Gabor特征的平均F1值分別提高5.39%、3.56%、4.75%和3.26%。采用帶有Babble噪聲、Destroyerops噪聲、F16噪聲和Factory1噪聲的BBC音頻事件數(shù)據(jù)集依次進行測試,深層變換特征比MFCC特征的平均F1值分別提高8.77%、10.64%、8.76%和10.40%;比Gabor特征的平均F1值分別提高11.19%、6.29%、7.04%和6.99%。上述結(jié)果表明:深層變換特征比MFCC特征、Gabor特征具有更好的抗噪性。綜上所述,本文基于深度神經(jīng)網(wǎng)絡深入探討音頻事件深層變換特征提取方法及檢測方法。實驗分析深層變換特征與傳統(tǒng)音頻特征、本文檢測方法與傳統(tǒng)檢測方法的性能差異,驗證了本文的深層變換特征及音頻事件檢測方法的有效性。
【關(guān)鍵詞】:音頻事件檢測 深度神經(jīng)網(wǎng)絡 深層變換特征 分類器
【學位授予單位】:華南理工大學
【學位級別】:碩士
【學位授予年份】:2016
【分類號】:TN912.3;TP183
【目錄】:
  • 摘要5-7
  • Abstract7-11
  • 第一章 緒論11-17
  • 1.1 研究背景與意義11-12
  • 1.2 國內(nèi)外研究現(xiàn)狀12-14
  • 1.3 論文主要研究內(nèi)容14-15
  • 1.4 論文結(jié)構(gòu)安排15-17
  • 第二章 音頻事件檢測理論基礎(chǔ)17-34
  • 2.1 常用特征17-21
  • 2.1.1 梅爾頻率倒譜系數(shù)17-18
  • 2.1.2 Gabor特征18-21
  • 2.2 常用分類器21-33
  • 2.2.1 高斯混合模型21-25
  • 2.2.2 隱馬爾科夫模型25-29
  • 2.2.3 支持向量機29-33
  • 2.3 本章小結(jié)33-34
  • 第三章 基于多流多層深度神經(jīng)網(wǎng)絡的深層特征提取34-53
  • 3.1 神經(jīng)網(wǎng)絡發(fā)展34-35
  • 3.2 深度神經(jīng)網(wǎng)絡基本原理35-39
  • 3.2.1 DNN數(shù)學表達式35-36
  • 3.2.2 隨機梯度下降算法36-37
  • 3.2.3 受限玻爾茲曼機37-39
  • 3.3 深層變換特征提取框架39-41
  • 3.3.1 深度神經(jīng)網(wǎng)絡參數(shù)初始化40-41
  • 3.3.2 深層變換特征提取41
  • 3.4 實驗設(shè)計41-45
  • 3.4.1 實驗數(shù)據(jù)42-43
  • 3.4.2 淺層音頻特征選取43-44
  • 3.4.3 實驗設(shè)置44
  • 3.4.4 評價指標44-45
  • 3.5 實驗結(jié)果分析45-52
  • 3.5.1 隱層數(shù)對特征分類性能影響45-47
  • 3.5.2 各種特征分類性能比較47-52
  • 3.6 本章小結(jié)52-53
  • 第四章 基于深度神經(jīng)網(wǎng)絡的音頻事件檢測53-70
  • 4.1 音頻事件檢測思想53
  • 4.2 音頻事件檢測框架53-54
  • 4.3 實驗設(shè)計54-58
  • 4.3.1 實驗數(shù)據(jù)55-57
  • 4.3.2 評價指標57-58
  • 4.3.3 實驗設(shè)置58
  • 4.4 實驗結(jié)果分析58-69
  • 4.4.1 DNN分類器結(jié)構(gòu)確定58-59
  • 4.4.2 不同分類器檢測結(jié)果對比59-60
  • 4.4.3 不同特征魯棒性對比60-69
  • 4.5 本章小結(jié)69-70
  • 結(jié)論70-72
  • 參考文獻72-79
  • 攻讀碩士學位期間取得的研究成果79-80
  • 致謝80-82
  • 附件82

【相似文獻】

中國期刊全文數(shù)據(jù)庫 前10條

1 洪宇;張宇;范基禮;劉挺;李生;;基于子話題分治匹配的新事件檢測[J];計算機學報;2008年04期

2 史新宏,蔡伯根;高速公路自動事件檢測算法[J];交通運輸系統(tǒng)工程與信息;2001年04期

3 周林英;朱斌;趙忠杰;;基于支持向量機的高速公路事件檢測算法[J];系統(tǒng)仿真技術(shù);2010年03期

4 陳艷艷;田啟華;;公交調(diào)度系統(tǒng)事件檢測算法研究[J];北京工業(yè)大學學報;2011年12期

5 郝艷哲;;京秦高速公路視頻事件檢測系統(tǒng)應用[J];中國交通信息化;2013年04期

6 王闖舟;;提升事件檢測的商業(yè)價值[J];軟件世界;2007年20期

7 王彩琴;;基于智能分析的高速公路事件檢測系統(tǒng)的研究與開發(fā)[J];浙江統(tǒng)計;2007年11期

8 王穎穎;張峗;胡乃靜;;在線新事件檢測系統(tǒng)中的性能提升策略[J];計算機工程;2008年15期

9 倉玉;洪宇;姚建民;朱巧明;;基于時序話題模型的新事件檢測[J];智能計算機與應用;2011年03期

10 樓曉俊;鮑必賽;劉海濤;;分布式信息融合的物聯(lián)網(wǎng)事件檢測方法[J];南京郵電大學學報(自然科學版);2012年01期

中國重要會議論文全文數(shù)據(jù)庫 前10條

1 洪宇;張宇;范基禮;劉挺;李生;;基于子話題分治匹配的新事件檢測[A];第三屆全國信息檢索與內(nèi)容安全學術(shù)會議論文集[C];2007年

2 劉霄;邵健;莊越挺;;基于主題模型的網(wǎng)絡突發(fā)熱點事件檢測[A];第七屆和諧人機環(huán)境聯(lián)合學術(shù)會議(HHME2011)論文集【poster】[C];2011年

3 胡佳鋒;金蓓弘;陳海彪;;空間事件檢測的加速策略研究[A];第七屆和諧人機環(huán)境聯(lián)合學術(shù)會議(HHME2011)論文集【oral】[C];2011年

4 萬濤;陳學武;王川久;;高速公路事件自動檢測算法研究綜述[A];第一屆中國智能交通年會論文集[C];2005年

5 張闊;李涓子;吳剛;;基于關(guān)鍵詞元的話題內(nèi)事件檢測[A];第三屆全國信息檢索與內(nèi)容安全學術(shù)會議論文集[C];2007年

6 覃頻頻;許登元;姚起宏;黃大明;;基于表決融合的高速公路事件檢測算法融合[A];'2006系統(tǒng)仿真技術(shù)及其應用學術(shù)交流會論文集[C];2006年

7 陳俊;李國輝;;擁擠視頻監(jiān)控中的事件檢測[A];第七屆和諧人機環(huán)境聯(lián)合學術(shù)會議(HHME2011)論文集【poster】[C];2011年

8 張永忠;趙靜;;基于事件檢測算法的交通數(shù)據(jù)分析系統(tǒng)[A];中國計量協(xié)會冶金分會2008年會論文集[C];2008年

9 劉海龍;李戰(zhàn)懷;陳群;;RFID供應鏈系統(tǒng)中的在線復雜事件檢測方法[A];NDBC2010第27屆中國數(shù)據(jù)庫學術(shù)會議論文集A輯二[C];2010年

10 周春姐;孟小峰;文潔;;Flickr中的復合事件檢測[A];NDBC2010第27屆中國數(shù)據(jù)庫學術(shù)會議論文集(B輯)[C];2010年

中國重要報紙全文數(shù)據(jù)庫 前2條

1 王闖舟;事件檢測提升服務的商業(yè)價值[N];計算機世界;2006年

2 杭州海康威視數(shù)字技術(shù)股份有限公司 浦世亮;IVS技術(shù)在城市安防系統(tǒng)中的應用[N];計算機世界;2008年

中國博士學位論文全文數(shù)據(jù)庫 前4條

1 劉昌余;多媒體事件檢測中的關(guān)鍵技術(shù)研究[D];華南理工大學;2015年

2 覃頻頻;基于信息融合的高速公路事件檢測建模與仿真[D];西南交通大學;2007年

3 余柳;基于移動源數(shù)據(jù)的城市快速交通事件檢測W-CUSUM算法與評價[D];北京交通大學;2010年

4 柯佳;基于語義的視頻事件檢測分析方法研究[D];江蘇大學;2013年

中國碩士學位論文全文數(shù)據(jù)庫 前10條

1 孫方園;基于圖的中文微博災難事件檢測[D];浙江大學;2016年

2 趙偉;足球視頻精彩事件檢測算法研究[D];北京理工大學;2016年

3 張玉;基于微博的突發(fā)事件檢測方法研究[D];蘭州大學;2016年

4 吳維耀;制造業(yè)物聯(lián)網(wǎng)基于事件優(yōu)先級的復雜事件檢測方法研究[D];廣東工業(yè)大學;2016年

5 金海;基于深度神經(jīng)網(wǎng)絡的音頻事件檢測[D];華南理工大學;2016年

6 李紅梅;基于微博的突發(fā)事件檢測研究[D];南京理工大學;2016年

7 周林英;基于支持向量機的高速公路事件檢測算法[D];長安大學;2009年

8 熊偉晴;基于位置信息的事件檢測[D];哈爾濱工業(yè)大學;2015年

9 肖軍;基于車檢器數(shù)據(jù)的高速公路事件檢測可靠性提升技術(shù)研究[D];重慶大學;2015年

10 龍睿;針對微博數(shù)據(jù)的事件檢測、跟蹤及摘要生成[D];上海交通大學;2012年

,

本文編號:1101433

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/xinxigongchenglunwen/1101433.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶3b680***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com