基于聽覺特性卷積神經(jīng)網(wǎng)絡(luò)的音樂分類方法研究
發(fā)布時間:2021-11-26 12:40
從卡帶時代、CD時代、再到數(shù)字音樂時代,音樂數(shù)量呈現(xiàn)爆發(fā)式增長。唯有對海量音樂資源進(jìn)行分類,建立高效音樂檢索系統(tǒng),才能幫助人們快速地搜索到期望的音樂。傳統(tǒng)音樂分類方法比較依賴于人工標(biāo)注。在大數(shù)據(jù)時代,通過人工標(biāo)注來完成音樂分類任務(wù)是低效率且不現(xiàn)實的。因此音樂自動分類逐漸成為研究熱點,并被廣泛使用。音樂自動分類是實現(xiàn)音樂資源快速、有效檢索的基礎(chǔ),其擁有巨大潛在應(yīng)用需求,因此音樂自動分類方法具有重要的研究意義。音樂自動分類方法有兩個關(guān)鍵步驟:特征提取和分類方法。本文基于聽覺特性對特征提取和分類方法兩個關(guān)鍵步驟進(jìn)行改進(jìn),針對音樂分類任務(wù)提出基于聽覺特性卷積神經(jīng)網(wǎng)絡(luò)的音樂分類方法。本文的主要工作和創(chuàng)新點如下:(1)在特征提取中,本文借鑒語音信號處理常用的耳蝸濾波器倒譜系數(shù),將其應(yīng)用于音樂特征提取中。耳蝸濾波器倒譜系數(shù)提取流程模擬了人耳聽覺系統(tǒng)感知聲音的過程,使提取到的特征更符合人耳聽覺特性。由于音樂信號頻域跨度相比于語音信號更寬,因此本文在耳蝸濾波器倒譜系數(shù)的提取步驟中增加了低頻和高頻的濾波器,使提取到的音樂特征更全、更詳細(xì),直接提高特征提取的質(zhì)量。(2)在分類方法中,本文借鑒了Lecun等人...
【文章來源】:華南理工大學(xué)廣東省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:78 頁
【學(xué)位級別】:碩士
【部分圖文】:
人耳結(jié)構(gòu)
第三章 時頻倒譜系數(shù)從公式(3-13)可以看出,不同于傅里葉變換只有頻率 這一個變量的性質(zhì),小變換有兩個變量:伸縮因子 a 和平移因子 b。伸縮因子 a 控制母小波 t 的伸縮,把小波由 t 變換成 t a ,假設(shè) a>1,那么當(dāng) a 越大使,則 的時域?qū)挾缺?t寬;反過來,a 越小,則的 時域?qū)挾纫苍秸6揭埔蜃?b 控制著母小波 時間平移,確定了對輸入信號 x(t)的分析時間點。因此,伸縮因子 a 和平移因子 b 聯(lián)起來控制了對輸入信號 x(t)進(jìn)行分析的時間點和分析的時間寬度,伸縮因子 a 和平移子 b 對母小波的影響如圖 3-7 所示:
【參考文獻(xiàn)】:
期刊論文
[1]融合Mel系數(shù)和kNN的語音端點檢測[J]. 韓云飛,張?zhí)t,白濤. 信息技術(shù). 2017(03)
[2]基于梅爾頻率倒譜系數(shù)與翻轉(zhuǎn)梅爾頻率倒譜系數(shù)的說話人識別方法[J]. 胡峰松,張璇. 計算機應(yīng)用. 2012(09)
[3]音樂作品風(fēng)格流派的神經(jīng)網(wǎng)絡(luò)識別方法研究[J]. 喻曉雯,張楠,張勇. 計算機工程與應(yīng)用. 2011(27)
[4]音樂醫(yī)學(xué)及其臨床應(yīng)用[J]. 敖欣,黃湘,劉丹. 實用中西醫(yī)結(jié)合臨床. 2004(03)
[5]語音/音樂自動分類中的特征分析[J]. 盧堅,陳毅松,孫正興,張福炎. 計算機輔助設(shè)計與圖形學(xué)學(xué)報. 2002(03)
[6]從傅立葉變化到小波變化[J]. 劉魯源,李宗勃. 自動化與儀表. 2000(06)
碩士論文
[1]基于聲學(xué)特征的樂器識別研究[D]. 林玉志.華南理工大學(xué) 2012
本文編號:3520164
【文章來源】:華南理工大學(xué)廣東省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:78 頁
【學(xué)位級別】:碩士
【部分圖文】:
人耳結(jié)構(gòu)
第三章 時頻倒譜系數(shù)從公式(3-13)可以看出,不同于傅里葉變換只有頻率 這一個變量的性質(zhì),小變換有兩個變量:伸縮因子 a 和平移因子 b。伸縮因子 a 控制母小波 t 的伸縮,把小波由 t 變換成 t a ,假設(shè) a>1,那么當(dāng) a 越大使,則 的時域?qū)挾缺?t寬;反過來,a 越小,則的 時域?qū)挾纫苍秸6揭埔蜃?b 控制著母小波 時間平移,確定了對輸入信號 x(t)的分析時間點。因此,伸縮因子 a 和平移因子 b 聯(lián)起來控制了對輸入信號 x(t)進(jìn)行分析的時間點和分析的時間寬度,伸縮因子 a 和平移子 b 對母小波的影響如圖 3-7 所示:
【參考文獻(xiàn)】:
期刊論文
[1]融合Mel系數(shù)和kNN的語音端點檢測[J]. 韓云飛,張?zhí)t,白濤. 信息技術(shù). 2017(03)
[2]基于梅爾頻率倒譜系數(shù)與翻轉(zhuǎn)梅爾頻率倒譜系數(shù)的說話人識別方法[J]. 胡峰松,張璇. 計算機應(yīng)用. 2012(09)
[3]音樂作品風(fēng)格流派的神經(jīng)網(wǎng)絡(luò)識別方法研究[J]. 喻曉雯,張楠,張勇. 計算機工程與應(yīng)用. 2011(27)
[4]音樂醫(yī)學(xué)及其臨床應(yīng)用[J]. 敖欣,黃湘,劉丹. 實用中西醫(yī)結(jié)合臨床. 2004(03)
[5]語音/音樂自動分類中的特征分析[J]. 盧堅,陳毅松,孫正興,張福炎. 計算機輔助設(shè)計與圖形學(xué)學(xué)報. 2002(03)
[6]從傅立葉變化到小波變化[J]. 劉魯源,李宗勃. 自動化與儀表. 2000(06)
碩士論文
[1]基于聲學(xué)特征的樂器識別研究[D]. 林玉志.華南理工大學(xué) 2012
本文編號:3520164
本文鏈接:http://www.sikaile.net/kejilunwen/wltx/3520164.html
最近更新
教材專著