基于稀疏表示和深度神經(jīng)網(wǎng)絡(luò)模型的西洋樂器自動分類方法
本文選題:字典庫 切入點:稀疏重構(gòu) 出處:《南京理工大學》2017年碩士論文 論文類型:學位論文
【摘要】:隨著現(xiàn)代社會科技的快速發(fā)展,數(shù)字音樂的數(shù)量也以海量的方式增長,為了方便用戶音樂檢索,對音樂進行有效合理的分類十分重要。但音樂基數(shù)多,每天新的單曲數(shù)又不斷增加,采取人工的方式對音樂進行分類不切實際。因此,本文采用深度神經(jīng)網(wǎng)絡(luò)模型對音樂提取特征實現(xiàn)自動分類。與此同時,由于音樂信號具備稀疏性的特點,本文創(chuàng)新型地提出將稀疏特征與深度神經(jīng)網(wǎng)絡(luò)模型相結(jié)合的方法,實現(xiàn)音樂信號的自動分類。音樂信號分類標準眾多,本文旨在將提出的新方法應(yīng)用在西洋樂器的自動分類上。本文首先介紹了音樂信號的常見特征,包括基本的物理學特征和人耳感知的心理學角度的特征,與此同時還介紹了人耳聽覺系統(tǒng)的特性。接著介紹了音樂自動分類的理論,包含對音樂的特征提取,并著重介紹了本文所采用的深度神經(jīng)網(wǎng)絡(luò)模型方面的相關(guān)概念。然后研究了音樂信號的稀疏特征提取過程,創(chuàng)新性地引入新型的稀疏表示字典庫,該字典庫是基于不同樂器發(fā)出音色頻率間的差異。本文通過MATLAB仿真實驗,對比了基于傳統(tǒng)字典庫和基于本文構(gòu)建字典庫下的稀疏重構(gòu)結(jié)果,證明了基于本文構(gòu)建字典庫下進行稀疏重構(gòu)效果優(yōu)于傳統(tǒng)字典庫。最后本文研究了基于稀疏表示和深度神經(jīng)網(wǎng)絡(luò)模型結(jié)合的西洋樂器自動分類情況,傳統(tǒng)的深度神經(jīng)網(wǎng)絡(luò)模型輸入端為音頻信號的梅爾頻率倒譜系數(shù)(Mel Frequency Cepstrum Coefficient,MFCC),本文創(chuàng)新性地使用音頻信號的稀疏特征作為深度神經(jīng)網(wǎng)絡(luò)模型輸入端,在此基礎(chǔ)上訓練深度神經(jīng)網(wǎng)絡(luò)模型參數(shù),實現(xiàn)西洋樂器的自動分類。本文采用Python腳本語言,通過實驗證明了基于稀疏特征和深度神經(jīng)網(wǎng)絡(luò)模型相結(jié)合的方法,實現(xiàn)西洋樂器自動分類,準確率可達82%。
[Abstract]:With the rapid development of modern social science and technology, the number of digital music is also increasing in a massive way. In order to facilitate users' music retrieval, it is very important to classify music effectively and reasonably. The number of new single songs is increasing every day, so it is impractical to classify music manually. Therefore, the depth neural network model is used to realize the automatic classification of music features in this paper. Due to the sparsity of music signals, this paper proposes an innovative method to combine sparse features with depth neural network model to realize the automatic classification of music signals. The purpose of this paper is to apply the proposed new method to the automatic classification of western musical instruments. This paper first introduces the common features of musical signals, including the basic physical features and the psychological features of human ear perception. At the same time, it also introduces the characteristics of human ear and hearing system, and then introduces the theory of automatic music classification, including the feature extraction of music. Then the sparse feature extraction process of music signal is studied, and a new sparse representation dictionary is introduced. The dictionary is based on the difference of timbre frequency between different musical instruments. This paper compares the sparse reconstruction results based on the traditional dictionary library and the dictionary database based on this paper through MATLAB simulation experiments. It is proved that the effect of sparse reconstruction based on this paper is better than that of traditional dictionary library. Finally, the paper studies the automatic classification of western musical instruments based on sparse representation and depth neural network model. The traditional depth neural network model input end is Mel Frequency Cepstrum efficient Mel frequency cepstrum. In this paper, the sparse feature of audio signal is innovatively used as the input of depth neural network model. On this basis, the parameters of the deep neural network model are trained to realize the automatic classification of western musical instruments. In this paper, the method based on sparse feature and depth neural network model is proved by using Python script language. The automatic classification of western musical instruments is realized, and the accuracy rate is up to 82.
【學位授予單位】:南京理工大學
【學位級別】:碩士
【學位授予年份】:2017
【分類號】:TP183;TN912.3
【相似文獻】
相關(guān)期刊論文 前10條
1 李映;張艷寧;許星;;基于信號稀疏表示的形態(tài)成分分析:進展和展望[J];電子學報;2009年01期
2 趙瑞珍;王飛;羅阿理;張彥霞;;基于稀疏表示的譜線自動提取方法[J];光譜學與光譜分析;2009年07期
3 楊蜀秦;寧紀鋒;何東健;;基于稀疏表示的大米品種識別[J];農(nóng)業(yè)工程學報;2011年03期
4 史加榮;楊威;魏宗田;;基于非負稀疏表示的人臉識別[J];計算機工程與設(shè)計;2012年05期
5 高志榮;熊承義;笪邦友;;改進的基于殘差加權(quán)的稀疏表示人臉識別[J];中南民族大學學報(自然科學版);2012年03期
6 朱杰;楊萬扣;唐振民;;基于字典學習的核稀疏表示人臉識別方法[J];模式識別與人工智能;2012年05期
7 耿耀君;張軍英;袁細國;;一種基于稀疏表示系數(shù)的特征相關(guān)性測度[J];模式識別與人工智能;2013年01期
8 張疆勤;廖海斌;李原;;基于因子分析與稀疏表示的多姿態(tài)人臉識別[J];計算機工程與應(yīng)用;2013年05期
9 李正周;王會改;劉梅;丁浩;金鋼;;基于形態(tài)成分稀疏表示的紅外小弱目標檢測[J];彈箭與制導學報;2013年04期
10 胡正平;趙淑歡;李靜;;基于塊稀疏遞推殘差分析的稀疏表示遮擋魯棒識別算法研究[J];模式識別與人工智能;2014年01期
相關(guān)會議論文 前3條
1 何愛香;劉玉春;魏廣芬;;基于稀疏表示的煤矸界面識別研究[A];虛擬運營與云計算——第十八屆全國青年通信學術(shù)年會論文集(上冊)[C];2013年
2 樊亞翔;孫浩;周石琳;鄒煥新;;基于元樣本稀疏表示的多視角目標識別[A];2013年中國智能自動化學術(shù)會議論文集(第五分冊)[C];2013年
3 葛鳳翔;任歲玲;郭鑫;郭良浩;孫波;;微弱信號處理及其研究進展[A];中國聲學學會水聲學分會2013年全國水聲學學術(shù)會議論文集[C];2013年
相關(guān)博士學位論文 前10條
1 李進明;基于稀疏表示的圖像超分辨率重建方法研究[D];重慶大學;2015年
2 王亞寧;基于信號稀疏表示的電機故障診斷研究[D];河北工業(yè)大學;2014年
3 姚明海;視頻異常事件檢測與認證方法研究[D];東北師范大學;2015年
4 黃國華;蛋白質(zhì)翻譯后修飾位點與藥物適應(yīng)癥預(yù)測方法研究[D];上海大學;2015年
5 王瑾;基于稀疏表示的數(shù)據(jù)收集、復原與壓縮研究[D];北京工業(yè)大學;2015年
6 王文卿;基于融合框架與稀疏表示的遙感影像銳化[D];西安電子科技大學;2015年
7 解虎;高維小樣本陣列自適應(yīng)信號處理方法研究[D];西安電子科技大學;2015年
8 秦振濤;基于稀疏表示及字典學習遙感圖像處理關(guān)鍵技術(shù)研究[D];成都理工大學;2015年
9 薛明;基于稀疏表示的在線目標跟蹤研究[D];上海交通大學;2014年
10 孫樂;空譜聯(lián)合先驗的高光譜圖像解混與分類方法[D];南京理工大學;2014年
相關(guān)碩士學位論文 前10條
1 王道文;基于稀疏表示的目標跟蹤算法研究[D];華南理工大學;2015年
2 李哲;基于稀疏表示和LS-SVM的心電信號分類[D];河北大學;2015年
3 孫雪青;Shearlet變換和稀疏表示相結(jié)合的甲狀腺結(jié)節(jié)圖像融合[D];河北大學;2015年
4 吳麗璇;基于稀疏表示的微聚焦X射線圖像去噪方法[D];華南理工大學;2015年
5 趙孝磊;基于圖像分塊稀疏表示的人臉識別算法研究[D];南京信息工程大學;2015年
6 黃志明;基于辨別式稀疏字典學習的視覺追蹤算法研究[D];華南理工大學;2015年
7 張鈴華;非約束環(huán)境下的稀疏表示人臉識別算法研究[D];南京信息工程大學;2015年
8 賀妍斐;基于稀疏表示與自適應(yīng)倒易晶胞的遙感圖像復原方法研究[D];南京信息工程大學;2015年
9 楊爍;電能質(zhì)量擾動信號的稀疏表示/壓縮采樣研究[D];西南交通大學;2015年
10 應(yīng)艷麗;基于低秩稀疏表示的目標跟蹤算法研究[D];西南交通大學;2015年
,本文編號:1613321
本文鏈接:http://www.sikaile.net/kejilunwen/xinxigongchenglunwen/1613321.html