基于深度學習的哼唱音頻樂譜識別技術研究
【圖文】:
逡逑總體的技術路線如圖1.1所示。逡逑哼唱音頻數(shù)據(jù)集逡逑0邋0邋0逡逑DSD100邋MedleyDB邋自行錄制逡逑邐邋Y逡逑哼唱音頻處理逡逑y逡逑哼唱識別神經(jīng)網(wǎng)絡模型逡逑卷積層邋循環(huán)層邋批量歸一化逡逑ReLU邐Dropout邋?邋?邋?逡逑邐邋邐^邋r邐逡逑卜此恮叫邐,目鴨識別.逡逑Bottle邋框架邐^邐Web邋服務邐邐逡逑邐?哼唱識別系統(tǒng)逡逑React邋Native框架邐^邋D邋SSffl邋H逡逑圖1.1本文技術路線逡逑1.4論文組織結構逡逑本文主要研究基于深度學習的哼唱音頻識別問題,將闡述研宄中使用到的相逡逑關技術的原理和理論基礎、實驗使用的網(wǎng)絡模型以及實驗和結果分析。論文分為逡逑六個章節(jié),每章的內容如下:逡逑第一章緒論,提出論文的研究背景和研究意義,分析國內外當前的研究情況,逡逑介紹本文的研究目標和研宄內容,制定整體的技術路線。逡逑第二章為論文的理論基礎,概括了深度學習的概念,介紹了深度學習研宄的逡逑一般方法及其應用,重?
TensorFlow還具備高度移植性,基于TensorFlow編寫的代碼可以在幾乎不逡逑經(jīng)過修改的情況下,部署到多種終端上,即使不同設備可能擁有不同的CPU或逡逑GPU數(shù)量、不同的操作系統(tǒng)和硬件環(huán)境。同時TensorFlow的編譯速度極快,在逡逑探索網(wǎng)絡結構設計時,付出的時間代價非常小。逡逑2.5.2邋Caffe逡逑Caffe是一個被廣泛使用的開源深度學習框架,由伯克利視覺學中心進行維逡逑護。Caffe的主要優(yōu)勢包括:逡逑(1)可以快速開始,網(wǎng)絡結構都是以配置文件形式定義,不需要用代碼設逡逑計網(wǎng)絡。逡逑(2)擁有大量訓練好的經(jīng)典模型。逡逑(3)高度模塊化的算法,擴展性和可重用性高。逡逑Caffe的核心概念是Layer,,每一個神經(jīng)網(wǎng)絡的模塊都是一個Layer,Layer逡逑接收輸入數(shù)據(jù),同時經(jīng)過內部計算產(chǎn)生輸出數(shù)據(jù),設計網(wǎng)絡結構時,只需要通過逡逑配置文件把各個Layer拼接在一起構成完成的網(wǎng)絡[4()]。如圖2.4所示,展示了一逡逑
【學位授予單位】:武漢大學
【學位級別】:碩士
【學位授予年份】:2018
【分類號】:J613.2;TP181
【參考文獻】
相關期刊論文 前8條
1 余凱;賈磊;陳雨強;徐偉;;深度學習的昨天、今天和明天[J];計算機研究與發(fā)展;2013年09期
2 曹輝;徐晨;趙曉;吳勝舉;;說話人識別中的Mel特征頻率倒譜系數(shù)[J];西北大學學報(自然科學版);2013年02期
3 侯玨;劉軼;鄭方;蔣丹寧;秦勇;黃石磊;劉勇;;基于VP樹結構的多層匹配算法在哼唱識別中的應用[J];清華大學學報(自然科學版);2009年S1期
4 曹文曉;劉軼;鄭方;蔣丹寧;秦勇;;用于哼唱識別精確匹配的線性伸縮動態(tài)規(guī)劃算法[J];清華大學學報(自然科學版);2009年S1期
5 馮雅中,莊越挺,潘云鶴;一種啟發(fā)式的用哼唱檢索音樂的層次化方法[J];計算機研究與發(fā)展;2004年02期
6 李揚,吳亞棟,劉寶龍;一種新的近似旋律匹配方法及其在哼唱檢索系統(tǒng)中的應用[J];計算機研究與發(fā)展;2003年11期
7 覃光華,丁晶,陳彬兵;預防過擬合現(xiàn)象的人工神經(jīng)網(wǎng)絡訓練策略及其應用[J];長江科學院院報;2002年03期
8 劉曙光;鄭崇勛;劉明遠;;前饋神經(jīng)網(wǎng)絡中的反向傳播算法及其改進:進展與展望[J];計算機科學;1996年01期
相關碩士學位論文 前5條
1 王公友;基于內容的音頻分析與場景識別[D];南京大學;2013年
2 王京輝;語音信號處理技術研究[D];山東大學;2008年
3 李晨;結合語音識別技術的音樂哼唱檢索研究[D];西北大學;2008年
4 陳家紅;哼唱檢索中哼唱信息處理方法的研究[D];南京理工大學;2008年
5 陳旭;基于內容的音頻哼唱識別及檢索系統(tǒng)[D];上海交通大學;2008年
本文編號:2683660
本文鏈接:http://www.sikaile.net/wenyilunwen/mzqiyue/2683660.html