利用深度學(xué)習(xí)構(gòu)建基于內(nèi)容的音樂推薦系統(tǒng)
發(fā)布時間:2021-07-26 16:26
隨著音樂流媒體服務(wù)產(chǎn)業(yè)的高速發(fā)展,使得用戶可以在移動設(shè)備上輕易的聽到任何的歌曲,互聯(lián)網(wǎng)成了一個巨大的音樂存儲平臺。與此同時,如何從海量數(shù)據(jù)中找到喜愛的歌曲成了一個相當棘手的問題。音樂推薦系統(tǒng)是當前解決這一個問題的最好途徑,它能夠把用戶喜歡的歌曲推薦給用戶,也能夠為歌曲找到合適的目標用戶。音樂推薦是推薦系統(tǒng)技術(shù)的一個重要應(yīng)用領(lǐng)域。由于音樂推薦領(lǐng)域的特殊性,使得當前最為有效的協(xié)同過濾方法并不能很好的適用于音樂推薦領(lǐng)域。其原因一方面是由于音樂領(lǐng)域沒有足夠的用戶評分數(shù)據(jù);另一方面是由于協(xié)同過濾方法會帶來冷啟動的問題,使得新的歌曲無法被推薦?朔@兩個問題的有效方法是構(gòu)建基于內(nèi)容的音樂推薦系統(tǒng)。本文主要研究基于內(nèi)容的音樂推薦系統(tǒng),它包括了音樂音頻特征提取以及向用戶推薦感興趣的歌曲兩個重要環(huán)節(jié)。本文圍繞這兩個環(huán)節(jié),進行改進和優(yōu)化,從而構(gòu)建一個更有效的基于內(nèi)容的音樂推薦系統(tǒng)。具體的研究內(nèi)容有如下兩點:1)提出了一種混合兩種不同類型的深度神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的模型,來提取音樂的音頻特征。不同的深度神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),適合于提取不同方面的特征。該混合深度神經(jīng)網(wǎng)絡(luò)模型能夠在不同分類標準的分類任務(wù)中,提取到歌曲有效的特征...
【文章來源】:廈門大學(xué)福建省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:74 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖2-lTaxiride樂隊的歌曲《BackAgain》片段的聲譜圖、梅爾頻譜圖、MFCCs??
CNN從淺到深的不同層次能提取出不同的區(qū)域性特征,而且其抽象的能力會??隨著層次的加深而增強。以Lee等人的Convolutional?Deep?Belief?Networks??(CDBN)為例[55j,其結(jié)構(gòu)如圖2-2所示。從圖中可以看出,經(jīng)過第一層卷積層??后,網(wǎng)絡(luò)可以學(xué)到代表邊緣的低層特征信息;經(jīng)過第二層卷積層后,可以看出網(wǎng)??絡(luò)開始把第一層的特征信息進行組合,可以得到局域性的抽象特征;經(jīng)過了第三??層卷積層后,網(wǎng)絡(luò)學(xué)習(xí)到了更加高級的抽象特征,已經(jīng)可以從這些特征中看到輸??入圖片中物體的大致模樣,并且這些特征的形態(tài)沒有遭到破壞。這說明了卷積神??經(jīng)網(wǎng)絡(luò)適合用來提取圖片特征。??\??V?\?\?Max?——?>J_J?Max?^??X?X?^convolution?^?P〇〇"ng?Evolution???Pooling??Stride?of??Convoluti
?利用深度學(xué)習(xí)構(gòu)建苺于內(nèi)容的昔樂推薦系統(tǒng)???這會使得訓(xùn)練的網(wǎng)絡(luò)更加精簡和魯棒,但是,在邊界檢測任務(wù)中,在時間軸上池??化會降低時間的分辨率。圖2-3是Choi等人提出的一個基礎(chǔ)模型FCN-5的網(wǎng)絡(luò)結(jié)??構(gòu),其包括了5層卷積核大小為3X3的卷積層,這里的分類的類別是50種。在??FCN-5基礎(chǔ)上,作者又加入了卷積核為1X1的卷積層,得到了一個效果更好的模??型FCN-6。1X1的卷積層能夠增加最后一層的抽象表達能力[63]。在評價準則上,??作者使用了?AUC來評價模型的好壞。因為AUC有兩個優(yōu)點,一個是在樣本不平??衡的情況下它的分數(shù)仍舊魯棒。第二個是它的形式足夠簡單。在實驗中,他們使??用MSD數(shù)據(jù)集對文中提及的幾種FCN的變種模型做比較,實驗結(jié)果顯示FCN-6??的表現(xiàn)是最佳的。??
本文編號:3303914
【文章來源】:廈門大學(xué)福建省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:74 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖2-lTaxiride樂隊的歌曲《BackAgain》片段的聲譜圖、梅爾頻譜圖、MFCCs??
CNN從淺到深的不同層次能提取出不同的區(qū)域性特征,而且其抽象的能力會??隨著層次的加深而增強。以Lee等人的Convolutional?Deep?Belief?Networks??(CDBN)為例[55j,其結(jié)構(gòu)如圖2-2所示。從圖中可以看出,經(jīng)過第一層卷積層??后,網(wǎng)絡(luò)可以學(xué)到代表邊緣的低層特征信息;經(jīng)過第二層卷積層后,可以看出網(wǎng)??絡(luò)開始把第一層的特征信息進行組合,可以得到局域性的抽象特征;經(jīng)過了第三??層卷積層后,網(wǎng)絡(luò)學(xué)習(xí)到了更加高級的抽象特征,已經(jīng)可以從這些特征中看到輸??入圖片中物體的大致模樣,并且這些特征的形態(tài)沒有遭到破壞。這說明了卷積神??經(jīng)網(wǎng)絡(luò)適合用來提取圖片特征。??\??V?\?\?Max?——?>J_J?Max?^??X?X?^convolution?^?P〇〇"ng?Evolution???Pooling??Stride?of??Convoluti
?利用深度學(xué)習(xí)構(gòu)建苺于內(nèi)容的昔樂推薦系統(tǒng)???這會使得訓(xùn)練的網(wǎng)絡(luò)更加精簡和魯棒,但是,在邊界檢測任務(wù)中,在時間軸上池??化會降低時間的分辨率。圖2-3是Choi等人提出的一個基礎(chǔ)模型FCN-5的網(wǎng)絡(luò)結(jié)??構(gòu),其包括了5層卷積核大小為3X3的卷積層,這里的分類的類別是50種。在??FCN-5基礎(chǔ)上,作者又加入了卷積核為1X1的卷積層,得到了一個效果更好的模??型FCN-6。1X1的卷積層能夠增加最后一層的抽象表達能力[63]。在評價準則上,??作者使用了?AUC來評價模型的好壞。因為AUC有兩個優(yōu)點,一個是在樣本不平??衡的情況下它的分數(shù)仍舊魯棒。第二個是它的形式足夠簡單。在實驗中,他們使??用MSD數(shù)據(jù)集對文中提及的幾種FCN的變種模型做比較,實驗結(jié)果顯示FCN-6??的表現(xiàn)是最佳的。??
本文編號:3303914
本文鏈接:http://www.sikaile.net/wenyilunwen/musictheory/3303914.html
教材專著