基于壓縮卷積神經(jīng)網(wǎng)絡(luò)的跨媒體檢索方法研究
發(fā)布時間:2021-05-05 18:08
隨著互聯(lián)網(wǎng)和多媒體技術(shù)的飛速發(fā)展,網(wǎng)絡(luò)上各種形式的媒體內(nèi)容(文本、圖像、音頻、視頻)大量涌現(xiàn)并呈爆炸式增長,如何讓計算機能夠快速準確地理解多媒體信息內(nèi)容并挖掘不同模態(tài)媒體之間的關(guān)聯(lián)信息以實現(xiàn)跨媒體的檢索,成為人們快速從混雜而又龐大的多媒體信息中獲取到自己所需有效信息的關(guān)鍵。近年來,深度學(xué)習(xí)在信息檢索領(lǐng)域發(fā)展迅速,因其強大的功能,也越來越多地被人們用于跨媒體檢索的研究中。由于成熟的深度神經(jīng)網(wǎng)絡(luò)模型參數(shù)數(shù)量大,計算量大,所以跨媒體檢索信息的速度會受到相應(yīng)限制,直接影響使用者檢索信息的體驗感。本文簡要分析了跨媒體研究現(xiàn)狀,對已有的跨媒體檢索方法進行總結(jié)。在綜合分析了已有的跨媒體檢索方法的基礎(chǔ)上,以圖像和文本的雙向檢索為切入點,針對深度卷積神經(jīng)網(wǎng)絡(luò)模型計算量大的問題,提出將壓縮卷積神經(jīng)網(wǎng)絡(luò)用于圖像和文本雙向檢索的跨媒體檢索方法并取得了較好效果。本文的主要工作如下:(1)分別采用預(yù)訓(xùn)練的通道剪枝的VGG-16(Channel Pruning VGG-16)壓縮卷積神經(jīng)網(wǎng)絡(luò)和經(jīng)過目標數(shù)據(jù)集微調(diào)的Channel Pruning VGG-16壓縮卷積神經(jīng)網(wǎng)絡(luò)來提取數(shù)據(jù)集圖像底層特征,采用狄利克雷(La...
【文章來源】:華中師范大學(xué)湖北省 211工程院校 教育部直屬院校
【文章頁數(shù)】:75 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 研究背景和意義
1.2 國內(nèi)外研究現(xiàn)狀
1.3 研究內(nèi)容及論文組織結(jié)構(gòu)
1.3.1 研究內(nèi)容
1.3.2 論文組織結(jié)構(gòu)
第二章 相關(guān)理論概述
2.1 跨媒體信息檢索概述
2.2 卷積神經(jīng)網(wǎng)絡(luò)
2.2.1 卷積神經(jīng)網(wǎng)絡(luò)概述
2.2.2 壓縮卷積神經(jīng)網(wǎng)絡(luò)概述
2.3 常見的跨媒體檢索方法
2.3.1 共同空間學(xué)習(xí)方法
2.3.2 跨媒體相似性度量方法
2.4 本章小結(jié)
第三章 基于壓縮卷積神經(jīng)網(wǎng)絡(luò)的跨媒體檢索方法
3.1 引言
3.2 跨媒體檢索框架
3.3 數(shù)據(jù)特征提取
3.3.1 圖像特征提取
3.3.2 文本特征提取
3.4 語義共享空間
3.5 圖像特征正則規(guī)范化
3.6 相似性度量算法
3.7 實驗結(jié)果與分析
3.7.1 實驗數(shù)據(jù)集
3.7.2 評價指標
3.7.3 Wikipedia的實驗結(jié)果及分析
3.7.4 Pascal Sentence的實驗結(jié)果及分析
3.8 本章小結(jié)
第四章 基于數(shù)量積相似性度量的跨媒體檢索方法
4.1 引言
4.2 壓縮卷積神經(jīng)網(wǎng)絡(luò)的微調(diào)
4.3 基于數(shù)量積的相似性度量的跨媒體檢索方法
4.4 實驗結(jié)果及分析
4.4.1 實驗設(shè)置
4.4.2 Wikipedia的實驗結(jié)果及分析
4.4.3 Pascal Sentence的實驗結(jié)果及分析
4.5 本章小結(jié)
第五章 總結(jié)與展望
5.1 總結(jié)
5.2 展望
參考文獻
攻讀碩士期間的研究成果
致謝
本文編號:3170343
【文章來源】:華中師范大學(xué)湖北省 211工程院校 教育部直屬院校
【文章頁數(shù)】:75 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 研究背景和意義
1.2 國內(nèi)外研究現(xiàn)狀
1.3 研究內(nèi)容及論文組織結(jié)構(gòu)
1.3.1 研究內(nèi)容
1.3.2 論文組織結(jié)構(gòu)
第二章 相關(guān)理論概述
2.1 跨媒體信息檢索概述
2.2 卷積神經(jīng)網(wǎng)絡(luò)
2.2.1 卷積神經(jīng)網(wǎng)絡(luò)概述
2.2.2 壓縮卷積神經(jīng)網(wǎng)絡(luò)概述
2.3 常見的跨媒體檢索方法
2.3.1 共同空間學(xué)習(xí)方法
2.3.2 跨媒體相似性度量方法
2.4 本章小結(jié)
第三章 基于壓縮卷積神經(jīng)網(wǎng)絡(luò)的跨媒體檢索方法
3.1 引言
3.2 跨媒體檢索框架
3.3 數(shù)據(jù)特征提取
3.3.1 圖像特征提取
3.3.2 文本特征提取
3.4 語義共享空間
3.5 圖像特征正則規(guī)范化
3.6 相似性度量算法
3.7 實驗結(jié)果與分析
3.7.1 實驗數(shù)據(jù)集
3.7.2 評價指標
3.7.3 Wikipedia的實驗結(jié)果及分析
3.7.4 Pascal Sentence的實驗結(jié)果及分析
3.8 本章小結(jié)
第四章 基于數(shù)量積相似性度量的跨媒體檢索方法
4.1 引言
4.2 壓縮卷積神經(jīng)網(wǎng)絡(luò)的微調(diào)
4.3 基于數(shù)量積的相似性度量的跨媒體檢索方法
4.4 實驗結(jié)果及分析
4.4.1 實驗設(shè)置
4.4.2 Wikipedia的實驗結(jié)果及分析
4.4.3 Pascal Sentence的實驗結(jié)果及分析
4.5 本章小結(jié)
第五章 總結(jié)與展望
5.1 總結(jié)
5.2 展望
參考文獻
攻讀碩士期間的研究成果
致謝
本文編號:3170343
本文鏈接:http://www.sikaile.net/kejilunwen/zidonghuakongzhilunwen/3170343.html
最近更新
教材專著