基于深度卷積神經(jīng)網(wǎng)絡(luò)的語義圖像檢索研究

發(fā)布時(shí)間：2018-12-23 13:36

【摘要】：圖像檢索問題作為計(jì)算機(jī)視覺的一個(gè)基本問題,已經(jīng)有很多學(xué)者對它進(jìn)行過分析和研究。本世紀(jì)初,人們逐漸認(rèn)識到低級特征和高級語義特征之間固有的“語義鴻溝”,開始涉及基于語義的圖像檢索,但收效甚微。近年來,深度學(xué)習(xí)技術(shù)為飽受到傳統(tǒng)人工特征困擾的基于語義的圖像檢索問題打開了新的大門。相比較傳統(tǒng)方法,深度學(xué)習(xí)模型在挖掘深層次特征上有驚人的能力,更可能滿足圖像語義特征學(xué)習(xí)。但是,深度學(xué)習(xí)本身也處在一個(gè)快速發(fā)展的階段,并不是完全成熟的工具,在使用過程中需要克服一些深度學(xué)習(xí)本身帶來的問題。例如,深度模型在實(shí)際訓(xùn)練中的參數(shù)優(yōu)化問題。同時(shí)我們該選擇什么樣的深度模型來應(yīng)對基于語義的圖像檢索問題,是我們首先需要考慮的。本文梳理了圖像檢索技術(shù)和深度學(xué)習(xí)技術(shù)的發(fā)展歷程。在此基礎(chǔ)上,提出了一種基于語義的圖像檢索框架。該框架中主要包含三部分:(1)特征提取網(wǎng)絡(luò),在本文中稱為多層級的圖像語義特征提取網(wǎng)絡(luò),框架通過該網(wǎng)絡(luò)提取語義特征;(2)特征存儲結(jié)構(gòu),它將提取出來的特征降維并轉(zhuǎn)化成圖像語義距離度量公式可以計(jì)算的格式;(3)圖像語義距離度量公式,框架最終通過它實(shí)現(xiàn)圖像語義距離的計(jì)算。多層級的圖像語義特征提取網(wǎng)絡(luò)是該框架的核心,它的性能直接影響著整個(gè)框架的最終精度,該網(wǎng)絡(luò)能通過其層級結(jié)構(gòu)分次對圖像中的語義特征進(jìn)行提取,獨(dú)特的結(jié)構(gòu)設(shè)計(jì)使得它可以挖掘圖像中更深層的語義。特征存儲結(jié)構(gòu)將提取出來的圖像語義特征轉(zhuǎn)化成一種更低維更易計(jì)算的融合特征表,而圖像語義距離度量公式則將通過融合特征表計(jì)算圖像之間的語義距離,從而生成檢索結(jié)果序列。在基于語義的圖像檢索框架中,多層級的圖像語義特征提取網(wǎng)絡(luò)可以被替換成其他分類網(wǎng)絡(luò),以靈活地應(yīng)對不同的待檢索圖像。在多個(gè)數(shù)據(jù)集上的測試結(jié)果表明,與現(xiàn)有方法相比,本文框架能夠更加準(zhǔn)確地完成基于語義的圖像檢索工作。
[Abstract]:As a basic problem of computer vision, image retrieval has been analyzed and studied by many scholars. At the beginning of this century, people gradually realized the inherent "semantic gap" between low-level features and high-level semantic features, and began to involve semantic-based image retrieval with little effect. In recent years, depth learning technology has opened a new door for semantic image retrieval, which is beset by traditional artificial features. Compared with the traditional methods, the depth learning model has an amazing ability in mining deep-level features, and it is more likely to satisfy the semantic feature learning of images. However, deep learning itself is also in a rapid development stage, is not a fully mature tool, in the use of the process need to overcome some of the problems caused by the depth of learning itself. For example, the parameter optimization problem of depth model in practical training. At the same time, we should consider what depth model we should choose to deal with the semantic image retrieval problem. This paper reviews the development of image retrieval technology and depth learning technology. On this basis, a semantic-based image retrieval framework is proposed. The framework consists of three parts: (1) feature extraction network, which is called multi-level image semantic feature extraction network in this paper, is used to extract semantic feature; (2) feature storage structure, which reduces the dimension of the extracted feature and converts it into a format that can be calculated by the image semantic distance metric formula; (3) the image semantic distance measurement formula, by which the frame finally realizes the calculation of the image semantic distance. Multi-level image semantic feature extraction network is the core of the framework, and its performance directly affects the final accuracy of the whole framework. Unique structural design allows it to dig deeper semantics in images. The feature storage structure transforms the extracted image semantic features into a fusion feature table with lower dimension and easier to calculate, and the image semantic distance measurement formula calculates the semantic distance between images through the fusion feature table. Thus, the retrieval result sequence is generated. In the semantic-based image retrieval framework, the multi-level semantic feature extraction network can be replaced with other classification networks to flexibly deal with different images to be retrieved. The test results on multiple datasets show that the proposed framework is more accurate than the existing methods in image retrieval based on semantics.
【學(xué)位授予單位】：電子科技大學(xué)
【學(xué)位級別】：碩士
【學(xué)位授予年份】：2017
【分類號】：TP391.41;TP183

【相似文獻(xiàn)】

相關(guān)期刊論文前10條

1 江士方,汪英姿;圖像及圖像檢索應(yīng)用前景的探討[J];江蘇工業(yè)學(xué)院學(xué)報(bào)(社會(huì)科學(xué)版);2003年04期

2 韓法旺;;基于云計(jì)算模式的圖像檢索研究[J];情報(bào)科學(xué);2011年10期

3 何巖;;以計(jì)算機(jī)為基礎(chǔ)的色彩圖像檢索方法與研究[J];計(jì)算機(jī)光盤軟件與應(yīng)用;2013年12期

4 郭海鳳;李廣水;仇彬任;;基于融合多特征的社會(huì)網(wǎng)上圖像檢索方法[J];計(jì)算機(jī)與現(xiàn)代化;2013年12期

5 柏正堯,周紀(jì)勤;基于復(fù)數(shù)矩不變性的圖像檢索方法研究[J];計(jì)算機(jī)應(yīng)用;2000年10期

6 夏峰,張文龍;一種圖像檢索的新方法[J];計(jì)算機(jī)應(yīng)用研究;2002年11期

7 鄧誠強(qiáng),馮剛;基于內(nèi)容的多特征綜合圖像檢索[J];計(jì)算機(jī)應(yīng)用;2003年07期

8 斯白露,高文,盧漢清,曾煒,段立娟;基于感興趣區(qū)域的圖像檢索方法[J];高技術(shù)通訊;2003年05期

9 劉怡,于沛;基于“知網(wǎng)”的新聞圖像檢索方法[J];河南師范大學(xué)學(xué)報(bào)(自然科學(xué)版);2003年02期

10 張榮,鄭浩然,李金龍,王煦法;進(jìn)化加速技術(shù)在圖像檢索中的應(yīng)用[J];計(jì)算機(jī)工程與應(yīng)用;2004年16期

相關(guān)會(huì)議論文前10條

1 陳旭文;朱紅麗;;一種高效的圖像檢索方法[A];中國儀器儀表學(xué)會(huì)第九屆青年學(xué)術(shù)會(huì)議論文集[C];2007年

2 周向東;張亮;張琪;劉莉;殷慷;施伯樂;;一種新的圖像檢索相關(guān)反饋方法[A];第十九屆全國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集（研究報(bào)告篇）[C];2002年

3 陳世亮;李戰(zhàn)懷;閆劍鋒;;一種基于本體描述的空間語義圖像檢索方法[A];第二十一屆中國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集（技術(shù)報(bào)告篇）[C];2004年

4 趙海英;彭宏;;基于最優(yōu)近似反饋的圖像檢索[A];’2004系統(tǒng)仿真技術(shù)及其應(yīng)用學(xué)術(shù)交流會(huì)論文集[C];2004年

5 許相莉;張利彪;于哲舟;周春光;;基于商空間粒度計(jì)算的圖像檢索[A];第八屆全國信息隱藏與多媒體安全學(xué)術(shù)大會(huì)湖南省計(jì)算機(jī)學(xué)會(huì)第十一屆學(xué)術(shù)年會(huì)論文集[C];2009年

6 李凌偉;周榮貴;劉怡;;基于概念的圖像檢索方法[A];第十九屆全國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集（技術(shù)報(bào)告篇）[C];2002年

7 楊關(guān)良;李忠杰;徐小杰;;基于代表色的圖像檢索方法研究[A];首屆信息獲取與處理學(xué)術(shù)會(huì)議論文集[C];2003年

8 彭瑜;喬奇峰;魏昆娟;;基于多示例學(xué)習(xí)的圖像檢索方法[A];第三屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2007年

9 胡敬;武港山;;基于語義特征的風(fēng)景圖像檢索[A];2009年研究生學(xué)術(shù)交流會(huì)通信與信息技術(shù)論文集[C];2009年

10 許天兵;;一種基于語義分類的圖像檢索方法[A];中國圖象圖形學(xué)會(huì)第十屆全國圖像圖形學(xué)術(shù)會(huì)議（CIG’2001）和第一屆全國虛擬現(xiàn)實(shí)技術(shù)研討會(huì)（CVR’2001）論文集[C];2001年

相關(guān)重要報(bào)紙文章前6條

1 美國明尼蘇達(dá)大學(xué)社會(huì)學(xué)博士密西西比州立大學(xué)國家戰(zhàn)略規(guī)劃與分析研究中心資深助理研究員陳心想;維護(hù)好創(chuàng)新的“神經(jīng)網(wǎng)絡(luò)硬件”[N];中國教師報(bào);2014年

2 盧業(yè)忠;腦控電腦驚世駭俗[N];計(jì)算機(jī)世界;2001年

3 葛一鳴路邊文;人工神經(jīng)網(wǎng)絡(luò)將大顯身手[N];中國紡織報(bào);2003年

4 中國科技大學(xué)計(jì)算機(jī)系　邢方亮;神經(jīng)網(wǎng)絡(luò)挑戰(zhàn)人類大腦[N];計(jì)算機(jī)世界;2003年

5 記者孫剛;“神經(jīng)網(wǎng)絡(luò)”：打開復(fù)雜工藝“黑箱”[N];解放日報(bào);2007年

6 本報(bào)記者劉霞;美用DNA制造出首個(gè)人造神經(jīng)網(wǎng)絡(luò)[N];科技日報(bào);2011年

相關(guān)博士學(xué)位論文前10條

1 崔超然;圖像檢索中自動(dòng)標(biāo)注、標(biāo)簽處理和重排序問題的研究[D];山東大學(xué);2015年

2 楊迪;基于內(nèi)容的分布式圖像檢索[D];北京郵電大學(xué);2015年

3 張旭;網(wǎng)絡(luò)圖像檢索關(guān)鍵技術(shù)研究[D];西安電子科技大學(xué);2014年

4 吳夢麟;基于半監(jiān)督學(xué)習(xí)的醫(yī)學(xué)圖像檢索研究[D];南京理工大學(xué);2015年

5 高毫林;基于哈希技術(shù)的圖像檢索研究[D];解放軍信息工程大學(xué);2014年

6 李清亮;圖像檢索中判別性增強(qiáng)研究[D];吉林大學(xué);2016年

7 劉爽;多特征融合圖像檢索方法及其應(yīng)用研究[D];哈爾濱理工大學(xué);2016年

8 程航;密文JPEG圖像檢索研究[D];上海大學(xué);2016年

9 李強(qiáng);基于語義理解的圖像檢索研究[D];天津大學(xué);2015年

10 劉少偉;面向用戶意圖的社會(huì)化圖像檢索[D];清華大學(xué);2016年

相關(guān)碩士學(xué)位論文前10條

1 陳修遠(yuǎn);基于深度卷積神經(jīng)網(wǎng)絡(luò)的語義圖像檢索研究[D];電子科技大學(xué);2017年

2 趙鴻;基于尺度不變局部特征的圖像檢索研究[D];華南理工大學(xué);2015年

3 孫劍飛;基于圖像索引的熱點(diǎn)話題檢索方法研究[D];蘭州大學(xué);2015年

4 章進(jìn)洲;圖像檢索中的用戶意圖分析[D];南京理工大學(xué);2015年

5 苗思楊;移動(dòng)圖像檢索中的漸進(jìn)式傳輸方式研究[D];大連海事大學(xué);2015年

6 都業(yè)剛;基于顯著性的移動(dòng)圖像檢索[D];大連海事大學(xué);2015年

7 王夢蕾;基于用戶反饋和改進(jìn)詞袋模型的圖像檢索[D];南京理工大學(xué);2015年

8 許鵬飛;基于草圖的海量圖像檢索方法研究[D];浙江大學(xué);2015年

9 馮進(jìn)麗;基于BoF的圖像檢索與行為識別研究[D];山西大學(xué);2015年

10 喬維強(qiáng);基于低級特征和語義特征的醫(yī)學(xué)圖像檢索[D];北京理工大學(xué);2015年

，

本文編號：2390053

資料下載

論文發(fā)表

支付寶下載

Download by Alipay
微信下載

Download by Wechat
會(huì)員下載

Download by Member

本文鏈接：http://www.sikaile.net/kejilunwen/zidonghuakongzhilunwen/2390053.html

上一篇：卷積神經(jīng)網(wǎng)絡(luò)與時(shí)空上下文結(jié)合的目標(biāo)跟蹤算法
下一篇：基于人臉目標(biāo)的監(jiān)控系統(tǒng)

論文發(fā)表

·知網(wǎng)|萬方|維普|龍?jiān)磡省級|國家級|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|

天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于深度卷積神經(jīng)網(wǎng)絡(luò)的語義圖像檢索研究