圖像檢索中的特征表達和相似性度量方法研究
發(fā)布時間:2020-12-30 13:55
伴隨著互聯(lián)網(wǎng)技術的迅猛發(fā)展和各類數(shù)碼設備及嵌入式攝像頭的普遍流行,網(wǎng)絡上無處不在的視覺數(shù)據(jù)呈現(xiàn)出爆炸式的增長趨勢,使得圖像搜索和檢索技術的研究越來越活躍,也讓基于圖像搜索的各類新興應用看到了新的曙光;趦(nèi)容的圖像檢索(Content-based Image Retrieval,CBIR)利用視覺內(nèi)容作為圖像相似性排序的重要線索,有效地克服了基于文本的視覺信息檢索中存在的文本與視覺內(nèi)容不一致、查詢意圖解析能力弱、缺乏用戶體驗等方面的不足。近二十年來,CBIR 一直吸引著大量研究者的關注,尤其是隨著深度學習技術在圖像領域的成功應用,CBIR相關技術的研究充滿了機遇和挑戰(zhàn)。本文針對CBIR中的圖像特征表達和相似性度量兩個關鍵環(huán)節(jié),圍繞如何提取和表達圖像視覺特征來盡可能地體現(xiàn)圖像高層語義、如何對深度特征進行有效地聚合表達來增強特征的表達能力和可辯別能力、如何定義準確的圖像相似性度量方法以體現(xiàn)圖像語義相似性等問題展開研究。主要工作包括以下幾個方面:(1)提出一種基于多特征表達和擴散過程重排序的圖像檢索方法,通過從圖像特征表達和相似度度量的優(yōu)化兩個方面來提升圖像檢索性能。針對傳統(tǒng)視覺特征的表達,...
【文章來源】:大連理工大學遼寧省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:132 頁
【學位級別】:博士
【部分圖文】:
圖1.2不同查詢方式的圖像檢索示例??Figure?1.2?Illustration?of?different?query?schemes?for?image?retrieval??
的方方面面。??1.2.2基于內(nèi)容的圖像檢索框架及主要技術??圖1.3給出了基于內(nèi)容的圖像檢索的基本框架,包括主要的檢索流程和相關技術,??其中最核心的問題就是如何提取圖像的視覺特征并進行表達,以及如何通過圖像視覺特??征進行相似度匹配,其分別對應圖像特征表示和圖像匹配兩個主要部分。下面簡要介紹??圖像特征表達和圖像匹配階段的主要任務、方法以及其它相關技術。??查詢圖像?|圖丨i預處理j?|圖像特征表示??J ̄圖像匹配???1?:?!??特征提取?1___?相似性度量??:分,類/?/bovwcnn?l?(索引:重排序搜索i????;?','yH?:??特征K縮和聚合??丨?距離學>]/?|??;人?;?PCA/VLAD/VF?▲?;擴展查詢/.?.?|??I?????j?? ̄.T? ̄? ̄????1—??^?!?檢索結果??圖像庫?Re?Weighting?&?Update??丨?”??SHSISliaH??L?卜…a-_-?H.—?a?Q?圔?a?a??圖1.3基于內(nèi)容的圖像檢索基本框架??Figure?1.3?The?general?flow?diagram?of?CBIR??-4-??
圖2.2最大池化示例??Figure?2.2?The?example?of?max-pooling??3)激勵函數(shù)層(Activation?layers)??激勵函數(shù)層通過引入激勵函數(shù)對卷積層的輸出信號進行一次非線性映射,從而建??立類似人腦處理的復雜模型。常用的激勵函數(shù)包括S型函數(shù)(公式(2.8)?)、Tanh函??數(shù)(公式(2.9))以及修正線件.單位ReLU閑數(shù)(公式(2.10))。其中,ReLU函數(shù)??由于其僅需要進行簡單對的比較運算,相比其它需要進行復雜運算的函數(shù)而言,采用??ReLU函數(shù)訓練的深度卷枳神經(jīng)M絡收斂速度更快,N吋使得訓練后的網(wǎng)絡具備一定的??稀疏性,因此在人多數(shù)網(wǎng)絡結構屮被采用。??S?igmoicl(x)?=??(2.8)??1?+?e ̄x??Tanh(x)?=?C? ̄g?(2.9)??ex?+?e"x??
【參考文獻】:
期刊論文
[1]一種基于視覺詞典優(yōu)化和查詢擴展的圖像檢索方法[J]. 柯圣財,李弼程,陳剛,趙永威,魏晗. 自動化學報. 2018(01)
[2]卷積神經(jīng)網(wǎng)絡在圖像分類和目標檢測應用綜述[J]. 周俊宇,趙艷明. 計算機工程與應用. 2017(13)
[3]基于顏色基元共生矩陣的旋轉圖像檢索[J]. 嚴宇,宋威,朱華東. 計算機工程. 2017(05)
[4]一種基于廣義期望首達時間的形狀距離學習算法[J]. 鄭丹晨,楊亞飛,韓敏. 自動化學報. 2016(02)
[5]基于AFS的多民族人臉語義描述與挖掘方法研究[J]. 段曉東,李澤東,王存睿,張慶靈,劉曉東. 計算機學報. 2016(07)
[6]一種基于顏色矩和多尺度紋理特征的彩色圖像檢索方法[J]. 楊紅菊,張艷,曹付元. 計算機科學. 2009(09)
博士論文
[1]基于深度學習表征的圖像檢索技術[D]. 孫韶言.中國科學技術大學 2017
[2]基于馬氏距離的度量學習算法研究及應用[D]. 梅江元.哈爾濱工業(yè)大學 2016
[3]基于局部特征的圖像表示模型理論與實踐[D]. 謝凌曦.清華大學 2015
[4]基于內(nèi)容的圖像檢索中特征表示與檢索策略研究[D]. 侯剛.吉林大學 2014
[5]基于公理模糊集的模糊決策樹算法研究[D]. 馮興華.大連理工大學 2013
[6]圖像檢索中跨模語義信息獲取方法研究[D]. 何寧.武漢大學 2013
[7]基于內(nèi)容圖像檢索的關鍵技術研究[D]. 齊恒.大連理工大學 2012
[8]基于內(nèi)容的圖像檢索關鍵技術研究[D]. 趙珊.西安電子科技大學 2007
碩士論文
[1]基于深度學習的圖像檢索研究[D]. 戴世穩(wěn).湖南大學 2017
[2]基于深度學習的圖像分類及應用研究[D]. 辛晨.中國科學院大學(中國科學院遙感與數(shù)字地球研究所) 2017
本文編號:2947757
【文章來源】:大連理工大學遼寧省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:132 頁
【學位級別】:博士
【部分圖文】:
圖1.2不同查詢方式的圖像檢索示例??Figure?1.2?Illustration?of?different?query?schemes?for?image?retrieval??
的方方面面。??1.2.2基于內(nèi)容的圖像檢索框架及主要技術??圖1.3給出了基于內(nèi)容的圖像檢索的基本框架,包括主要的檢索流程和相關技術,??其中最核心的問題就是如何提取圖像的視覺特征并進行表達,以及如何通過圖像視覺特??征進行相似度匹配,其分別對應圖像特征表示和圖像匹配兩個主要部分。下面簡要介紹??圖像特征表達和圖像匹配階段的主要任務、方法以及其它相關技術。??查詢圖像?|圖丨i預處理j?|圖像特征表示??J ̄圖像匹配???1?:?!??特征提取?1___?相似性度量??:分,類/?/bovwcnn?l?(索引:重排序搜索i????;?','yH?:??特征K縮和聚合??丨?距離學>]/?|??;人?;?PCA/VLAD/VF?▲?;擴展查詢/.?.?|??I?????j?? ̄.T? ̄? ̄????1—??^?!?檢索結果??圖像庫?Re?Weighting?&?Update??丨?”??SHSISliaH??L?卜…a-_-?H.—?a?Q?圔?a?a??圖1.3基于內(nèi)容的圖像檢索基本框架??Figure?1.3?The?general?flow?diagram?of?CBIR??-4-??
圖2.2最大池化示例??Figure?2.2?The?example?of?max-pooling??3)激勵函數(shù)層(Activation?layers)??激勵函數(shù)層通過引入激勵函數(shù)對卷積層的輸出信號進行一次非線性映射,從而建??立類似人腦處理的復雜模型。常用的激勵函數(shù)包括S型函數(shù)(公式(2.8)?)、Tanh函??數(shù)(公式(2.9))以及修正線件.單位ReLU閑數(shù)(公式(2.10))。其中,ReLU函數(shù)??由于其僅需要進行簡單對的比較運算,相比其它需要進行復雜運算的函數(shù)而言,采用??ReLU函數(shù)訓練的深度卷枳神經(jīng)M絡收斂速度更快,N吋使得訓練后的網(wǎng)絡具備一定的??稀疏性,因此在人多數(shù)網(wǎng)絡結構屮被采用。??S?igmoicl(x)?=??(2.8)??1?+?e ̄x??Tanh(x)?=?C? ̄g?(2.9)??ex?+?e"x??
【參考文獻】:
期刊論文
[1]一種基于視覺詞典優(yōu)化和查詢擴展的圖像檢索方法[J]. 柯圣財,李弼程,陳剛,趙永威,魏晗. 自動化學報. 2018(01)
[2]卷積神經(jīng)網(wǎng)絡在圖像分類和目標檢測應用綜述[J]. 周俊宇,趙艷明. 計算機工程與應用. 2017(13)
[3]基于顏色基元共生矩陣的旋轉圖像檢索[J]. 嚴宇,宋威,朱華東. 計算機工程. 2017(05)
[4]一種基于廣義期望首達時間的形狀距離學習算法[J]. 鄭丹晨,楊亞飛,韓敏. 自動化學報. 2016(02)
[5]基于AFS的多民族人臉語義描述與挖掘方法研究[J]. 段曉東,李澤東,王存睿,張慶靈,劉曉東. 計算機學報. 2016(07)
[6]一種基于顏色矩和多尺度紋理特征的彩色圖像檢索方法[J]. 楊紅菊,張艷,曹付元. 計算機科學. 2009(09)
博士論文
[1]基于深度學習表征的圖像檢索技術[D]. 孫韶言.中國科學技術大學 2017
[2]基于馬氏距離的度量學習算法研究及應用[D]. 梅江元.哈爾濱工業(yè)大學 2016
[3]基于局部特征的圖像表示模型理論與實踐[D]. 謝凌曦.清華大學 2015
[4]基于內(nèi)容的圖像檢索中特征表示與檢索策略研究[D]. 侯剛.吉林大學 2014
[5]基于公理模糊集的模糊決策樹算法研究[D]. 馮興華.大連理工大學 2013
[6]圖像檢索中跨模語義信息獲取方法研究[D]. 何寧.武漢大學 2013
[7]基于內(nèi)容圖像檢索的關鍵技術研究[D]. 齊恒.大連理工大學 2012
[8]基于內(nèi)容的圖像檢索關鍵技術研究[D]. 趙珊.西安電子科技大學 2007
碩士論文
[1]基于深度學習的圖像檢索研究[D]. 戴世穩(wěn).湖南大學 2017
[2]基于深度學習的圖像分類及應用研究[D]. 辛晨.中國科學院大學(中國科學院遙感與數(shù)字地球研究所) 2017
本文編號:2947757
本文鏈接:http://www.sikaile.net/kejilunwen/sousuoyinqinglunwen/2947757.html
最近更新
教材專著