基于多圖學習的多模態(tài)圖像顯著性檢測算法研究
發(fā)布時間:2021-03-04 04:56
隨著多媒體圖像處理技術的進步和發(fā)展,圖像數(shù)據快速的增長,如何高效地從這龐大的圖像數(shù)據中提取出人們感興趣且有價值的信息,并有效地濾除掉過多的冗余數(shù)據成為了目前圖像處理和計算機視覺領域亟待解決的問題。近年來,視覺顯著性檢測作為計算機視覺中的重要分支之一,能夠輔助并改善一系列的視覺處理任務,已經被廣泛地應用到了場景分類、視覺跟蹤、目標重定向、語義分割等眾多領域中,成為了一個炙手可熱的研究課題。雖然在特定測試數(shù)據集以及簡單場景下,對于單模態(tài)圖像顯著性檢測的研究已經達到了很高的水平,但是由于其算法缺乏泛化性,在圖像光照條件差、惡劣天氣、顏色相近以及圖像包含噪聲等復雜場景下的顯著性檢測精度仍有待提高。近年來,由于各種成像技術的不斷成熟,其他類型的光譜成像獲取的數(shù)據越來越多(其中熱紅外圖像就對光照不敏感),使得相關領域的科研人員開始嘗試融合多個不同但互補的多模態(tài)信息,如可見光和熱紅外信息(RGB-T),這在一定程度上提升了顯著性檢測的精度和魯棒性。因此,本文將圍繞圖像顯著性檢測及多模態(tài)圖像顯著性檢測展開研究,具體來說,我們的主要工作如下:(1)傳統(tǒng)的關于顯著性的研究立足于對圖像的結構劃分并且構建圖模...
【文章來源】:安徽大學安徽省 211工程院校
【文章頁數(shù)】:70 頁
【學位級別】:碩士
【部分圖文】:
圖像顯著
安徽大學碩士學位論文9第二章圖像顯著性檢測相關方法人類的視覺注意機制可以將有限的認知資源集中到圖像中重要的信息上而對那些不重要的信息進行抑制。在過去的幾十年里,以認知神經學為主導的視覺顯著性在多個相關領域得到了廣泛的研究和發(fā)展,例如:目標重定位,目標識別與檢測,場景分割等。本章的主要內容包括:通用顯著性檢測流程簡介、圖論與圖學習簡介、多模態(tài)圖像顯著性檢測簡介。2.1通用顯著性檢測流程在計算機視覺領域中,從自頂向下的圖像顯著性檢測模型的角度來看,顯著性檢測的過程可分為特征提娶特征分類和顯著圖生成三個階段,圖2.1展示了顯著性檢測算法的基本流程。圖2.1顯著性檢測算法的基本流程通俗來說,特征提取第一步要做的就是圖像數(shù)字化轉變。這樣就能成為計算機辨識與還原的對象,經過數(shù)字化后的圖像本質上就是一個多維矩陣,例如常見的RGB圖像其實可以理解為3個寬高固定的二維矩陣的疊加。圖像中每個像素點的顏色信息都可以用矩陣的每個元素來表示,特征提取就是獲得相鄰或相似集合上像素點之間的描述關系,特征分類就是將圖像中有用的信息(顯著區(qū)域信息)與冗余的信息分離開來,最后將分類信息通過二值化的方式生成顯著圖。下面我們將詳細介紹圖像的底層特征以及圖像特征提取的相關方法。2.1.1圖像底層特征眾所周知,計算機只能識別數(shù)字,對圖像并不能識別,為了讓計算機擁有相應的“視覺”功能,能夠真正的“認識”圖像。在本章中,我們將研究如何快速地提取圖像中最有價值的信息或者數(shù)據,并將其進行“非圖像”表示或者描述,譬如向量以及數(shù)值等。這種過程就是所謂的特征提取,這些向量或者數(shù)值就是所謂的圖像特征。在獲得這些特
單模態(tài)與多模態(tài)顯著性檢測結果的視覺對比
本文編號:3062600
【文章來源】:安徽大學安徽省 211工程院校
【文章頁數(shù)】:70 頁
【學位級別】:碩士
【部分圖文】:
圖像顯著
安徽大學碩士學位論文9第二章圖像顯著性檢測相關方法人類的視覺注意機制可以將有限的認知資源集中到圖像中重要的信息上而對那些不重要的信息進行抑制。在過去的幾十年里,以認知神經學為主導的視覺顯著性在多個相關領域得到了廣泛的研究和發(fā)展,例如:目標重定位,目標識別與檢測,場景分割等。本章的主要內容包括:通用顯著性檢測流程簡介、圖論與圖學習簡介、多模態(tài)圖像顯著性檢測簡介。2.1通用顯著性檢測流程在計算機視覺領域中,從自頂向下的圖像顯著性檢測模型的角度來看,顯著性檢測的過程可分為特征提娶特征分類和顯著圖生成三個階段,圖2.1展示了顯著性檢測算法的基本流程。圖2.1顯著性檢測算法的基本流程通俗來說,特征提取第一步要做的就是圖像數(shù)字化轉變。這樣就能成為計算機辨識與還原的對象,經過數(shù)字化后的圖像本質上就是一個多維矩陣,例如常見的RGB圖像其實可以理解為3個寬高固定的二維矩陣的疊加。圖像中每個像素點的顏色信息都可以用矩陣的每個元素來表示,特征提取就是獲得相鄰或相似集合上像素點之間的描述關系,特征分類就是將圖像中有用的信息(顯著區(qū)域信息)與冗余的信息分離開來,最后將分類信息通過二值化的方式生成顯著圖。下面我們將詳細介紹圖像的底層特征以及圖像特征提取的相關方法。2.1.1圖像底層特征眾所周知,計算機只能識別數(shù)字,對圖像并不能識別,為了讓計算機擁有相應的“視覺”功能,能夠真正的“認識”圖像。在本章中,我們將研究如何快速地提取圖像中最有價值的信息或者數(shù)據,并將其進行“非圖像”表示或者描述,譬如向量以及數(shù)值等。這種過程就是所謂的特征提取,這些向量或者數(shù)值就是所謂的圖像特征。在獲得這些特
單模態(tài)與多模態(tài)顯著性檢測結果的視覺對比
本文編號:3062600
本文鏈接:http://www.sikaile.net/kejilunwen/shengwushengchang/3062600.html
最近更新
教材專著