基于深度與寬度神經(jīng)網(wǎng)絡(luò)顯著性檢測方法研究
發(fā)布時間:2021-08-21 05:44
圖像顯著性檢測就是將圖像中最重要區(qū)域分割出來。解決圖像顯著性檢測問題通常涉及計算機視覺、神經(jīng)科學,認知心理學等領(lǐng)域的知識。近年來,隨著深度學習在計算機視覺領(lǐng)域取得了巨大的成就,深度學習的應(yīng)用在圖像顯著性檢測課題中也發(fā)揮了良好的效果,因此基于深度卷積神經(jīng)網(wǎng)絡(luò)的算法已成為解決圖像顯著性檢測的最有效的方法。但就目前的基于深度卷積神經(jīng)網(wǎng)絡(luò)的顯著性算法而言,其大多采用非常復雜的深度卷積網(wǎng)絡(luò)模型在做檢測,這樣將依賴高昂的計算設(shè)備才能完成算法的實現(xiàn),使得這些算法無法被應(yīng)用到計算能力較小的移動設(shè)備上也無法有效地做完成其他高級視覺問題的預處理過程。對于研究人員來說,提高基于神經(jīng)網(wǎng)絡(luò)的顯著性檢測算法的計算效率一般從兩個角度出發(fā),一是裁剪網(wǎng)絡(luò)結(jié)構(gòu),同時結(jié)合傳統(tǒng)特征提取方法進行處理。另一種則是采用一種更輕量化的網(wǎng)絡(luò)來解決顯著性檢測問題。根據(jù)這兩點思路,本文分別提出兩種高效且不失精度的基于神經(jīng)網(wǎng)絡(luò)的顯著性檢測算法。首先是本文提出的融合低維特征提取層的深度卷積顯著性檢測算法,在該方法中本文提出了一個低維特征提取層,來將輸入圖像預先進行特征提取并將其映射到校直的特征圖以作為全卷積網(wǎng)絡(luò)的輸入。其目的是對數(shù)據(jù)進行降維來...
【文章來源】:上海師范大學上海市
【文章頁數(shù)】:64 頁
【學位級別】:碩士
【部分圖文】:
顯著性檢測示例圖
第一章緒論上海師范大學碩士論文2工智能等技術(shù)來提出一種智能、精確且高效的顯著性檢測算法是一件非常有價值的工作。目前為止,顯著性檢測作為計算機視覺領(lǐng)域的熱門研究領(lǐng)域之一,已經(jīng)被廣泛應(yīng)用到其他高級視覺領(lǐng)域來作為他們的預處理階段,如立體匹配[1]、視頻去模糊[2]、圖像和視頻壓縮[3][4]、內(nèi)容感知圖像編輯[5]、目標識別[6]、語義分割[7]和視覺跟蹤[8]等。圖1-2華為手機圖片虛化功能演示1.2國內(nèi)外研究現(xiàn)狀近年來,顯著性檢測已經(jīng)成為計算機視覺、計算機圖像處理領(lǐng)域的熱門研究方向之一,不斷受到國內(nèi)外研究者的關(guān)注,進而也產(chǎn)生了很多優(yōu)秀的研究成果。根據(jù)顯著性的國內(nèi)外發(fā)展現(xiàn)狀,本節(jié)將從兩個方面對其進行回顧,即傳統(tǒng)顯著性檢測算法和基于深度卷積網(wǎng)絡(luò)的顯著性檢測算法。1.2.1傳統(tǒng)顯著性檢測算法顯著性算法早些年的研究中,其大多是傳統(tǒng)方法。在基于自底向上的顯著性算法的發(fā)展史上具有開創(chuàng)性的研究最早可以追溯到上世紀90年代Itti等[10]關(guān)于IT算法的研究。該研究受Koch和Ullman提出的視覺注意力機制啟發(fā)[11],提出了一種基于中心環(huán)繞(CenterSurrounding)的視覺注意力機制的計算模型,來計算圖像中的顯著視點。中心環(huán)繞機制的核心思想就是相對于周圍的像素點,若在像素點在特征顏色(Colors),亮度(Intensity),或方向(Orientation)等特征上更加顯著,則其更有可能為顯著特征點。Itti的研究對基于顏色特征信息的顯
上海師范大學碩士論文第二章相關(guān)技術(shù)介紹7第二章相關(guān)技術(shù)介紹本章將對超像素分割算法,手工特征提取,深度神經(jīng)網(wǎng)絡(luò),寬度神經(jīng)網(wǎng)絡(luò),和后處理算法條件隨機場進行詳細介紹。2.1超像素分割超像素分割算法是將圖像中特征相似像素聚集成區(qū)域的算法。其中有代表性的研究是Achanta等[34]提出SLIC(simplelineariterativeclustering)算法。SLIC算法的特點是根據(jù)圖像里像素的顏色(R,G,B)和坐標位置(x,y)五維特征進行聚類。該聚類方式類似于K-means算法,其最終所聚成的簇即為超像素。不同的是SLIC算法在聚類時其搜索空間是有限的,而不是對每個超像素都要搜索整張圖片。如圖2-1所示,圖2-1(a)所展示的是K-means算法的搜索空間,(a)標準K-means搜索(b)SLIC算法搜索圖2-1K-means和SLIC的搜索空間的比較[34]而圖2-1(b)是SLIC的搜索空間,具體地,對于一塊大小為×的超像素其搜索空間為2×2,因此SLIC算法運行效率更高。SLIC算法大致過程如下:1.將圖像分為個大小相等且為×的圖像塊(patch),每一個圖像塊都是一個聚類,其聚類的中心被稱為超像素(superpixel)。假設(shè)圖像有個像素,則每個圖像塊的邊長S=*+。2.對聚類中心進行初始化,劃分圖像塊后,在每個圖像塊的中心點的3×3區(qū)域選取梯度最小的點作為聚類中心點。這樣可以防止采樣到的像素點是噪聲或是邊緣像素。
【參考文獻】:
期刊論文
[1]Salient object detection: A survey[J]. Ali Borji,Ming-Ming Cheng,Qibin Hou,Huaizu Jiang,Jia Li. Computational Visual Media. 2019(02)
[2]BING: Binarized normed gradients for objectness estimation at 300fps[J]. Ming-Ming Cheng,Yun Liu,Wen-Yan Lin,Ziming Zhang,Paul L.Rosin,Philip H.S.Torr. Computational Visual Media. 2019(01)
[3]基于穩(wěn)定樹的立體匹配視差優(yōu)化算法[J]. 季雨航,馬利莊. 計算機輔助設(shè)計與圖形學學報. 2016(12)
[4]基于運動分割的視頻去模糊[J]. 譙從彬,盛斌,吳雯,馬利莊. 計算機輔助設(shè)計與圖形學學報. 2015(11)
[5]顯著物體形狀結(jié)構(gòu)保持的圖像縮放方法[J]. 林曉,沈洋,馬利莊,鄒盼盼. 計算機科學. 2014(12)
本文編號:3354993
【文章來源】:上海師范大學上海市
【文章頁數(shù)】:64 頁
【學位級別】:碩士
【部分圖文】:
顯著性檢測示例圖
第一章緒論上海師范大學碩士論文2工智能等技術(shù)來提出一種智能、精確且高效的顯著性檢測算法是一件非常有價值的工作。目前為止,顯著性檢測作為計算機視覺領(lǐng)域的熱門研究領(lǐng)域之一,已經(jīng)被廣泛應(yīng)用到其他高級視覺領(lǐng)域來作為他們的預處理階段,如立體匹配[1]、視頻去模糊[2]、圖像和視頻壓縮[3][4]、內(nèi)容感知圖像編輯[5]、目標識別[6]、語義分割[7]和視覺跟蹤[8]等。圖1-2華為手機圖片虛化功能演示1.2國內(nèi)外研究現(xiàn)狀近年來,顯著性檢測已經(jīng)成為計算機視覺、計算機圖像處理領(lǐng)域的熱門研究方向之一,不斷受到國內(nèi)外研究者的關(guān)注,進而也產(chǎn)生了很多優(yōu)秀的研究成果。根據(jù)顯著性的國內(nèi)外發(fā)展現(xiàn)狀,本節(jié)將從兩個方面對其進行回顧,即傳統(tǒng)顯著性檢測算法和基于深度卷積網(wǎng)絡(luò)的顯著性檢測算法。1.2.1傳統(tǒng)顯著性檢測算法顯著性算法早些年的研究中,其大多是傳統(tǒng)方法。在基于自底向上的顯著性算法的發(fā)展史上具有開創(chuàng)性的研究最早可以追溯到上世紀90年代Itti等[10]關(guān)于IT算法的研究。該研究受Koch和Ullman提出的視覺注意力機制啟發(fā)[11],提出了一種基于中心環(huán)繞(CenterSurrounding)的視覺注意力機制的計算模型,來計算圖像中的顯著視點。中心環(huán)繞機制的核心思想就是相對于周圍的像素點,若在像素點在特征顏色(Colors),亮度(Intensity),或方向(Orientation)等特征上更加顯著,則其更有可能為顯著特征點。Itti的研究對基于顏色特征信息的顯
上海師范大學碩士論文第二章相關(guān)技術(shù)介紹7第二章相關(guān)技術(shù)介紹本章將對超像素分割算法,手工特征提取,深度神經(jīng)網(wǎng)絡(luò),寬度神經(jīng)網(wǎng)絡(luò),和后處理算法條件隨機場進行詳細介紹。2.1超像素分割超像素分割算法是將圖像中特征相似像素聚集成區(qū)域的算法。其中有代表性的研究是Achanta等[34]提出SLIC(simplelineariterativeclustering)算法。SLIC算法的特點是根據(jù)圖像里像素的顏色(R,G,B)和坐標位置(x,y)五維特征進行聚類。該聚類方式類似于K-means算法,其最終所聚成的簇即為超像素。不同的是SLIC算法在聚類時其搜索空間是有限的,而不是對每個超像素都要搜索整張圖片。如圖2-1所示,圖2-1(a)所展示的是K-means算法的搜索空間,(a)標準K-means搜索(b)SLIC算法搜索圖2-1K-means和SLIC的搜索空間的比較[34]而圖2-1(b)是SLIC的搜索空間,具體地,對于一塊大小為×的超像素其搜索空間為2×2,因此SLIC算法運行效率更高。SLIC算法大致過程如下:1.將圖像分為個大小相等且為×的圖像塊(patch),每一個圖像塊都是一個聚類,其聚類的中心被稱為超像素(superpixel)。假設(shè)圖像有個像素,則每個圖像塊的邊長S=*+。2.對聚類中心進行初始化,劃分圖像塊后,在每個圖像塊的中心點的3×3區(qū)域選取梯度最小的點作為聚類中心點。這樣可以防止采樣到的像素點是噪聲或是邊緣像素。
【參考文獻】:
期刊論文
[1]Salient object detection: A survey[J]. Ali Borji,Ming-Ming Cheng,Qibin Hou,Huaizu Jiang,Jia Li. Computational Visual Media. 2019(02)
[2]BING: Binarized normed gradients for objectness estimation at 300fps[J]. Ming-Ming Cheng,Yun Liu,Wen-Yan Lin,Ziming Zhang,Paul L.Rosin,Philip H.S.Torr. Computational Visual Media. 2019(01)
[3]基于穩(wěn)定樹的立體匹配視差優(yōu)化算法[J]. 季雨航,馬利莊. 計算機輔助設(shè)計與圖形學學報. 2016(12)
[4]基于運動分割的視頻去模糊[J]. 譙從彬,盛斌,吳雯,馬利莊. 計算機輔助設(shè)計與圖形學學報. 2015(11)
[5]顯著物體形狀結(jié)構(gòu)保持的圖像縮放方法[J]. 林曉,沈洋,馬利莊,鄒盼盼. 計算機科學. 2014(12)
本文編號:3354993
本文鏈接:http://www.sikaile.net/kejilunwen/shengwushengchang/3354993.html
最近更新
教材專著