復(fù)雜場景下目標(biāo)檢測算法研究
本文選題:隨機森林 + 目標(biāo)檢測 ; 參考:《電子科技大學(xué)》2016年博士論文
【摘要】:目標(biāo)檢測是計算機視覺領(lǐng)域最基本的問題,其核心任務(wù)是對任意一幅給定的圖像,采用某種目標(biāo)識別算法和搜索策略,確定特定目標(biāo)在圖像中的位置和大小。盡管該領(lǐng)域已取得豐碩的研究成果,但在復(fù)雜應(yīng)用場景中,目標(biāo)通常會受光照變化、視角、姿態(tài)、部分遮擋等因素影響而引起較大的外觀變化,最終導(dǎo)致檢測算法性能下降。然而,隨著智能監(jiān)控、智能交通、圖像檢索等應(yīng)用需求的增長,人們對能適應(yīng)各種復(fù)雜應(yīng)用場景的目標(biāo)檢測方法的需求日益增長。本文工作以一種Boosting算法加強的隨機森林GBRF(Gradient Boosting Random Forests)為基礎(chǔ),針對不同場景下待檢測目標(biāo)的自身特點,將GBRF與不同圖像表達方式結(jié)合,構(gòu)建滿足應(yīng)用需求的目標(biāo)識別模型,并最終利用一種搜索方法完成檢測過程。研究分別從目標(biāo)分類模型、高層圖像表達、快速目標(biāo)檢測和多視角目標(biāo)檢測四個方面展開,主要貢獻總結(jié)如下:(1)基于Boosting算法加強的隨機森林模型GBRF,提出了利用GBRF構(gòu)建能適應(yīng)外觀變化目標(biāo)模型的一般方法,并應(yīng)用到人臉檢測任務(wù)上。首先,GBRF目標(biāo)模型以樹分類方法為基礎(chǔ),結(jié)合不同圖像特征對樣本進行逐層劃分,并利用樹的不同決策分支對外觀變化目標(biāo)分別建模;然后,為了提高模型泛化能力和識別精度,基于集成學(xué)習(xí)理論,先利用Bagging算法組合多棵樹,再利用Boosting算法組合森林的不同層;最后,針對人臉檢測任務(wù),給出了一種“GBRF+Haar矩形特征”的人臉檢測方法。實驗表明,該方法對人臉等小尺度、局部變化可控的目標(biāo)有較好檢測結(jié)果,但對于復(fù)雜場景中尺度大、外觀變化大的目標(biāo)還需依賴更強大的圖像特征和目標(biāo)表達方法。(2)提出一種基于CNN(Convolutional Neural Network)高層特征的圖像局部塊描述方法,并將其與GBRF相結(jié)合,以構(gòu)建目標(biāo)檢測模型。首先,通過研究CNN高層特征與圖像局部區(qū)域的對應(yīng)關(guān)系,提出了一種CNN局部圖像塊描述子;然后,結(jié)合CNN局部圖像塊特征表達形式,提出了一種基于圖像塊多維特征的樹節(jié)點樣本劃分方法;最后,通過多棵樹逐層選擇并組合最有區(qū)分度的局部圖像塊構(gòu)建GBRF目標(biāo)識別模型。在多個目標(biāo)檢測任務(wù)集上比較實驗的結(jié)果表明,CNN局部圖像塊特征對光照、局部形變有很好容忍能力,基于圖像塊多維特征的樹節(jié)點分裂函數(shù)有更強的分類能力,所提方法相比已有算法也展現(xiàn)了更好的檢測性能。(3)基于局部DOT(Dominant Orientation Template)模板的快速計算特性,利用GBRF逐層選擇和組合不同位置、大小自適應(yīng)的局部模板,以構(gòu)建了一種快速的行人檢測方法。首先,基于二進制編碼形式給出DOT模板的快速計算方法,并利用SSE指令進行硬件加速;然后,定義了一種位置、大小自適應(yīng)的局部DOT模板生成方法,并利用生成的局部模板,設(shè)計了一種基于DOT模板匹配的樹節(jié)點樣本劃分方法;最后,利用定義的局部模板集和節(jié)點劃分方法,給出了基于局部DOT模板和GBRF的目標(biāo)模型生成方法。檢測過程中,在基于滑動窗口法確定目標(biāo)位置時,提出利用一種級聯(lián)檢測架構(gòu)快速排除大量的背景窗口。實驗結(jié)果表明,所提方法在不損失檢測精度前提下提高了檢測效率,同時,局部DOT模板對部分遮擋有較好抵抗能力。(4)改進傳統(tǒng)霍夫投票目標(biāo)檢測框架,提出了一種適用于多視角目標(biāo)的加權(quán)霍夫投票檢測方法,并在多視角車輛檢測上驗證所提算法有效性。首先,利用GBRF對包含外觀和位置信息的圖像塊集進行聚類,并提出了一種緊致性視覺單詞的描述方法,該描述方法不僅有利于表達投票檢測過程,還有效地減少了冗余、混亂的投票單元;其次,利用得到的視覺單詞,提出了多視角目標(biāo)的加權(quán)投票檢測框架,視覺單詞在各視角子類間共享,但對不同視角下目標(biāo)中心有不同投票組合權(quán)重;最后,在驗證集上,提出一種基于無監(jiān)督視角子類劃分和多類別線性SVM的投票組合權(quán)重訓(xùn)練方法。實驗結(jié)果表明,所提方法能有效處理目標(biāo)的視角變化,對目標(biāo)中心的投票分值也更為集中。
[Abstract]:Object detection is the most basic problem in the field of computer vision . The core task is to determine the position and the size of a specific target in the image by using a target recognition algorithm and a search strategy for any given image . ( 2 ) A method of image local block description based on CNN is proposed and combined with GBRF to construct a target detection model . ( 4 ) To improve the traditional Hough voting target detection framework , a weighted Hough voting detection method suitable for multi - view targets is proposed , and the proposed algorithm effectiveness is verified on the multi - view vehicle detection . Firstly , based on the obtained visual words , a weighted voting detection framework for multi - view targets is proposed , and a weighted voting combined weight training method based on a non - supervised visual angle sub - division and a multi - category linear SVM is proposed .
【學(xué)位授予單位】:電子科技大學(xué)
【學(xué)位級別】:博士
【學(xué)位授予年份】:2016
【分類號】:TP391.41
【相似文獻】
相關(guān)期刊論文 前10條
1 顧勇;張燦果;龔志廣;;基于圖像塊分割融合算法在醫(yī)學(xué)圖像中的應(yīng)用[J];河北建筑工程學(xué)院學(xué)報;2007年02期
2 李天偉;黃謙;郭模燦;何四華;;圖像塊混沌特征在海面運動目標(biāo)檢測中的應(yīng)用[J];中國造船;2011年02期
3 李軍;部分圖像塊的顯示及特技制作技巧[J];電腦編程技巧與維護;1997年04期
4 李生金;蒲寶明;賀寶岳;王維維;;基于圖像塊的滯留物/移取物的檢測方法[J];小型微型計算機系統(tǒng);2014年01期
5 趙德斌;陳耀強;高文;;基于圖像塊方向的自適應(yīng)無失真編碼[J];模式識別與人工智能;1998年01期
6 陳琦,李華,朱光喜;一種新的應(yīng)用于屏幕共享的圖像塊識別算法[J];電訊技術(shù);2000年06期
7 劉尚翼;霍永津;羅欣榮;白仲亮;魏林鋒;項世軍;;基于圖像塊相關(guān)性分類的加密域可逆數(shù)據(jù)隱藏[J];武漢大學(xué)學(xué)報(理學(xué)版);2013年05期
8 陳奮,閆冬梅,趙忠明;一種快速圖像塊填充算法及其在遙感影像處理中的應(yīng)用[J];計算機應(yīng)用;2005年10期
9 馬文龍,余寧梅,銀磊,高勇;圖像塊動態(tài)劃分矢量量化[J];計算機輔助設(shè)計與圖形學(xué)學(xué)報;2005年02期
10 李維釗,王廣偉;圖像塊平坦測度與系數(shù)掃描方式選擇[J];山東電子;2000年04期
相關(guān)會議論文 前2條
1 李趙紅;侯建軍;宋偉;;基于圖像塊等級模型的多重認證水印算法[A];第八屆全國信息隱藏與多媒體安全學(xué)術(shù)大會湖南省計算機學(xué)會第十一屆學(xué)術(shù)年會論文集[C];2009年
2 鐘凡;莫銘臻;秦學(xué)英;彭群生;;基于WSSD的不規(guī)則圖像塊快速匹配[A];中國計算機圖形學(xué)進展2008--第七屆中國計算機圖形學(xué)大會論文集[C];2008年
相關(guān)博士學(xué)位論文 前5條
1 霍雷剛;圖像處理中的塊先驗理論及應(yīng)用研究[D];西安電子科技大學(xué);2015年
2 欽夏孟;稠密圖像塊匹配方法及其應(yīng)用[D];北京理工大學(xué);2015年
3 林樂平;基于過完備字典的非凸壓縮感知理論與方法研究[D];西安電子科技大學(xué);2016年
4 向濤;復(fù)雜場景下目標(biāo)檢測算法研究[D];電子科技大學(xué);2016年
5 宋偉;幾類數(shù)字圖像水印算法的研究[D];北京交通大學(xué);2010年
相關(guān)碩士學(xué)位論文 前10條
1 王榮麗;基于半監(jiān)督學(xué)習(xí)的目標(biāo)跟蹤方法研究[D];浙江師范大學(xué);2015年
2 祝漢城;數(shù)字圖像的客觀質(zhì)量評價方法研究[D];中國礦業(yè)大學(xué);2015年
3 陸杰;使用自組織增量神經(jīng)網(wǎng)絡(luò)實現(xiàn)單層非監(jiān)督特征學(xué)習(xí)[D];南京大學(xué);2015年
4 熊耀先;基于圖像塊統(tǒng)計特性的EPLL遙感圖像復(fù)原方法[D];國防科學(xué)技術(shù)大學(xué);2014年
5 張書揚;基于冗余字典的圖像壓縮感知技術(shù)研究[D];吉林大學(xué);2016年
6 楊存強;基于圖像塊多級分類和稀疏表示的超分辨率重建算法研究[D];天津工業(yè)大學(xué);2016年
7 魏譜躚;基于圖像塊特征的焊縫識別算法研究[D];西安科技大學(xué);2014年
8 杭仁龍;基于主動學(xué)習(xí)的遙感圖像分類研究[D];南京信息工程大學(xué);2014年
9 劉尚翼;加密域可逆信息隱藏研究[D];暨南大學(xué);2014年
10 張曉旭;圖像內(nèi)容可恢復(fù)的變?nèi)萘看嗳跛∷惴ㄑ芯縖D];西南交通大學(xué);2014年
,本文編號:1970061
本文鏈接:http://www.sikaile.net/shoufeilunwen/xxkjbs/1970061.html