復(fù)雜場(chǎng)景下的視覺(jué)對(duì)象跟蹤建模及算法研究
發(fā)布時(shí)間:2021-09-24 05:57
對(duì)象跟蹤是一個(gè)計(jì)算器視覺(jué)領(lǐng)域內(nèi)的基本任務(wù),該任務(wù)旨在從圖像或者視頻中尋找出目標(biāo)物體。該任務(wù)在自動(dòng)駕駛、智能監(jiān)控、人機(jī)交互以及醫(yī)學(xué)成像等多種運(yùn)用中具有很高的實(shí)用價(jià)值,因此大量的研究力量被投入其中。然而,在真實(shí)的對(duì)象跟蹤場(chǎng)景中,視頻目標(biāo)跟蹤往往會(huì)由于復(fù)雜場(chǎng)景條件和目標(biāo)運(yùn)動(dòng)的隨機(jī)性而變得困難。在自然條件下,目標(biāo)物體經(jīng)常出現(xiàn)光照變化、旋轉(zhuǎn)、伸縮、遮擋、曝光不足、背景變化、運(yùn)動(dòng)的復(fù)雜性和隨機(jī)性等因素,這些都會(huì)使得對(duì)象跟蹤變得非常困難。雖然對(duì)象跟蹤算法已經(jīng)取得了豐碩的研究成果,但在理論和應(yīng)用上也存在著不完善和待解決的問(wèn)題。在此背景下,研究復(fù)雜場(chǎng)景下的對(duì)象跟蹤算法在理論和應(yīng)用方面都具有非常重要的意義。從神經(jīng)網(wǎng)絡(luò)的模型結(jié)構(gòu)出發(fā),對(duì)現(xiàn)有的模型進(jìn)行優(yōu)化,結(jié)合真實(shí)對(duì)象跟蹤場(chǎng)景特性,探索新的網(wǎng)絡(luò)模型,研究新的處理算法,提高對(duì)象跟蹤的性能和效率。研究成果主要在如下幾個(gè)方面體現(xiàn):首先,針對(duì)復(fù)雜場(chǎng)景下的跟蹤失效及恢復(fù)問(wèn)題,提出了一種基于自組織映射網(wǎng)絡(luò)(Self-Organizing Maps,SOM)和相關(guān)濾波器的長(zhǎng)期記憶對(duì)象跟蹤算法。在對(duì)象跟蹤中,不同的視頻或圖像中的同一種物體常常有著不同的外觀(guān),對(duì)這些外觀(guān)進(jìn)行學(xué)...
【文章來(lái)源】:重慶大學(xué)重慶市 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:110 頁(yè)
【學(xué)位級(jí)別】:博士
【部分圖文】:
對(duì)象跟蹤的六種典型應(yīng)用
1緒論31.2視覺(jué)對(duì)象跟蹤系統(tǒng)結(jié)構(gòu)對(duì)象跟蹤的基本方法是給定第一幀中一般目標(biāo)對(duì)象的初始狀態(tài)(如位置和尺度),或者使用對(duì)象識(shí)別方法(例如,人臉[1]或行人[2]檢測(cè)器)檢測(cè)出第一幀中包含的對(duì)象的初始狀態(tài)。利用對(duì)象跟蹤算法在下一幀中產(chǎn)生眾多候選框,并提取這些候選框的特征,在提取的特征基礎(chǔ)上對(duì)這些候選框進(jìn)行評(píng)分,最后找一個(gè)得分最高的候選框作為預(yù)測(cè)的目標(biāo)。在圖1.2中,我們展示了一個(gè)視覺(jué)對(duì)象跟蹤的典型結(jié)構(gòu)。概況起來(lái),一個(gè)典型的視覺(jué)對(duì)象跟蹤系統(tǒng)[3,4,5]一般由五個(gè)模塊組成:(1)運(yùn)動(dòng)模型:產(chǎn)生候選樣本。(2)外觀(guān)建模:提取有效特征表示目標(biāo)。(3)觀(guān)測(cè)模型:為候選樣本進(jìn)行評(píng)分。(4)模型更新:更新觀(guān)測(cè)模型使其適應(yīng)目標(biāo)的變化。(5)集成方法:結(jié)合多個(gè)預(yù)測(cè)獲得最優(yōu)的決策結(jié)果。運(yùn)動(dòng)模型生成候選樣本的速度與質(zhì)量直接決定了跟蹤系統(tǒng)表現(xiàn)的優(yōu)劣。運(yùn)動(dòng)模型可以表示為一個(gè)經(jīng)典的動(dòng)態(tài)狀態(tài)估計(jì)問(wèn)題:=(,)和=(,),其中 為當(dāng)前狀態(tài), 為當(dāng)前觀(guān)測(cè);為狀態(tài)演化函數(shù),為演化過(guò)程噪聲; 為測(cè)量函數(shù), 為測(cè)量噪聲。估計(jì)的目標(biāo)是計(jì)算給定觀(guān)測(cè)數(shù)據(jù)的隱藏狀態(tài)的最優(yōu)估計(jì),而運(yùn)動(dòng)估計(jì)則可作為貝葉斯規(guī)則[6]的遞歸形式導(dǎo)出。典型運(yùn)動(dòng)模型包括線(xiàn)性回歸技術(shù)[7]、卡爾曼濾波器[8]、粒子濾波器[9,10]或相關(guān)濾波器[11]。外觀(guān)建模通過(guò)不同類(lèi)型的判別特征構(gòu)建健壯的外觀(guān)描述符。在以前的研究中,大量手工制作的特征模型被用來(lái)表示目標(biāo)外觀(guān)。如子空間表示[12]、顏色直方圖[13]、方向梯度直方圖(HOG)、哈爾特征(Haar)[14]、SURF[15]、ORB[16]和SuperPixels[17]。近年來(lái),這些特性模型依靠深度卷積神經(jīng)網(wǎng)絡(luò)有了顯著的進(jìn)展,在視覺(jué)跟蹤方面得到了大量的應(yīng)用[18,19,20,21]。觀(guān)測(cè)模型根據(jù)不同的實(shí)現(xiàn)算?
1緒論11學(xué)習(xí)判別顯著性映射。Wang等人基于VGGNet-16[80]的特征,使用全連通CNN構(gòu)建了回歸模型。這些方法在利用大量輔助數(shù)據(jù)進(jìn)行離線(xiàn)學(xué)習(xí)有效特征表示時(shí)顯示出了有競(jìng)爭(zhēng)性的對(duì)象跟蹤結(jié)果,也不要完全考慮在后續(xù)幀的目標(biāo)對(duì)象的相似的局部結(jié)構(gòu)和內(nèi)部之間的幾何布局信息,這有利于在跟蹤過(guò)程中從復(fù)雜背景中有效地區(qū)分視覺(jué)跟蹤目標(biāo)。a.目標(biāo)形變b.光照變化c.突然運(yùn)動(dòng)d.背景雜波e.面外旋轉(zhuǎn)f.面內(nèi)旋轉(zhuǎn)g.嚴(yán)重遮擋h.視野外圖1.3復(fù)雜場(chǎng)景下對(duì)象外觀(guān)變化的特點(diǎn)及挑戰(zhàn)Fig.1.3Featuredchallengescausedbysignificantappearancevariationsincomplexscene
【參考文獻(xiàn)】:
期刊論文
[1]融合峰旁比和幀差均值自適應(yīng)模型更新的視覺(jué)跟蹤[J]. 熊昌鎮(zhèn),車(chē)滿(mǎn)強(qiáng),王潤(rùn)玲,盧顏. 光子學(xué)報(bào). 2018(09)
本文編號(hào):3407232
【文章來(lái)源】:重慶大學(xué)重慶市 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:110 頁(yè)
【學(xué)位級(jí)別】:博士
【部分圖文】:
對(duì)象跟蹤的六種典型應(yīng)用
1緒論31.2視覺(jué)對(duì)象跟蹤系統(tǒng)結(jié)構(gòu)對(duì)象跟蹤的基本方法是給定第一幀中一般目標(biāo)對(duì)象的初始狀態(tài)(如位置和尺度),或者使用對(duì)象識(shí)別方法(例如,人臉[1]或行人[2]檢測(cè)器)檢測(cè)出第一幀中包含的對(duì)象的初始狀態(tài)。利用對(duì)象跟蹤算法在下一幀中產(chǎn)生眾多候選框,并提取這些候選框的特征,在提取的特征基礎(chǔ)上對(duì)這些候選框進(jìn)行評(píng)分,最后找一個(gè)得分最高的候選框作為預(yù)測(cè)的目標(biāo)。在圖1.2中,我們展示了一個(gè)視覺(jué)對(duì)象跟蹤的典型結(jié)構(gòu)。概況起來(lái),一個(gè)典型的視覺(jué)對(duì)象跟蹤系統(tǒng)[3,4,5]一般由五個(gè)模塊組成:(1)運(yùn)動(dòng)模型:產(chǎn)生候選樣本。(2)外觀(guān)建模:提取有效特征表示目標(biāo)。(3)觀(guān)測(cè)模型:為候選樣本進(jìn)行評(píng)分。(4)模型更新:更新觀(guān)測(cè)模型使其適應(yīng)目標(biāo)的變化。(5)集成方法:結(jié)合多個(gè)預(yù)測(cè)獲得最優(yōu)的決策結(jié)果。運(yùn)動(dòng)模型生成候選樣本的速度與質(zhì)量直接決定了跟蹤系統(tǒng)表現(xiàn)的優(yōu)劣。運(yùn)動(dòng)模型可以表示為一個(gè)經(jīng)典的動(dòng)態(tài)狀態(tài)估計(jì)問(wèn)題:=(,)和=(,),其中 為當(dāng)前狀態(tài), 為當(dāng)前觀(guān)測(cè);為狀態(tài)演化函數(shù),為演化過(guò)程噪聲; 為測(cè)量函數(shù), 為測(cè)量噪聲。估計(jì)的目標(biāo)是計(jì)算給定觀(guān)測(cè)數(shù)據(jù)的隱藏狀態(tài)的最優(yōu)估計(jì),而運(yùn)動(dòng)估計(jì)則可作為貝葉斯規(guī)則[6]的遞歸形式導(dǎo)出。典型運(yùn)動(dòng)模型包括線(xiàn)性回歸技術(shù)[7]、卡爾曼濾波器[8]、粒子濾波器[9,10]或相關(guān)濾波器[11]。外觀(guān)建模通過(guò)不同類(lèi)型的判別特征構(gòu)建健壯的外觀(guān)描述符。在以前的研究中,大量手工制作的特征模型被用來(lái)表示目標(biāo)外觀(guān)。如子空間表示[12]、顏色直方圖[13]、方向梯度直方圖(HOG)、哈爾特征(Haar)[14]、SURF[15]、ORB[16]和SuperPixels[17]。近年來(lái),這些特性模型依靠深度卷積神經(jīng)網(wǎng)絡(luò)有了顯著的進(jìn)展,在視覺(jué)跟蹤方面得到了大量的應(yīng)用[18,19,20,21]。觀(guān)測(cè)模型根據(jù)不同的實(shí)現(xiàn)算?
1緒論11學(xué)習(xí)判別顯著性映射。Wang等人基于VGGNet-16[80]的特征,使用全連通CNN構(gòu)建了回歸模型。這些方法在利用大量輔助數(shù)據(jù)進(jìn)行離線(xiàn)學(xué)習(xí)有效特征表示時(shí)顯示出了有競(jìng)爭(zhēng)性的對(duì)象跟蹤結(jié)果,也不要完全考慮在后續(xù)幀的目標(biāo)對(duì)象的相似的局部結(jié)構(gòu)和內(nèi)部之間的幾何布局信息,這有利于在跟蹤過(guò)程中從復(fù)雜背景中有效地區(qū)分視覺(jué)跟蹤目標(biāo)。a.目標(biāo)形變b.光照變化c.突然運(yùn)動(dòng)d.背景雜波e.面外旋轉(zhuǎn)f.面內(nèi)旋轉(zhuǎn)g.嚴(yán)重遮擋h.視野外圖1.3復(fù)雜場(chǎng)景下對(duì)象外觀(guān)變化的特點(diǎn)及挑戰(zhàn)Fig.1.3Featuredchallengescausedbysignificantappearancevariationsincomplexscene
【參考文獻(xiàn)】:
期刊論文
[1]融合峰旁比和幀差均值自適應(yīng)模型更新的視覺(jué)跟蹤[J]. 熊昌鎮(zhèn),車(chē)滿(mǎn)強(qiáng),王潤(rùn)玲,盧顏. 光子學(xué)報(bào). 2018(09)
本文編號(hào):3407232
本文鏈接:http://www.sikaile.net/kejilunwen/shengwushengchang/3407232.html
最近更新
教材專(zhuān)著