基于深度學習的視覺跟蹤算法相關研究
發(fā)布時間:2021-08-02 13:00
作為當今計算機視覺研究領域的重要組成部分之一,視頻目標跟蹤任務需要各個領域知識的綜合運用,只有這樣才能在遇到突發(fā)情況時做出快速地應對,進而實現(xiàn)魯棒追蹤目標。從目前深度學習的運用情況來看,最終整體目標置信度是其主要的研究及運用方向,而網絡的中間特征及多樣的跟蹤方式則沒有受到學術界的重視。因而,本文將著重研究如何通過網絡與跟蹤流程的運用來幫助提升算法性能。本文主要的研究如下:(1)提出了基于RGBD和稀疏學習的跟蹤算法。首先在稀疏學習跟蹤結構框架下的基礎上,通過運用深度信息檢測目標范圍內的遮擋物;然后通過對檢測獲得的遮擋物區(qū)域分析,制作遮擋物模板;接著利用深度圖像的特性和彩色圖像的視覺特性,來描述目標外觀的魯棒特征;最后,提出了一種基于深度直方圖分析的遮擋物檢測方法,用來避免錯誤的模板更新。實驗結果表明,該算法相比其它四種跟蹤算法,在面對光照變化或是遮擋物時,對目標的跟蹤效果都最好。(2)提出了基于深度學習的L1跟蹤算法。利用固定攝像頭下視頻場景中一塊利于分辨目標的區(qū)域構造訓練樣本,構建一個兩路對稱并且權重共享的深度卷積神經網路。在L1跟蹤系統(tǒng)中,對目標候選特征利用訓練好的深度網絡來提取并...
【文章來源】:南京郵電大學江蘇省
【文章頁數(shù)】:54 頁
【學位級別】:碩士
【部分圖文】:
信號的稀疏表示i矩陣代表
sis Pursuit,BP)[22]、基于框架的算法(Method of Frame,MF)[21]、基于光滑分解算法(SLO)[23]、交替投影法(AP)[24]、用于稀疏重構的梯度映射算法(G D.L.Donoho 證明出,當求解范數(shù)最小化問題足夠稀疏時,那么公式(2.2)和化問題[26]是相同的: . . = 表示向量的 范數(shù)。上式中的 范數(shù)最小化問題可以在多項式時間內通過標準法[27]進行求解,它有包括內點法和單純形法兩種方法。稀疏學習跟蹤算法的基本原理稀疏學習的跟蹤算法,它可以和粒子濾波理論[28]相結合,從而在得到目標最新續(xù)優(yōu)化目標狀態(tài)。其算法的構成有:粒子濾波、稀疏學習、模板更新以及遮檔模塊,下圖 2.3 展示的是它的算法框架。
圖 4.1 深度網絡的架構在第 2 層中,為可以更為全部的運用輸入數(shù)據(jù)x ,此章在每一個x 的外圍做出填補,補的尺寸是 2。然后把x 和 256 個卷積核順次做出卷積,對照的權重系數(shù)是 ; ; ; , ∈ × ×,每一個卷積核的路徑數(shù)與尺度依次是 96 與5×5,樣采集間距是 1,獲得 = (4.此層樣本采集尺度是在 3×3的濾波器下予以樣本的采集,樣本采集間距是 2,因 ∈ ×,把全部的特征映射x 構成 ∈ ×,維度是 = 256×5×5。第 3 層中,此章把x 映射 ,此層不包括池化。32 個卷積核分別和x 做出卷積,卷積的路徑數(shù)與尺度依次是3×3,每一個輸入x 填充的尺寸是 1。卷積核對照的權重系數(shù)記作 ; ; ; , ∈ ×。 = (4.
【參考文獻】:
期刊論文
[1]深度學習技術創(chuàng)新實踐[J]. 周川,陳付軍,李奕,侯偉. 中國安防. 2017(04)
[2]基于深度網絡的可學習感受野算法在圖像分類中的應用[J]. 王博,郭繼昌,張艷. 控制理論與應用. 2015(08)
[3]一種新的空間直方圖相似性度量方法及其在目標跟蹤中的應用[J]. 姚志均. 電子與信息學報. 2013(07)
[4]基于粒子Mean Shift遷移的紅外人體目標跟蹤算法[J]. 云廷進,郭永彩,高潮. 計算機學報. 2009(06)
[5]復雜場景下的變形目標跟蹤[J]. 史澤林,王俊卿,黃莎白. 光電工程. 2005(01)
本文編號:3317608
【文章來源】:南京郵電大學江蘇省
【文章頁數(shù)】:54 頁
【學位級別】:碩士
【部分圖文】:
信號的稀疏表示i矩陣代表
sis Pursuit,BP)[22]、基于框架的算法(Method of Frame,MF)[21]、基于光滑分解算法(SLO)[23]、交替投影法(AP)[24]、用于稀疏重構的梯度映射算法(G D.L.Donoho 證明出,當求解范數(shù)最小化問題足夠稀疏時,那么公式(2.2)和化問題[26]是相同的: . . = 表示向量的 范數(shù)。上式中的 范數(shù)最小化問題可以在多項式時間內通過標準法[27]進行求解,它有包括內點法和單純形法兩種方法。稀疏學習跟蹤算法的基本原理稀疏學習的跟蹤算法,它可以和粒子濾波理論[28]相結合,從而在得到目標最新續(xù)優(yōu)化目標狀態(tài)。其算法的構成有:粒子濾波、稀疏學習、模板更新以及遮檔模塊,下圖 2.3 展示的是它的算法框架。
圖 4.1 深度網絡的架構在第 2 層中,為可以更為全部的運用輸入數(shù)據(jù)x ,此章在每一個x 的外圍做出填補,補的尺寸是 2。然后把x 和 256 個卷積核順次做出卷積,對照的權重系數(shù)是 ; ; ; , ∈ × ×,每一個卷積核的路徑數(shù)與尺度依次是 96 與5×5,樣采集間距是 1,獲得 = (4.此層樣本采集尺度是在 3×3的濾波器下予以樣本的采集,樣本采集間距是 2,因 ∈ ×,把全部的特征映射x 構成 ∈ ×,維度是 = 256×5×5。第 3 層中,此章把x 映射 ,此層不包括池化。32 個卷積核分別和x 做出卷積,卷積的路徑數(shù)與尺度依次是3×3,每一個輸入x 填充的尺寸是 1。卷積核對照的權重系數(shù)記作 ; ; ; , ∈ ×。 = (4.
【參考文獻】:
期刊論文
[1]深度學習技術創(chuàng)新實踐[J]. 周川,陳付軍,李奕,侯偉. 中國安防. 2017(04)
[2]基于深度網絡的可學習感受野算法在圖像分類中的應用[J]. 王博,郭繼昌,張艷. 控制理論與應用. 2015(08)
[3]一種新的空間直方圖相似性度量方法及其在目標跟蹤中的應用[J]. 姚志均. 電子與信息學報. 2013(07)
[4]基于粒子Mean Shift遷移的紅外人體目標跟蹤算法[J]. 云廷進,郭永彩,高潮. 計算機學報. 2009(06)
[5]復雜場景下的變形目標跟蹤[J]. 史澤林,王俊卿,黃莎白. 光電工程. 2005(01)
本文編號:3317608
本文鏈接:http://www.sikaile.net/kejilunwen/zidonghuakongzhilunwen/3317608.html