天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 自動化論文 >

深度學習及其在視頻目標跟蹤中的應用研究

發(fā)布時間:2021-01-06 21:13
  近些年,深度學習在計算機視覺領域取得的突破,使其研究日益受到人們的關注。目前,深度學習中最重要的基礎模型結構——卷積神經網絡在實際應用當中還存在著泛化能力差、計算復雜度高等問題。本文立足于深度學習算法及其在目標跟蹤中的應用研究,主要工作如下:(1)基于國內外關于深度學習算法及其在目標跟蹤上的研究發(fā)展,對卷積神經網絡模型和目標跟蹤技術現(xiàn)存的問題進行了分析。(2)研究了深度學習網絡中的池化層設計問題。池化層是深度卷積神經網絡結構中的一個基礎部分,各種池化算法中,隨機池化具有較強的抗過擬合能力,隨著各種提升卷積神經網絡性能的具有負值響應激活函數的出現(xiàn),傳統(tǒng)的隨機池化方法已無法適用。針對隨機池化無法適用于負值響應激活函數的問題,我們提出一種通用隨機池化方法——域偏移最小值法。該方法對于ReLU,雖然不嚴格等效于原始方法,但是能保持性能不變甚至略有改善。實驗表明:所提出的隨機池化方法能很好地適用于具有負值響應激活函數,便于設計相應的深度神經網絡。(3)研究了隨機池化在目標跟蹤卷積神經網絡中的設計問題。卷積神經網絡是目標跟蹤任務中特征提取的重要部分,實際目標跟蹤任務中要求卷積神經網絡在保證較高準確... 

【文章來源】:南京郵電大學江蘇省

【文章頁數】:90 頁

【學位級別】:碩士

【部分圖文】:

深度學習及其在視頻目標跟蹤中的應用研究


早期LeNet-5結構

中間層,網絡結構


分類網絡只是四層的全連接網絡,對目標的特征刻畫能力還是不夠優(yōu)秀,使得總體效果還是低于傳統(tǒng)以人工特征為基礎的目標跟蹤算法,如 Struck[23]等;在線模型更新限定閾值的選取較為敏感,當選取過小,目標表觀發(fā)生變化時很容易造成模型得不到及時更新,當選取過大,很容易造成遮擋對象或背景被誤認為是跟蹤對象,從而導致目標漂移。2.3.2 基于卷積神經網絡的目標跟蹤方法SO-DLT[37](Structured Output Deep Learning Tracker)是 2015 年王乃巖在 DLT 算法的基礎上改進得到,該算法繼承了 DLT 利用非跟蹤數據離線預訓練加上在線跟蹤微調的策略以解決跟蹤過程中訓練數據不充足的問題,同時,也對 DLT 存在的一些問題進行了很大的改進。首先在離線預訓練階段,SO-DLT 使用卷積神經網絡來學習區(qū)分物體和非物體的通用物體特征,即從實例中學習物體的概念。該算法針對目標跟蹤問題設計了具有針對性的卷積神經網絡結構如圖 2.10 所示,

流程圖,在線跟蹤,流程


南京郵電大學碩士研究生學位論文 第二章 深度學習的相關技術與應用SO-DLT 離線預訓練得到的卷積神經網絡模型學習到的是通用物體特征,因為 ImageNet中的圖像與實際跟蹤的圖像不同,所以在線跟蹤對于 SO-DLT 跟蹤器的性能是必不可少的。SO-DLT 在線跟蹤過程如圖 2.11 所示,當處理第 t 幀時,以前一幀(第 t-1 幀)預測位置為中心,開始以最小的尺度不斷遞增式地裁剪輸入到網絡中,當網絡輸出的概率圖總和高于設定的閾值時,停止裁剪,并以當前裁剪的尺度作為最佳的搜索區(qū)域大小。當選定好第 t 幀的最佳搜索區(qū)域后,在該區(qū)域輸出的概率圖上利用一定的策略確定最終目標框的位置和尺度大小。在模型在線更新方面,一般如果跟蹤器模型不經常更新,可能無法很好地適應目標物體發(fā)生的表觀變化;如果過于經常更新,不準確的結果可能會損害跟蹤器的性能。所以 SO-DLT 在模型在線更新方面,如圖 2.11,使用兩個 CNN——CNNS與 CNNL,兩者最后的結果會進行結合,取置信度最高的作為輸出結果,使用兩種 CNN 的做法能在適應目標表觀變化和漂移間達到均衡。


本文編號:2961267

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/zidonghuakongzhilunwen/2961267.html


Copyright(c)文論論文網All Rights Reserved | 網站地圖 |

版權申明:資料由用戶fa237***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com