以光流網(wǎng)絡為導向的深度視頻目標檢測研究
發(fā)布時間:2022-07-27 13:06
目標檢測問題是計算機視覺領域非常熱門的研究方向,目前在學術界中針對單幅圖像的目標檢測已有許多代表性算法,但針對視頻目標檢測問題的研究進展比較緩慢。圖像數(shù)據(jù)與視頻數(shù)據(jù)比較,撇去形式不談,后者的信息量更大更冗雜,如今互聯(lián)網(wǎng)技術與移動通信技術飛速發(fā)展,不論電腦端還是移動端,視頻數(shù)據(jù)在我們的生活中扮演越來越重要的角色,視頻目標檢測也勢必成為當下的研究焦點之一。目標檢測這門學科具體而且核心,它的任務是找出圖像中所有感興趣的目標,通常輸出結(jié)果會以邊界框的形式確定目標在圖像中的具體位置,大小以及所屬物體類別。視頻目標檢測任務就是找出視頻中所有感興趣的目標,并完成定位、識別和分類任務。然而在一段視頻幀序列中,相鄰幀圖像往往具有極大的相似性,而且前后幀還存在上下文關系,這是單幅圖像所不具備的特點。因此,看上去視頻目標檢測與圖像目標檢測大同小異,但實際算法設計上卻有著很大區(qū)別。本課題在此前微軟亞洲研究院關于光流法視頻目標檢測的固定間隔關鍵幀選取算法和密集特征增強算法的基礎上,提出了一種基于分片的關鍵幀插入策略的算法,這種新算法在整體結(jié)構上依然是特征級別的檢測原理,即結(jié)合特征提取網(wǎng)絡與基于區(qū)域的全卷積網(wǎng)絡。...
【文章頁數(shù)】:72 頁
【學位級別】:碩士
【部分圖文】:
對ILSVRCVID數(shù)據(jù)集中示例圖像的檢測結(jié)果
卷積神經(jīng)網(wǎng)絡發(fā)展歷程
VGGNet網(wǎng)絡結(jié)構圖[7]
本文編號:3665511
【文章頁數(shù)】:72 頁
【學位級別】:碩士
【部分圖文】:
對ILSVRCVID數(shù)據(jù)集中示例圖像的檢測結(jié)果
卷積神經(jīng)網(wǎng)絡發(fā)展歷程
VGGNet網(wǎng)絡結(jié)構圖[7]
本文編號:3665511
本文鏈接:http://www.sikaile.net/shoufeilunwen/xixikjs/3665511.html
最近更新
教材專著