基于區(qū)域稀疏注意力網絡的行人再辨識方法研究
發(fā)布時間:2024-02-23 22:33
行人再辨識可應用于刑探偵查、社會安保等領域。已有許多行人再辨識方法被提出,主要分為兩大類:基于人工設計特征的行人再辨識方法和基于深度學習的行人再辨識方法。早期行人再辨識一般采用基于人工設計特征的方法,其算法理論性強且計算量小,但由于此類特征需由人工設計,因此成本較高且易忽略行人特征。近年來深度學習方法的快速發(fā)展,為行人再辨識的應用提供了新的契機。將深度學習與行人再辨識結合,在免去大量人工成本的同時,可以使機器自動地去學習和優(yōu)化行人特征,從而提高行人再辨識算法的性能。但由于行人照片的分辨率較低,且進行深度學習時,特征圖尺寸不斷變小的過程中會損失大量可用信息。鑒于人工設計特征與深度學習在行人再辨識已經取得的矚目成績,本文融合上述兩個研究方向,提出了可用于行人再辨識的區(qū)域稀疏注意力網絡,該網絡通過采用隨機區(qū)域批量遮擋的數(shù)據增強方法,以及嵌入了稀疏注意力機制這兩種算法,可以有效避免卷積過程中必要的信息損失,主要方法如下:1)嵌入稀疏注意力的壓縮激活網絡。該網絡是由壓縮激活網絡改進而來。首先將壓縮激活網絡中的壓縮激活模塊提取出來,對其進行歸一化處理,由此生成注意力模塊:歸一化的壓縮激活模塊;然后...
【文章頁數(shù)】:50 頁
【學位級別】:碩士
【部分圖文】:
本文編號:3908085
【文章頁數(shù)】:50 頁
【學位級別】:碩士
【部分圖文】:
圖2.2線性卷積層和多層感知器的對比
10其中n[1,N],N是感知器的層數(shù),0i,j,:a等同于i,jx。在感知器層中,將11卷積放在傳統(tǒng)卷積層之后,1×1卷積等價于ReLU所繼承的跨通道的池化運算。因此,多層感知器也可以看作是正常卷積層上的多級跨通道池化。最后,應用全局平均池化對最終層的特征圖在空間維度進行平均運....
圖4.4行人特征圖分割數(shù)目效果對比圖
32那么,特征圖尺寸大小為何值時對特征圖進行分割最為恰當呢?在輸入圖片尺寸確定的情況下,特征圖尺寸大小由模型的主干網絡中空間下采樣率決定。研究表明,降低主干網絡的下采樣率能有效地豐富特征信息,因此本文取消了骨干網中最后一層的空間下采樣操作,而在網絡最后擴大輸出特征圖的大校這樣在幾....
圖4.5多任務學習輸入全局局部融合
34相比,局部特征圖中行人具有更精確和更清晰的輪廓。一個合理的解釋是,通過遮擋相同的大致對齊的區(qū)域,我們加強了其余部分的特征學習與語義相關性的表達,其在數(shù)據集Market-1501上具體性能對比如表4.6所示。表4.6多任務學習中模型各分支及融合性能分支mAP(%)Top-1(%....
本文編號:3908085
本文鏈接:http://www.sikaile.net/kejilunwen/shengwushengchang/3908085.html
最近更新
教材專著