基于遷移學(xué)習(xí)的行人重識別技術(shù)研究
發(fā)布時間:2021-01-20 12:54
行人重識別這一課題指的是在時間、空間非重疊的監(jiān)控數(shù)據(jù)中,檢索某一段監(jiān)控數(shù)據(jù)中出現(xiàn)的某一個目標(biāo)人物是否也在其他的監(jiān)控數(shù)據(jù)中出現(xiàn)。最近的幾年,行人重識別問題引起了深度學(xué)習(xí)領(lǐng)域的廣大科研人員的興趣,紛紛在這一領(lǐng)域投入大量精力進行研究,并提出了許多優(yōu)秀的算法。視頻監(jiān)控中的拍攝圖像常常具有分辨率低、光照變化較為劇烈、攝像設(shè)備視角變化較大、行人的動作和姿態(tài)多變等常見問題,這會導(dǎo)致同一行人在不同的視頻中具有很大的差異,給行人重識別課題增加了巨大的挑戰(zhàn)。此外,學(xué)術(shù)界中行人重識別任務(wù)的視頻數(shù)據(jù)集基本只含有幾百個或者一千個左右的行人數(shù)據(jù),這對于訓(xùn)練一個效果較好的多幀圖像行人重識別深度網(wǎng)絡(luò)模型是不足夠的,不利于神經(jīng)網(wǎng)絡(luò)模型分類效果的提高。本篇論文立足于來解決基于視頻序列的行人重識別任務(wù),在算法中首先利用卷積神經(jīng)網(wǎng)絡(luò)(CNN)和循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)設(shè)計了一種將序列數(shù)據(jù)用來訓(xùn)練的深度神經(jīng)網(wǎng)絡(luò)。之后以這個深度神經(jīng)網(wǎng)絡(luò)作為基礎(chǔ),通過遷移學(xué)習(xí)的方法提高網(wǎng)絡(luò)訓(xùn)練的效果,用來解決因訓(xùn)練數(shù)據(jù)不足而對網(wǎng)絡(luò)訓(xùn)練造成的不良影響。具體采用的遷移學(xué)習(xí)方式有兩種:基于預(yù)訓(xùn)練方式的遷移學(xué)習(xí)方法以及使用了跨模態(tài)對齊模塊的遷移學(xué)習(xí)。本文先...
【文章來源】:上海交通大學(xué)上海市 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:86 頁
【學(xué)位級別】:碩士
【部分圖文】:
–1iLIDS-VID行人重識別數(shù)據(jù)庫樣例圖
非常具有挑戰(zhàn)性。我們將 600 個行人及其對應(yīng)的序列化圖像數(shù)據(jù)分為 2 個集合:訓(xùn)練集和測試集。訓(xùn)練集和測試集的行人數(shù)量相同,即訓(xùn)練集包含 300 個行人對象,測試集包含 300 個行人對象。iLIDS-VID 的數(shù)據(jù)庫中的樣例圖如圖2–1所示。圖 2–2 PRID 200 行人重識別數(shù)據(jù)庫樣例圖Fig 2–2 The example images of PRID 2011 person re-identification dataset2.2.2 PRID 200 數(shù)據(jù)庫PRID 2011 數(shù)據(jù)集由從兩個位置不同的監(jiān)視攝像機記錄的行人軌跡中提取的圖像組成 [30]。來自這些攝像機的拍攝圖像包含了拍攝視角的變化以及和光照、背景內(nèi)容相關(guān)— 9 —
長度長于 21 的行人數(shù)據(jù)。共有 200 個行人的數(shù)據(jù)包含在內(nèi)。我們將 200 個行人及其對應(yīng)的序列化圖像數(shù)據(jù)分為 2 個集合:訓(xùn)練集和測試集。訓(xùn)練數(shù)據(jù)集和測試數(shù)據(jù)集的行人數(shù)量相同,分別包含 100 個行人對象。PRID 200 數(shù)據(jù)庫的樣例圖片如圖2–2所示。— 10 —
【參考文獻】:
期刊論文
[1]卷積神經(jīng)網(wǎng)絡(luò)研究綜述[J]. 李彥冬,郝宗波,雷航. 計算機應(yīng)用. 2016(09)
[2]結(jié)合全局詞向量特征的循環(huán)神經(jīng)網(wǎng)絡(luò)語言模型[J]. 李華,屈丹,張文林,王炳錫,梁玉龍. 信號處理. 2016(06)
[3]深度學(xué)習(xí)的研究與發(fā)展[J]. 張建明,詹智財,成科揚,詹永照. 江蘇大學(xué)學(xué)報(自然科學(xué)版). 2015(02)
[4]深度學(xué)習(xí)的昨天、今天和明天[J]. 余凱,賈磊,陳雨強,徐偉. 計算機研究與發(fā)展. 2013(09)
[5]深度學(xué)習(xí)研究綜述[J]. 孫志軍,薛磊,許陽明,王正. 計算機應(yīng)用研究. 2012(08)
本文編號:2989082
【文章來源】:上海交通大學(xué)上海市 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:86 頁
【學(xué)位級別】:碩士
【部分圖文】:
–1iLIDS-VID行人重識別數(shù)據(jù)庫樣例圖
非常具有挑戰(zhàn)性。我們將 600 個行人及其對應(yīng)的序列化圖像數(shù)據(jù)分為 2 個集合:訓(xùn)練集和測試集。訓(xùn)練集和測試集的行人數(shù)量相同,即訓(xùn)練集包含 300 個行人對象,測試集包含 300 個行人對象。iLIDS-VID 的數(shù)據(jù)庫中的樣例圖如圖2–1所示。圖 2–2 PRID 200 行人重識別數(shù)據(jù)庫樣例圖Fig 2–2 The example images of PRID 2011 person re-identification dataset2.2.2 PRID 200 數(shù)據(jù)庫PRID 2011 數(shù)據(jù)集由從兩個位置不同的監(jiān)視攝像機記錄的行人軌跡中提取的圖像組成 [30]。來自這些攝像機的拍攝圖像包含了拍攝視角的變化以及和光照、背景內(nèi)容相關(guān)— 9 —
長度長于 21 的行人數(shù)據(jù)。共有 200 個行人的數(shù)據(jù)包含在內(nèi)。我們將 200 個行人及其對應(yīng)的序列化圖像數(shù)據(jù)分為 2 個集合:訓(xùn)練集和測試集。訓(xùn)練數(shù)據(jù)集和測試數(shù)據(jù)集的行人數(shù)量相同,分別包含 100 個行人對象。PRID 200 數(shù)據(jù)庫的樣例圖片如圖2–2所示。— 10 —
【參考文獻】:
期刊論文
[1]卷積神經(jīng)網(wǎng)絡(luò)研究綜述[J]. 李彥冬,郝宗波,雷航. 計算機應(yīng)用. 2016(09)
[2]結(jié)合全局詞向量特征的循環(huán)神經(jīng)網(wǎng)絡(luò)語言模型[J]. 李華,屈丹,張文林,王炳錫,梁玉龍. 信號處理. 2016(06)
[3]深度學(xué)習(xí)的研究與發(fā)展[J]. 張建明,詹智財,成科揚,詹永照. 江蘇大學(xué)學(xué)報(自然科學(xué)版). 2015(02)
[4]深度學(xué)習(xí)的昨天、今天和明天[J]. 余凱,賈磊,陳雨強,徐偉. 計算機研究與發(fā)展. 2013(09)
[5]深度學(xué)習(xí)研究綜述[J]. 孫志軍,薛磊,許陽明,王正. 計算機應(yīng)用研究. 2012(08)
本文編號:2989082
本文鏈接:http://www.sikaile.net/kejilunwen/zidonghuakongzhilunwen/2989082.html
最近更新
教材專著