基于卷積神經(jīng)網(wǎng)絡(luò)的視頻行人重識別算法研究
發(fā)布時間:2021-09-21 22:29
隨著國家推進(jìn)“平安城市”“天網(wǎng)工程”“雪亮工程”來建設(shè)多級視頻監(jiān)控并聯(lián)網(wǎng)應(yīng)用,監(jiān)控視頻的數(shù)量與日俱增,在安保方面單靠人力資源在海量的視頻里進(jìn)行行人追蹤和監(jiān)控將會非常的困難。而行人重識別是解決這一問題的關(guān)鍵技術(shù),它是計(jì)算機(jī)視覺領(lǐng)域一個非常重要的且具有挑戰(zhàn)性的課題,因?yàn)閷?shí)際應(yīng)用場景下環(huán)境復(fù)雜,攝像頭視角和光照等條件變化大且容易存在多個行人之間的遮擋現(xiàn)象。因此,如何提取出全面且辨別性強(qiáng)的行人特征是當(dāng)前研究行人重識別任務(wù)需要重點(diǎn)關(guān)注的問題。隨著卷積神經(jīng)網(wǎng)絡(luò)的發(fā)展,使用卷積神經(jīng)網(wǎng)絡(luò)模型對行人特征進(jìn)行提取可以有效的提高行人重識別的準(zhǔn)確率。本文基于卷積神經(jīng)網(wǎng)絡(luò)對行人重識別模型及算法進(jìn)行研究,主要研究工作如下:(1)針對當(dāng)前數(shù)據(jù)集中圖像的不對齊導(dǎo)致難以獲得較全面的行人描述符問題。本文結(jié)合細(xì)粒度識別框架,提出了基于雙線性CNN和分塊特征的行人重識別模型。該模型使用精簡的殘差網(wǎng)絡(luò)組成雙線性框架,并使用分支網(wǎng)絡(luò)對特征進(jìn)行水平分塊后繼續(xù)對分塊進(jìn)行更加細(xì)粒度特征的提取,使得融合后的行人既包含全身特征,又包含分塊的細(xì)粒度特征,這兩部分特征組成同時包含全身和其他分塊信息的行人描述符,從而提升模型的準(zhǔn)確率。訓(xùn)練時使用...
【文章來源】:蘭州交通大學(xué)甘肅省
【文章頁數(shù)】:63 頁
【學(xué)位級別】:碩士
【部分圖文】:
行人重識別流程圖
W祭詞迪值!靶腥酥厥侗稹蔽侍庠?005年才被正式命名。下一年,機(jī)器視覺頂會CVPR才把行人重識別看待為一個單獨(dú)的任務(wù)。2007年,第一個行人重識別數(shù)據(jù)集VIPeR公開,為該問題的研究提供了一個公平可靠的度量標(biāo)準(zhǔn)。2010年,開始著力研究基于視頻的行人重識別,選取同一個行人的多個視頻幀來作為輸入來進(jìn)行目標(biāo)的識別。2012年,有關(guān)行人重識別的綜述和專著在ECCV召開的專題的研討會后分別被發(fā)表。隨著神經(jīng)網(wǎng)絡(luò)在ImageNet數(shù)據(jù)集上面的優(yōu)越表現(xiàn),卷積神經(jīng)網(wǎng)絡(luò)才開始被逐漸引入行人重識別任務(wù),大量的實(shí)驗(yàn)說明,基于卷積神經(jīng)網(wǎng)絡(luò)圖1.2行人重識別的發(fā)展
基于卷積神經(jīng)網(wǎng)絡(luò)的視頻行人重識別算法研究-10-2相關(guān)技術(shù)概述卷積神經(jīng)網(wǎng)絡(luò)的快速發(fā)展使得很多研究課題注入新的活力,尤其在被引入到行人重識別任務(wù)后,基于卷積神經(jīng)網(wǎng)絡(luò)的模型體現(xiàn)出了手工特征無法比擬的優(yōu)勢,并且逐漸成為行人重識別領(lǐng)域的主要研究方向。本章中首先對卷積神經(jīng)網(wǎng)絡(luò)的基本原理和結(jié)構(gòu)進(jìn)行介紹;然后對本文研究行人重識別任務(wù)所涉及到的基礎(chǔ)網(wǎng)絡(luò)模型和模塊組成進(jìn)行概述;在此基礎(chǔ)上,進(jìn)一步介紹了行人重識別任務(wù)的目標(biāo)、訓(xùn)練和識別流程、常用數(shù)據(jù)集以及評價標(biāo)準(zhǔn)。2.1經(jīng)典卷積神經(jīng)網(wǎng)絡(luò)架構(gòu)隨著近些年來卷積神經(jīng)網(wǎng)絡(luò)在計(jì)算機(jī)視覺領(lǐng)域的發(fā)展,誕生了很多理論研究成果和效果非常好的網(wǎng)絡(luò)模型。最先進(jìn)入人們視野的是AlexKrizhevsky及其團(tuán)隊(duì)在2012年ILSVR競賽中使用的AlexNet[42],這是首次在大賽中使用卷積神經(jīng)網(wǎng)絡(luò)模型并且以領(lǐng)先第二名20多個百分點(diǎn)的優(yōu)勢奪冠,隨后掀起了一場卷積神經(jīng)網(wǎng)絡(luò)的浪潮。后來,也有很多優(yōu)秀的卷積神經(jīng)網(wǎng)絡(luò)模型被提出,2014年,Google團(tuán)隊(duì)在當(dāng)年的大賽中提出GoogLeNet[43]。但是隨著網(wǎng)絡(luò)層數(shù)的加深,也伴隨著梯度消失,深層網(wǎng)絡(luò)效果變差等問題。針對上面的問題何愷明等人提出ResNet[45],使用該網(wǎng)絡(luò)模型在ILSVR競賽上面取得了分類、檢測、定位等等多個項(xiàng)目的冠軍。本文在GoogLeNet和ResNet這兩個網(wǎng)絡(luò)模型的基礎(chǔ)上進(jìn)行行人重識別網(wǎng)絡(luò)模型的研究。2.1.1AlexNet模型圖2.1AlexNet模型輸入卷積層1卷積層2卷積層3卷積層4卷積層5全連接層1全連接層2全連接層3
【參考文獻(xiàn)】:
期刊論文
[1]基于多尺度生成對抗網(wǎng)絡(luò)的遮擋行人重識別方法[J]. 楊婉香,嚴(yán)嚴(yán),陳思,張小康,王菡子. 軟件學(xué)報. 2020(07)
[2]基于深度學(xué)習(xí)的行人重識別研究進(jìn)展[J]. 羅浩,姜偉,范星,張思朋. 自動化學(xué)報. 2019(11)
[3]基于卷積神經(jīng)網(wǎng)絡(luò)判別特征學(xué)習(xí)的行人重識別[J]. 陳兵,查宇飛,李運(yùn)強(qiáng),張勝杰,張園強(qiáng),庫濤. 光學(xué)學(xué)報. 2018(07)
[4]行人重識別研究綜述[J]. 宋婉茹,趙晴晴,陳昌紅,干宗良,劉峰. 智能系統(tǒng)學(xué)報. 2017(06)
[5]基于字典學(xué)習(xí)和Fisher判別稀疏表示的行人重識別方法[J]. 張見威,林文釗,邱隆慶. 華南理工大學(xué)學(xué)報(自然科學(xué)版). 2017(07)
[6]融合底層和中層字典特征的行人重識別[J]. 王麗. 中國光學(xué). 2016(05)
[7]基于HSV模型和特征點(diǎn)匹配的行人重識別算法[J]. 彭志勇,常發(fā)亮,劉洪彬,別秀德. 光電子·激光. 2015(08)
[8]基于空間顏色特征的行人重識別方法[J]. 張華. 華中科技大學(xué)學(xué)報(自然科學(xué)版). 2013(S2)
博士論文
[1]基于度量學(xué)習(xí)的行人重識別方法研究[D]. 王金.華中科技大學(xué) 2017
[2]面向監(jiān)控視頻的行人重識別技術(shù)研究[D]. 王亦民.武漢大學(xué) 2014
本文編號:3402612
【文章來源】:蘭州交通大學(xué)甘肅省
【文章頁數(shù)】:63 頁
【學(xué)位級別】:碩士
【部分圖文】:
行人重識別流程圖
W祭詞迪值!靶腥酥厥侗稹蔽侍庠?005年才被正式命名。下一年,機(jī)器視覺頂會CVPR才把行人重識別看待為一個單獨(dú)的任務(wù)。2007年,第一個行人重識別數(shù)據(jù)集VIPeR公開,為該問題的研究提供了一個公平可靠的度量標(biāo)準(zhǔn)。2010年,開始著力研究基于視頻的行人重識別,選取同一個行人的多個視頻幀來作為輸入來進(jìn)行目標(biāo)的識別。2012年,有關(guān)行人重識別的綜述和專著在ECCV召開的專題的研討會后分別被發(fā)表。隨著神經(jīng)網(wǎng)絡(luò)在ImageNet數(shù)據(jù)集上面的優(yōu)越表現(xiàn),卷積神經(jīng)網(wǎng)絡(luò)才開始被逐漸引入行人重識別任務(wù),大量的實(shí)驗(yàn)說明,基于卷積神經(jīng)網(wǎng)絡(luò)圖1.2行人重識別的發(fā)展
基于卷積神經(jīng)網(wǎng)絡(luò)的視頻行人重識別算法研究-10-2相關(guān)技術(shù)概述卷積神經(jīng)網(wǎng)絡(luò)的快速發(fā)展使得很多研究課題注入新的活力,尤其在被引入到行人重識別任務(wù)后,基于卷積神經(jīng)網(wǎng)絡(luò)的模型體現(xiàn)出了手工特征無法比擬的優(yōu)勢,并且逐漸成為行人重識別領(lǐng)域的主要研究方向。本章中首先對卷積神經(jīng)網(wǎng)絡(luò)的基本原理和結(jié)構(gòu)進(jìn)行介紹;然后對本文研究行人重識別任務(wù)所涉及到的基礎(chǔ)網(wǎng)絡(luò)模型和模塊組成進(jìn)行概述;在此基礎(chǔ)上,進(jìn)一步介紹了行人重識別任務(wù)的目標(biāo)、訓(xùn)練和識別流程、常用數(shù)據(jù)集以及評價標(biāo)準(zhǔn)。2.1經(jīng)典卷積神經(jīng)網(wǎng)絡(luò)架構(gòu)隨著近些年來卷積神經(jīng)網(wǎng)絡(luò)在計(jì)算機(jī)視覺領(lǐng)域的發(fā)展,誕生了很多理論研究成果和效果非常好的網(wǎng)絡(luò)模型。最先進(jìn)入人們視野的是AlexKrizhevsky及其團(tuán)隊(duì)在2012年ILSVR競賽中使用的AlexNet[42],這是首次在大賽中使用卷積神經(jīng)網(wǎng)絡(luò)模型并且以領(lǐng)先第二名20多個百分點(diǎn)的優(yōu)勢奪冠,隨后掀起了一場卷積神經(jīng)網(wǎng)絡(luò)的浪潮。后來,也有很多優(yōu)秀的卷積神經(jīng)網(wǎng)絡(luò)模型被提出,2014年,Google團(tuán)隊(duì)在當(dāng)年的大賽中提出GoogLeNet[43]。但是隨著網(wǎng)絡(luò)層數(shù)的加深,也伴隨著梯度消失,深層網(wǎng)絡(luò)效果變差等問題。針對上面的問題何愷明等人提出ResNet[45],使用該網(wǎng)絡(luò)模型在ILSVR競賽上面取得了分類、檢測、定位等等多個項(xiàng)目的冠軍。本文在GoogLeNet和ResNet這兩個網(wǎng)絡(luò)模型的基礎(chǔ)上進(jìn)行行人重識別網(wǎng)絡(luò)模型的研究。2.1.1AlexNet模型圖2.1AlexNet模型輸入卷積層1卷積層2卷積層3卷積層4卷積層5全連接層1全連接層2全連接層3
【參考文獻(xiàn)】:
期刊論文
[1]基于多尺度生成對抗網(wǎng)絡(luò)的遮擋行人重識別方法[J]. 楊婉香,嚴(yán)嚴(yán),陳思,張小康,王菡子. 軟件學(xué)報. 2020(07)
[2]基于深度學(xué)習(xí)的行人重識別研究進(jìn)展[J]. 羅浩,姜偉,范星,張思朋. 自動化學(xué)報. 2019(11)
[3]基于卷積神經(jīng)網(wǎng)絡(luò)判別特征學(xué)習(xí)的行人重識別[J]. 陳兵,查宇飛,李運(yùn)強(qiáng),張勝杰,張園強(qiáng),庫濤. 光學(xué)學(xué)報. 2018(07)
[4]行人重識別研究綜述[J]. 宋婉茹,趙晴晴,陳昌紅,干宗良,劉峰. 智能系統(tǒng)學(xué)報. 2017(06)
[5]基于字典學(xué)習(xí)和Fisher判別稀疏表示的行人重識別方法[J]. 張見威,林文釗,邱隆慶. 華南理工大學(xué)學(xué)報(自然科學(xué)版). 2017(07)
[6]融合底層和中層字典特征的行人重識別[J]. 王麗. 中國光學(xué). 2016(05)
[7]基于HSV模型和特征點(diǎn)匹配的行人重識別算法[J]. 彭志勇,常發(fā)亮,劉洪彬,別秀德. 光電子·激光. 2015(08)
[8]基于空間顏色特征的行人重識別方法[J]. 張華. 華中科技大學(xué)學(xué)報(自然科學(xué)版). 2013(S2)
博士論文
[1]基于度量學(xué)習(xí)的行人重識別方法研究[D]. 王金.華中科技大學(xué) 2017
[2]面向監(jiān)控視頻的行人重識別技術(shù)研究[D]. 王亦民.武漢大學(xué) 2014
本文編號:3402612
本文鏈接:http://www.sikaile.net/kejilunwen/zidonghuakongzhilunwen/3402612.html
最近更新
教材專著