基于深度學習的行人姿態(tài)估計與重識別算法研究
發(fā)布時間:2022-12-04 19:04
隨著人工智能技術的快速發(fā)展和實際應用的巨大潛力,如何在監(jiān)控視頻中實現(xiàn)對行人的姿態(tài)估計和重識別,及時發(fā)現(xiàn)和處理行人的異常危險行為并實現(xiàn)對目標人物的檢索追蹤,從而提高公共場所的安全預警能力,這已經(jīng)成為了工業(yè)界和學術界熱門的研究課題之一。傳統(tǒng)的以及現(xiàn)有主流的基于深度學習的行人姿態(tài)估計算法,在應用到實際監(jiān)控視頻場合中時,都不能滿足任務處理的實時性和準確性要求。另外,行人重識別算法更多關注是在對單幀圖像以及圖像全局特征的研究,應用到實際監(jiān)控視頻中時,不能有效的利用視頻序列中包含的信息和應對由行人移動造成的模糊等背景噪聲干擾。針對這些問題,本論文重點研究了基于深度學習的行人姿態(tài)估計與重識別算法。針對行人姿態(tài)估計的研究,本論文提出了基于多任務的行人姿態(tài)估計算法,首先將輕量級的基于YOLOv3的行人目標檢測網(wǎng)絡和基于特征金字塔的行人關鍵點檢測網(wǎng)絡合并到一個端到端訓練和預測的網(wǎng)絡中,實現(xiàn)多任務同時檢測,提高了算法運行速度;然后利用檢測到的行人目標邊界框與關鍵點,通過姿態(tài)殘差網(wǎng)絡結構學習人體姿態(tài),解決了由于多人邊界框重疊導致關鍵點分類到個體實例上時出現(xiàn)的模糊性問題,能夠對關鍵點進行準確的聚類分組,提高了行...
【文章頁數(shù)】:92 頁
【學位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
符號對照表
縮略語對照表
第一章 緒論
1.1 研究背景和意義
1.2 發(fā)展歷史和研究現(xiàn)狀
1.2.1 行人姿態(tài)估計技術的發(fā)展及現(xiàn)狀
1.2.2 行人重識別技術的發(fā)展及現(xiàn)狀
1.3 主要研究內(nèi)容和章節(jié)安排
第二章 基于深度學習的行人姿態(tài)估計與重識別相關理論
2.1 深度學習基礎理論
2.1.1 深度學習的基本概念
2.1.2 全卷積神經(jīng)網(wǎng)絡
2.1.3 特征金字塔網(wǎng)絡
2.2 目標檢測網(wǎng)絡原理
2.2.1 基本概念
2.2.2 YOLO目標檢測算法
2.3 人體姿態(tài)估計網(wǎng)絡原理
2.4 行人重識別系統(tǒng)流程
2.5 行人姿態(tài)估計與重識別數(shù)據(jù)集
2.5.1 COCO數(shù)據(jù)集
2.5.2 PRID 2011 數(shù)據(jù)集
2.5.3 iLIDS-VID數(shù)據(jù)集
2.6 行人姿態(tài)估計與重識別評價方法
2.6.1 OKS(Object Keypoint Similarity)
2.6.2 AP(Average Precision)
2.7 本章小結
第三章 基于多任務的行人姿態(tài)估計算法
3.1 多任務姿態(tài)估計網(wǎng)絡結構
3.1.1 網(wǎng)絡整體結構
3.1.2 主干網(wǎng)絡
3.2 基于特征金字塔的關鍵點檢測子網(wǎng)絡
3.3 基于YOLOv3的行人目標檢測子網(wǎng)絡
3.4 姿態(tài)殘差網(wǎng)絡
3.5 網(wǎng)絡訓練與預測
3.5.1 網(wǎng)絡訓練策略
3.5.2 關鍵點數(shù)據(jù)標簽制作
3.5.3 關鍵點檢測子網(wǎng)絡訓練策略
3.5.4 行人目標檢測子網(wǎng)絡訓練策略
3.5.5 姿態(tài)殘差網(wǎng)絡訓練策略
3.5.6 多任務姿態(tài)估計網(wǎng)絡預測流程
3.6 手勢姿態(tài)估計
3.7 實驗結果與性能分析
3.7.1 實驗設置
3.7.2 多人姿態(tài)估計結果與性能分析
3.7.3 姿態(tài)和手勢聯(lián)合應用
3.8 本章小結
第四章 基于多維度局部特征聚合的行人重識別算法
4.1 基于多維度局部特征聚合的行人重識別網(wǎng)絡結構
4.1.1 網(wǎng)絡整體結構
4.1.2 基于多任務的區(qū)域建議網(wǎng)絡
4.1.3 圖像局部特征生成網(wǎng)絡
4.1.4 圖像局部質量評估網(wǎng)絡
4.1.5 特征聚合單元
4.2 行人重識別網(wǎng)絡訓練學習方法
4.2.1 表征學習
4.2.2 度量學習
4.3 網(wǎng)絡訓練
4.4 實驗結果與性能分析
4.4.1 實驗設置
4.4.2 實驗結果與性能分析
4.5 本章小結
第五章 總結與展望
5.1 本論文工作總結
5.2 研究展望
參考文獻
致謝
作者簡介
【參考文獻】:
期刊論文
[1]基于不變矩特征和神經(jīng)網(wǎng)絡的步態(tài)識別[J]. 謝林海,劉相濱. 微計算機信息. 2007(19)
本文編號:3708821
【文章頁數(shù)】:92 頁
【學位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
符號對照表
縮略語對照表
第一章 緒論
1.1 研究背景和意義
1.2 發(fā)展歷史和研究現(xiàn)狀
1.2.1 行人姿態(tài)估計技術的發(fā)展及現(xiàn)狀
1.2.2 行人重識別技術的發(fā)展及現(xiàn)狀
1.3 主要研究內(nèi)容和章節(jié)安排
第二章 基于深度學習的行人姿態(tài)估計與重識別相關理論
2.1 深度學習基礎理論
2.1.1 深度學習的基本概念
2.1.2 全卷積神經(jīng)網(wǎng)絡
2.1.3 特征金字塔網(wǎng)絡
2.2 目標檢測網(wǎng)絡原理
2.2.1 基本概念
2.2.2 YOLO目標檢測算法
2.3 人體姿態(tài)估計網(wǎng)絡原理
2.4 行人重識別系統(tǒng)流程
2.5 行人姿態(tài)估計與重識別數(shù)據(jù)集
2.5.1 COCO數(shù)據(jù)集
2.5.2 PRID 2011 數(shù)據(jù)集
2.5.3 iLIDS-VID數(shù)據(jù)集
2.6 行人姿態(tài)估計與重識別評價方法
2.6.1 OKS(Object Keypoint Similarity)
2.6.2 AP(Average Precision)
2.7 本章小結
第三章 基于多任務的行人姿態(tài)估計算法
3.1 多任務姿態(tài)估計網(wǎng)絡結構
3.1.1 網(wǎng)絡整體結構
3.1.2 主干網(wǎng)絡
3.2 基于特征金字塔的關鍵點檢測子網(wǎng)絡
3.3 基于YOLOv3的行人目標檢測子網(wǎng)絡
3.4 姿態(tài)殘差網(wǎng)絡
3.5 網(wǎng)絡訓練與預測
3.5.1 網(wǎng)絡訓練策略
3.5.2 關鍵點數(shù)據(jù)標簽制作
3.5.3 關鍵點檢測子網(wǎng)絡訓練策略
3.5.4 行人目標檢測子網(wǎng)絡訓練策略
3.5.5 姿態(tài)殘差網(wǎng)絡訓練策略
3.5.6 多任務姿態(tài)估計網(wǎng)絡預測流程
3.6 手勢姿態(tài)估計
3.7 實驗結果與性能分析
3.7.1 實驗設置
3.7.2 多人姿態(tài)估計結果與性能分析
3.7.3 姿態(tài)和手勢聯(lián)合應用
3.8 本章小結
第四章 基于多維度局部特征聚合的行人重識別算法
4.1 基于多維度局部特征聚合的行人重識別網(wǎng)絡結構
4.1.1 網(wǎng)絡整體結構
4.1.2 基于多任務的區(qū)域建議網(wǎng)絡
4.1.3 圖像局部特征生成網(wǎng)絡
4.1.4 圖像局部質量評估網(wǎng)絡
4.1.5 特征聚合單元
4.2 行人重識別網(wǎng)絡訓練學習方法
4.2.1 表征學習
4.2.2 度量學習
4.3 網(wǎng)絡訓練
4.4 實驗結果與性能分析
4.4.1 實驗設置
4.4.2 實驗結果與性能分析
4.5 本章小結
第五章 總結與展望
5.1 本論文工作總結
5.2 研究展望
參考文獻
致謝
作者簡介
【參考文獻】:
期刊論文
[1]基于不變矩特征和神經(jīng)網(wǎng)絡的步態(tài)識別[J]. 謝林海,劉相濱. 微計算機信息. 2007(19)
本文編號:3708821
本文鏈接:http://www.sikaile.net/kejilunwen/zidonghuakongzhilunwen/3708821.html
最近更新
教材專著