基于深度學(xué)習(xí)的監(jiān)控行人檢測
發(fā)布時間:2023-11-04 13:19
行人檢測是計算機視覺與模式識別方向一個重要的研究領(lǐng)域,在智能交通、智能視頻監(jiān)控、無人駕駛以及智能機器人等領(lǐng)域有著巨大的應(yīng)用前景。例如視頻監(jiān)控中關(guān)注的行人的運動軌跡和行為,要實現(xiàn)對行人跟蹤和行為分析,首先要做的就是檢測出視頻中的行人。傳統(tǒng)的行人檢測解決方案主要基于統(tǒng)計分類的方法,通過手工設(shè)計類內(nèi)差異小、類間差異大的特征并訓(xùn)練分類器,從而將檢測問題轉(zhuǎn)化為人與非人的二分類問題,目前常用特征包括梯度直方圖(HOG)和尺度不變特征轉(zhuǎn)換(SIFT)。但是通常這些手工設(shè)計的特征并不具備強大的表征能力,在魯棒性上有一定的局限性,并且設(shè)計這些特征需要扎實的專業(yè)基礎(chǔ)。近幾年來,深度學(xué)習(xí)(Deep Learning,簡稱DL)被廣泛的應(yīng)用于計算機視覺相關(guān)問題中,并取得了巨大的成功。DL利用卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,簡稱CNN)自動學(xué)習(xí)出目標(biāo)的特征,并且這種特征具備很強的魯棒性。本文將基于深度學(xué)習(xí)算法進(jìn)行行人檢測算法的研究,旨在提高對小尺度行人的檢測精度。本文主要的創(chuàng)新點如下:(1)利用CNN的結(jié)構(gòu)特點,對上下文信息進(jìn)行建模,實現(xiàn)尺度自適應(yīng)上下文信息的行人檢測模型...
【文章頁數(shù)】:81 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
abstract
第一章 緒論
1.1 課題背景及意義
1.2 國內(nèi)外研究現(xiàn)狀
1.3 行人檢測的技術(shù)難點
1.4 本文主要內(nèi)容
1.5 本文章節(jié)安排
第二章 深度學(xué)習(xí)算法與行人檢測概述
2.1 深度學(xué)習(xí)理論基礎(chǔ)
2.1.1 深度學(xué)習(xí)概述
2.1.2 卷積神經(jīng)網(wǎng)絡(luò)
2.1.3 基于深度學(xué)習(xí)的目標(biāo)檢測算法
2.1.4 深度學(xué)習(xí)主流框架
2.2 行人檢測關(guān)鍵技術(shù)介紹
2.2.1 行人檢測算法常用的數(shù)據(jù)集
2.2.2 行人檢測算法的評價指標(biāo)
2.2.3 傳統(tǒng)行人特征檢測子
2.2.4 基于深度學(xué)習(xí)的行人檢測算法
2.3 本章小結(jié)
第三章 基于尺度自適應(yīng)上下文的行人檢測建模
3.1 引言
3.2 圖像金字塔
3.2.1 圖像金字塔的原理
3.2.2 稀疏圖像金字塔
3.3 基于k-medoids模板聚類
3.3.1 k-medoids基本原理
3.3.2 k-medoids模板聚類
3.4 尺度自適應(yīng)的上下文信息
3.4.1 上下文信息
3.4.2 CNN感受野的概念
3.4.3 尺度自適應(yīng)的上下文信息建模
3.5 實驗結(jié)果
3.5.1 上下文信息對實驗結(jié)果的影響
3.5.2 模板選取對實驗結(jié)果的影響
3.5.3 圖像金字塔對實驗結(jié)果的影響
3.5.4 多模型融合
3.6 本章小結(jié)
第四章 基于特征金字塔的多尺度行人檢測算法
4.1 基于端到端的多分辨率特征行人檢測模型
4.1.1 端到端行人檢測網(wǎng)絡(luò)設(shè)計
4.1.2 實驗結(jié)果及分析
4.2 特征金字塔
4.2.1 CNN特征可視化
4.2.2 反卷積
4.2.3 特征融合
4.2.4 實驗結(jié)果及分析
4.3 難分樣本挖掘和數(shù)據(jù)平衡
4.3.1 難分樣本挖掘算法
4.3.2 數(shù)據(jù)平衡
4.3.3 實驗結(jié)果及分析
4.4 基于軟判決的非極大值抑制
4.4.1 非極大值抑制
4.4.2 基于軟判決的非極大值抑制
4.5 實驗結(jié)果
4.6 本章小結(jié)
第五章 總結(jié)與展望
5.1 全文總結(jié)
5.2 未來展望
參考文獻(xiàn)
致謝
攻讀學(xué)位期間發(fā)表的學(xué)術(shù)論文
攻讀學(xué)位期間參與的項目
本文編號:3860383
【文章頁數(shù)】:81 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
abstract
第一章 緒論
1.1 課題背景及意義
1.2 國內(nèi)外研究現(xiàn)狀
1.3 行人檢測的技術(shù)難點
1.4 本文主要內(nèi)容
1.5 本文章節(jié)安排
第二章 深度學(xué)習(xí)算法與行人檢測概述
2.1 深度學(xué)習(xí)理論基礎(chǔ)
2.1.1 深度學(xué)習(xí)概述
2.1.2 卷積神經(jīng)網(wǎng)絡(luò)
2.1.3 基于深度學(xué)習(xí)的目標(biāo)檢測算法
2.1.4 深度學(xué)習(xí)主流框架
2.2 行人檢測關(guān)鍵技術(shù)介紹
2.2.1 行人檢測算法常用的數(shù)據(jù)集
2.2.2 行人檢測算法的評價指標(biāo)
2.2.3 傳統(tǒng)行人特征檢測子
2.2.4 基于深度學(xué)習(xí)的行人檢測算法
2.3 本章小結(jié)
第三章 基于尺度自適應(yīng)上下文的行人檢測建模
3.1 引言
3.2 圖像金字塔
3.2.1 圖像金字塔的原理
3.2.2 稀疏圖像金字塔
3.3 基于k-medoids模板聚類
3.3.1 k-medoids基本原理
3.3.2 k-medoids模板聚類
3.4 尺度自適應(yīng)的上下文信息
3.4.1 上下文信息
3.4.2 CNN感受野的概念
3.4.3 尺度自適應(yīng)的上下文信息建模
3.5 實驗結(jié)果
3.5.1 上下文信息對實驗結(jié)果的影響
3.5.2 模板選取對實驗結(jié)果的影響
3.5.3 圖像金字塔對實驗結(jié)果的影響
3.5.4 多模型融合
3.6 本章小結(jié)
第四章 基于特征金字塔的多尺度行人檢測算法
4.1 基于端到端的多分辨率特征行人檢測模型
4.1.1 端到端行人檢測網(wǎng)絡(luò)設(shè)計
4.1.2 實驗結(jié)果及分析
4.2 特征金字塔
4.2.1 CNN特征可視化
4.2.2 反卷積
4.2.3 特征融合
4.2.4 實驗結(jié)果及分析
4.3 難分樣本挖掘和數(shù)據(jù)平衡
4.3.1 難分樣本挖掘算法
4.3.2 數(shù)據(jù)平衡
4.3.3 實驗結(jié)果及分析
4.4 基于軟判決的非極大值抑制
4.4.1 非極大值抑制
4.4.2 基于軟判決的非極大值抑制
4.5 實驗結(jié)果
4.6 本章小結(jié)
第五章 總結(jié)與展望
5.1 全文總結(jié)
5.2 未來展望
參考文獻(xiàn)
致謝
攻讀學(xué)位期間發(fā)表的學(xué)術(shù)論文
攻讀學(xué)位期間參與的項目
本文編號:3860383
本文鏈接:http://www.sikaile.net/kejilunwen/zidonghuakongzhilunwen/3860383.html
最近更新
教材專著