基于運動學描述子和深度學習的行為識別新框架
發(fā)布時間:2021-05-08 01:19
視頻序列中的人體行為識別作為機器學習領域的熱點和難點之一,已經(jīng)引起了認知科學、生物學以及計算機科學等各個學科的廣泛關注,同時,已成功應用于視頻監(jiān)控、零售分析和醫(yī)療診斷等各個行業(yè)。目前,簡單場景和攝像機固定條件下的行為識別已經(jīng)取得了相當好的性能。然而,對于從電影、電視和其他媒體平臺上收集得到的真實視頻,識別準確率還遠遠沒有達到期望的要求。這是因為真實場景下的行為視頻中通常存在著巨大的類內差異性和類間相似性,以及大量復雜背景。因此,如何設計有效的特征表示對于視頻中的行為識別是至關重要的。本文在充分分析和學習現(xiàn)有方法的基礎上,構建了一種基于運動學描述子和深度學習的行為識別新框架。(1)通過對視頻光流場的動力學特性進行探索,構建了一組更具判別性的運動學場,包括:光流時空梯度場、散度場、旋度場、切變場、對稱場以及非對稱場。在此基礎上,通過探索特征與其鄰域信息之間的相關性,構建了一個新的運動學自相關描述子。該描述子能夠很好地獲取光流場的時空幾何特性,具有較強的運動細節(jié)及運動空間描述能力。同時,通過探索底層運動學特征之間的關系,構建了一個新的運動學協(xié)方差描述子。該描述子具有很好的緊湊性和判別性,在實...
【文章來源】:西安電子科技大學陜西省 211工程院校 教育部直屬院校
【文章頁數(shù)】:69 頁
【學位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
符號對照表
縮略語對照表
第一章 緒論
1.1 研究背景及意義
1.2 國內外研究現(xiàn)狀
1.3 論文主要研究內容及章節(jié)安排
第二章 人體行為識別相關工作介紹
2.1 引言
2.2 基于人工特征的行為識別方法
2.2.1 靜態(tài)人工特征
2.2.2 動態(tài)人工特征
2.3 基于深度學習的行為識別方法
2.3.1 雙流卷積網(wǎng)絡
2.3.2 3D卷積網(wǎng)絡
2.4 本章小結
第三章 一種基于運動學描述子的人體行為識別方法
3.1 引言
3.2 運動學場提取
3.2.1 稠密光流提取
3.2.2 光流時空梯度場提取
3.2.3 散度場和旋度場提取
3.2.4 切變場提取
3.2.5 對稱場和非對稱場提取
3.3 構建運動學自相關描述子
3.4 構建運動學協(xié)方差描述子
3.4.1 底層特征提取
3.4.2 構建運動學協(xié)方差描述子
3.5 運動學描述子用于行為識別
3.5.1 Fisher編碼
3.5.2 主成分分析
3.5.3 人體行為識別
3.6 本章小結
第四章 基于運動學描述子和深度學習的行為識別新框架
4.1 引言
4.2 深度殘差網(wǎng)絡
4.2.1 殘差模塊
4.2.2 深度殘差網(wǎng)絡的結構與訓練方式
4.3 融合注意力機制的深度殘差網(wǎng)絡
4.3.1 多通道軟注意力機制
4.3.2 融合注意力機制的深度殘差網(wǎng)絡
4.4 構建深度靜態(tài)描述子
4.5 基于運動學描述子和深度學習的行為識別新框架
4.6 實驗與分析
4.6.1 數(shù)據(jù)庫介紹
4.6.2 參數(shù)設置與數(shù)據(jù)庫劃分
4.6.3 基于人工運動學描述子的行為識別實驗
4.6.4 正則項參數(shù)選擇實驗
4.6.5 基于深度靜態(tài)描述子的行為識別實驗
4.6.6 基于新框架的行為識別實驗
4.6.7 特征可視化
4.7 本章小結
第五章 全文總結與展望
5.1 全文總結
5.2 未來展望
參考文獻
致謝
作者簡介
本文編號:3174396
【文章來源】:西安電子科技大學陜西省 211工程院校 教育部直屬院校
【文章頁數(shù)】:69 頁
【學位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
符號對照表
縮略語對照表
第一章 緒論
1.1 研究背景及意義
1.2 國內外研究現(xiàn)狀
1.3 論文主要研究內容及章節(jié)安排
第二章 人體行為識別相關工作介紹
2.1 引言
2.2 基于人工特征的行為識別方法
2.2.1 靜態(tài)人工特征
2.2.2 動態(tài)人工特征
2.3 基于深度學習的行為識別方法
2.3.1 雙流卷積網(wǎng)絡
2.3.2 3D卷積網(wǎng)絡
2.4 本章小結
第三章 一種基于運動學描述子的人體行為識別方法
3.1 引言
3.2 運動學場提取
3.2.1 稠密光流提取
3.2.2 光流時空梯度場提取
3.2.3 散度場和旋度場提取
3.2.4 切變場提取
3.2.5 對稱場和非對稱場提取
3.3 構建運動學自相關描述子
3.4 構建運動學協(xié)方差描述子
3.4.1 底層特征提取
3.4.2 構建運動學協(xié)方差描述子
3.5 運動學描述子用于行為識別
3.5.1 Fisher編碼
3.5.2 主成分分析
3.5.3 人體行為識別
3.6 本章小結
第四章 基于運動學描述子和深度學習的行為識別新框架
4.1 引言
4.2 深度殘差網(wǎng)絡
4.2.1 殘差模塊
4.2.2 深度殘差網(wǎng)絡的結構與訓練方式
4.3 融合注意力機制的深度殘差網(wǎng)絡
4.3.1 多通道軟注意力機制
4.3.2 融合注意力機制的深度殘差網(wǎng)絡
4.4 構建深度靜態(tài)描述子
4.5 基于運動學描述子和深度學習的行為識別新框架
4.6 實驗與分析
4.6.1 數(shù)據(jù)庫介紹
4.6.2 參數(shù)設置與數(shù)據(jù)庫劃分
4.6.3 基于人工運動學描述子的行為識別實驗
4.6.4 正則項參數(shù)選擇實驗
4.6.5 基于深度靜態(tài)描述子的行為識別實驗
4.6.6 基于新框架的行為識別實驗
4.6.7 特征可視化
4.7 本章小結
第五章 全文總結與展望
5.1 全文總結
5.2 未來展望
參考文獻
致謝
作者簡介
本文編號:3174396
本文鏈接:http://www.sikaile.net/kejilunwen/zidonghuakongzhilunwen/3174396.html
最近更新
教材專著