基于深度學(xué)習(xí)的課堂低頭抬頭行為狀態(tài)識別與應(yīng)用
發(fā)布時間:2021-02-10 03:41
近年來,基于卷積神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)算法在文本處理、語音識別、圖像視頻分析、計(jì)算機(jī)視覺等多個領(lǐng)域都獲得了巨大的成功,特別是在圖像識別領(lǐng)域當(dāng)中,基于深度學(xué)習(xí)的圖像分類與檢測技術(shù)在大量具體、專業(yè)的研究場景下開始發(fā)揮著重要的作用。例如,相關(guān)研究者在植物學(xué)領(lǐng)域通過區(qū)域選取和特征學(xué)習(xí)來實(shí)現(xiàn)花卉分類以及在各種自動安防、智能交通、自動駕駛等領(lǐng)域?qū)囕v和行人進(jìn)行檢測等。而利用深度學(xué)習(xí)技術(shù)在視頻場景當(dāng)中對人體行為進(jìn)行識別是當(dāng)前計(jì)算機(jī)視覺領(lǐng)域的研究熱點(diǎn)之一,近年來得到了學(xué)術(shù)界及工程界的廣泛重視,人體行為識別相關(guān)技術(shù)在智能監(jiān)控、人機(jī)交互、虛擬現(xiàn)實(shí)和基于內(nèi)容的視頻檢索與解說等方面有著廣泛的應(yīng)用前景和潛在的經(jīng)濟(jì)價值。同時,在課堂場景中,識別學(xué)生的課堂行為對學(xué)生的學(xué)習(xí)狀態(tài)、學(xué)習(xí)質(zhì)量以及教師教學(xué)效果的評價具有重要的參考意義。本文將深度學(xué)習(xí)技術(shù)應(yīng)用到大學(xué)課堂場景當(dāng)中,從學(xué)生低頭抬頭的角度出發(fā),對學(xué)生進(jìn)行檢測并識別其行為狀態(tài),本文主要的工作包括如下幾個方面:首先對國內(nèi)外的深度學(xué)習(xí)相關(guān)技術(shù)以及行為識別相關(guān)理論進(jìn)行梳理,結(jié)合大學(xué)課堂特定場景下的特點(diǎn)以及各種算法的優(yōu)劣,提出將深度學(xué)習(xí)技術(shù)應(yīng)用到大學(xué)課堂場景當(dāng)中進(jìn)行行為識別,并通...
【文章來源】:華中師范大學(xué)湖北省 211工程院校 教育部直屬院校
【文章頁數(shù)】:58 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖2.1多層感知器的前向傳播??如圖2.1展現(xiàn)的是三層的人工神經(jīng)網(wǎng)絡(luò),從第一層到第三層依次是輸入層、??
F6:??懸=心^?=?51學(xué)習(xí)率和步長更新權(quán)重和偏置。??函數(shù)??際應(yīng)用當(dāng)中,不能通過簡單的線性表達(dá)式去解決非線性問作相當(dāng)于是一個矩陣相乘的過程,等同于一種線性操作,(Activation?Functions)來提高網(wǎng)絡(luò)的非線性性表示。對于去學(xué)習(xí)、理解非線性以及非常復(fù)雜的函數(shù)來說,激活函數(shù)它使神經(jīng)網(wǎng)絡(luò)模型具有非線性特性。如圖2.2所示,在神經(jīng)通過加權(quán)以及求和后,再通過一個激活函數(shù)進(jìn)行非線性映射激活函數(shù)的每層操作都相當(dāng)于進(jìn)行矩陣相乘,通過在每層輸增加神經(jīng)網(wǎng)絡(luò)模型的非線性,使深度網(wǎng)絡(luò)模型擁有強(qiáng)大的表在神經(jīng)網(wǎng)絡(luò)當(dāng)中經(jīng)常見到的三個激活函數(shù)。??輸入??
?4?6??圖2.3?Sigmoid函數(shù)圖像??由于Sigmoid激活函數(shù)在兩端的梯度幾乎為0,容易在訓(xùn)練的時候產(chǎn)生梯度消??失的問題,而且輸出結(jié)果不是以零為中心,在經(jīng)過多層訓(xùn)練之后數(shù)據(jù)分布發(fā)生偏??移,以致不能順利的對網(wǎng)絡(luò)進(jìn)行訓(xùn)練??(2)?Tanh?函數(shù)??Tanh函數(shù)是雙曲正切函數(shù),屬于雙曲函數(shù)當(dāng)中的一個。在數(shù)學(xué)這門學(xué)科當(dāng)中,??該函數(shù)可以通過基本雙曲函數(shù)中的雙曲余弦和雙曲正弦函數(shù)推導(dǎo)出來。公式如下??辦)=蓋?(2.1〇)??函數(shù)圖像如下??;?;??:.?_???j?1?yC?j?i????一?2?—?J?JT?1?2?x??Jr???——??—???-?:?*??f??圖2.4?Tanh函數(shù)圖像??比起Sigmoid函數(shù),Tanh函數(shù)首先速度更快,所以在實(shí)際應(yīng)用中更傾向于被??使用,然而以Tanh函數(shù)作為激活函數(shù)同樣會使模型訓(xùn)練時出現(xiàn)梯度消失的問題。??(3)?ReLU?函數(shù)??12??
【參考文獻(xiàn)】:
期刊論文
[1]論YOLO算法在機(jī)器視覺中應(yīng)用原理[J]. 李茂暉,吳傳平,鮑艷,房卓群. 教育現(xiàn)代化. 2018(41)
[2]基于YOLO v2的蓮蓬快速識別研究[J]. 黃小杭,梁智豪,何子俊,黃晨華,李湘勤. 現(xiàn)代農(nóng)業(yè)科技. 2018(13)
[3]基于改進(jìn)Faster R-CNN識別深度視頻圖像哺乳母豬姿態(tài)[J]. 薛月菊,朱勛沐,鄭嬋,毛亮,楊阿慶,涂淑琴,黃寧,楊曉帆,陳鵬飛,張南峰. 農(nóng)業(yè)工程學(xué)報(bào). 2018(09)
[4]基于Faster R-CNN的人體行為檢測研究[J]. 莫宏偉,汪海波. 智能系統(tǒng)學(xué)報(bào). 2018(06)
[5]深度學(xué)習(xí)及其在目標(biāo)和行為識別中的新進(jìn)展[J]. 鄭胤,陳權(quán)崎,章毓晉. 中國圖象圖形學(xué)報(bào). 2014(02)
[6]深度學(xué)習(xí)研究綜述[J]. 孫志軍,薛磊,許陽明,王正. 計(jì)算機(jī)應(yīng)用研究. 2012(08)
[7]基于單張靜態(tài)圖像的人體行為識別方法綜述[J]. 姜夕凱,蘇松志,李紹滋,成運(yùn). 漳州師范學(xué)院學(xué)報(bào)(自然科學(xué)版). 2011(04)
[8]人工神經(jīng)網(wǎng)絡(luò)研究現(xiàn)狀及其展望[J]. 朱大奇. 江南大學(xué)學(xué)報(bào). 2004(01)
碩士論文
[1]基于三維加速度傳感器的人體行為識別[D]. 徐川龍.浙江工業(yè)大學(xué) 2013
本文編號:3026728
【文章來源】:華中師范大學(xué)湖北省 211工程院校 教育部直屬院校
【文章頁數(shù)】:58 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖2.1多層感知器的前向傳播??如圖2.1展現(xiàn)的是三層的人工神經(jīng)網(wǎng)絡(luò),從第一層到第三層依次是輸入層、??
F6:??懸=心^?=?51學(xué)習(xí)率和步長更新權(quán)重和偏置。??函數(shù)??際應(yīng)用當(dāng)中,不能通過簡單的線性表達(dá)式去解決非線性問作相當(dāng)于是一個矩陣相乘的過程,等同于一種線性操作,(Activation?Functions)來提高網(wǎng)絡(luò)的非線性性表示。對于去學(xué)習(xí)、理解非線性以及非常復(fù)雜的函數(shù)來說,激活函數(shù)它使神經(jīng)網(wǎng)絡(luò)模型具有非線性特性。如圖2.2所示,在神經(jīng)通過加權(quán)以及求和后,再通過一個激活函數(shù)進(jìn)行非線性映射激活函數(shù)的每層操作都相當(dāng)于進(jìn)行矩陣相乘,通過在每層輸增加神經(jīng)網(wǎng)絡(luò)模型的非線性,使深度網(wǎng)絡(luò)模型擁有強(qiáng)大的表在神經(jīng)網(wǎng)絡(luò)當(dāng)中經(jīng)常見到的三個激活函數(shù)。??輸入??
?4?6??圖2.3?Sigmoid函數(shù)圖像??由于Sigmoid激活函數(shù)在兩端的梯度幾乎為0,容易在訓(xùn)練的時候產(chǎn)生梯度消??失的問題,而且輸出結(jié)果不是以零為中心,在經(jīng)過多層訓(xùn)練之后數(shù)據(jù)分布發(fā)生偏??移,以致不能順利的對網(wǎng)絡(luò)進(jìn)行訓(xùn)練??(2)?Tanh?函數(shù)??Tanh函數(shù)是雙曲正切函數(shù),屬于雙曲函數(shù)當(dāng)中的一個。在數(shù)學(xué)這門學(xué)科當(dāng)中,??該函數(shù)可以通過基本雙曲函數(shù)中的雙曲余弦和雙曲正弦函數(shù)推導(dǎo)出來。公式如下??辦)=蓋?(2.1〇)??函數(shù)圖像如下??;?;??:.?_???j?1?yC?j?i????一?2?—?J?JT?1?2?x??Jr???——??—???-?:?*??f??圖2.4?Tanh函數(shù)圖像??比起Sigmoid函數(shù),Tanh函數(shù)首先速度更快,所以在實(shí)際應(yīng)用中更傾向于被??使用,然而以Tanh函數(shù)作為激活函數(shù)同樣會使模型訓(xùn)練時出現(xiàn)梯度消失的問題。??(3)?ReLU?函數(shù)??12??
【參考文獻(xiàn)】:
期刊論文
[1]論YOLO算法在機(jī)器視覺中應(yīng)用原理[J]. 李茂暉,吳傳平,鮑艷,房卓群. 教育現(xiàn)代化. 2018(41)
[2]基于YOLO v2的蓮蓬快速識別研究[J]. 黃小杭,梁智豪,何子俊,黃晨華,李湘勤. 現(xiàn)代農(nóng)業(yè)科技. 2018(13)
[3]基于改進(jìn)Faster R-CNN識別深度視頻圖像哺乳母豬姿態(tài)[J]. 薛月菊,朱勛沐,鄭嬋,毛亮,楊阿慶,涂淑琴,黃寧,楊曉帆,陳鵬飛,張南峰. 農(nóng)業(yè)工程學(xué)報(bào). 2018(09)
[4]基于Faster R-CNN的人體行為檢測研究[J]. 莫宏偉,汪海波. 智能系統(tǒng)學(xué)報(bào). 2018(06)
[5]深度學(xué)習(xí)及其在目標(biāo)和行為識別中的新進(jìn)展[J]. 鄭胤,陳權(quán)崎,章毓晉. 中國圖象圖形學(xué)報(bào). 2014(02)
[6]深度學(xué)習(xí)研究綜述[J]. 孫志軍,薛磊,許陽明,王正. 計(jì)算機(jī)應(yīng)用研究. 2012(08)
[7]基于單張靜態(tài)圖像的人體行為識別方法綜述[J]. 姜夕凱,蘇松志,李紹滋,成運(yùn). 漳州師范學(xué)院學(xué)報(bào)(自然科學(xué)版). 2011(04)
[8]人工神經(jīng)網(wǎng)絡(luò)研究現(xiàn)狀及其展望[J]. 朱大奇. 江南大學(xué)學(xué)報(bào). 2004(01)
碩士論文
[1]基于三維加速度傳感器的人體行為識別[D]. 徐川龍.浙江工業(yè)大學(xué) 2013
本文編號:3026728
本文鏈接:http://www.sikaile.net/kejilunwen/zidonghuakongzhilunwen/3026728.html
最近更新
教材專著