基于深度學(xué)習(xí)的監(jiān)控視頻中的異常事件檢測(cè)和對(duì)象識(shí)別
發(fā)布時(shí)間:2021-09-01 17:49
近年來,國(guó)內(nèi)物聯(lián)網(wǎng)概念和深度學(xué)習(xí)的興起使得人工智能開始滲透到生活的各個(gè)領(lǐng)域。而安防產(chǎn)業(yè),作為維護(hù)社會(huì)穩(wěn)定和人們?nèi)松戆踩闹匾侄?因人工智能的產(chǎn)業(yè)賦能而得到長(zhǎng)足的發(fā)展。為了持續(xù)推動(dòng)安防產(chǎn)業(yè)的發(fā)展,我國(guó)提出了平安城市的概念。建設(shè)平安城市的基礎(chǔ)是信息感知,構(gòu)建出全面立體的安防監(jiān)控網(wǎng)絡(luò)是必不可少的手段。因此視頻監(jiān)控技術(shù)得到越來越廣泛的應(yīng)用,大量的監(jiān)控設(shè)備部署在校園、街道和小區(qū)等公共場(chǎng)所,產(chǎn)生了海量的監(jiān)控視頻數(shù)據(jù)。然而傳統(tǒng)的視頻監(jiān)控技術(shù)多數(shù)只提供采集、存儲(chǔ)和回看功能,存在諸多弊端。當(dāng)下隨著人工智能的發(fā)展,如何智能地分析處理海量視頻數(shù)據(jù),從中提取出有用的信息,并對(duì)視頻中的目標(biāo)進(jìn)行識(shí)別,成為人工智能領(lǐng)域的熱點(diǎn)研究問題。本論文針對(duì)異常事件檢測(cè)、不同分辨率人臉識(shí)別和行人重識(shí)別等問題開展研究工作,主要有:(1)監(jiān)控視頻中的異常事件檢測(cè),比如打斗、追逐或人群聚集等事件;(2)監(jiān)控視頻中異;蛘呖梢尚腥说纳矸葑R(shí)別。深度學(xué)習(xí)在圖像識(shí)別,語(yǔ)音識(shí)別等領(lǐng)域取得巨大進(jìn)展,為監(jiān)控視頻的智能處理提供了契機(jī),本文以深度學(xué)習(xí)為工具,開展的研究工作和主要?jiǎng)?chuàng)新如下:1.對(duì)于監(jiān)控視頻中異常事件的檢測(cè)問題,提出了一種基于自適應(yīng)自編碼...
【文章來源】:中國(guó)科學(xué)技術(shù)大學(xué)安徽省 211工程院校 985工程院校
【文章頁(yè)數(shù)】:118 頁(yè)
【學(xué)位級(jí)別】:博士
【部分圖文】:
圖2.1神經(jīng)網(wǎng)絡(luò)示例??
隱含層中恢復(fù)原始輸入。為了有效地恢復(fù)原始數(shù)據(jù),并提取出有效的特征表達(dá),??需要針對(duì)不同的應(yīng)用場(chǎng)景對(duì)代價(jià)函數(shù)加入相應(yīng)的正則化項(xiàng)。其中編碼和解碼的??程如下:??V?=?10^2:?+?6i??(2.10)??i?=?wjf(y)?+?b2??中M代表輸入層到隱含層的連接權(quán)值,即編碼器的權(quán)值矩陣;奶代表隱含層??到輸出層的連接權(quán)值,即解碼器的權(quán)值矩陣;/(y)代表激活函數(shù),對(duì)隱含層的??出進(jìn)行非線性激活,使模型具有非線性表達(dá)能力,一般使用sigmoid或者Tanh??激活函數(shù)。自編碼器通常使用均方差代價(jià)函數(shù),對(duì)代價(jià)函數(shù)加入不同的正則化限??制能夠生成不同類型的自編碼器。對(duì)編碼器加上稀疏性的限制,可以生成稀疏自??碼器,對(duì)訓(xùn)練集的統(tǒng)計(jì)特性會(huì)有比較好的響應(yīng);對(duì)輸入加入噪聲干擾,然后計(jì)??算輸出和原始輸入的誤差,可以得到降噪自編碼器,能夠強(qiáng)制模型學(xué)習(xí)出訓(xùn)練集??的分布信息,并對(duì)噪聲有一定抗干擾能力;對(duì)編碼器的梯度加以限制,使得輸入??小幅變化時(shí)編碼器權(quán)值基本保持不變,可以得到壓縮自編碼器。??對(duì)于分布較為簡(jiǎn)單的訓(xùn)練數(shù)據(jù)集,單層的自編碼器即可學(xué)習(xí)出有效的特征??
第2章相關(guān)研宄方法??沒有得到進(jìn)一步發(fā)展。在2012年,卷積神經(jīng)網(wǎng)絡(luò)在ImageNet競(jìng)賽中取得第一.??的成績(jī),自此卷積神經(jīng)網(wǎng)絡(luò)在圖像識(shí)別領(lǐng)域取得了飛速發(fā)展。卷積神經(jīng)網(wǎng)絡(luò)一??包含三種基本操作:卷積,激活和池化。卷積是一種線性數(shù)學(xué)運(yùn)算,圖2.4展??了輸入2D矩陣與卷積核進(jìn)行卷積操作基本過程;激活操作通常選取非線性激??函數(shù),如sigmoid、tanh或ReLU等函數(shù),以提高模型的非線性表達(dá)能力;池??操作是將輸出中特定位置的值替換為該點(diǎn)特定范圍內(nèi)數(shù)值的數(shù)學(xué)統(tǒng)計(jì)值的過??。卷積操作利用了三個(gè)重要的思想來提高卷積神經(jīng)網(wǎng)絡(luò)的表達(dá)能力[34]:稀疏??Input???
本文編號(hào):3377417
【文章來源】:中國(guó)科學(xué)技術(shù)大學(xué)安徽省 211工程院校 985工程院校
【文章頁(yè)數(shù)】:118 頁(yè)
【學(xué)位級(jí)別】:博士
【部分圖文】:
圖2.1神經(jīng)網(wǎng)絡(luò)示例??
隱含層中恢復(fù)原始輸入。為了有效地恢復(fù)原始數(shù)據(jù),并提取出有效的特征表達(dá),??需要針對(duì)不同的應(yīng)用場(chǎng)景對(duì)代價(jià)函數(shù)加入相應(yīng)的正則化項(xiàng)。其中編碼和解碼的??程如下:??V?=?10^2:?+?6i??(2.10)??i?=?wjf(y)?+?b2??中M代表輸入層到隱含層的連接權(quán)值,即編碼器的權(quán)值矩陣;奶代表隱含層??到輸出層的連接權(quán)值,即解碼器的權(quán)值矩陣;/(y)代表激活函數(shù),對(duì)隱含層的??出進(jìn)行非線性激活,使模型具有非線性表達(dá)能力,一般使用sigmoid或者Tanh??激活函數(shù)。自編碼器通常使用均方差代價(jià)函數(shù),對(duì)代價(jià)函數(shù)加入不同的正則化限??制能夠生成不同類型的自編碼器。對(duì)編碼器加上稀疏性的限制,可以生成稀疏自??碼器,對(duì)訓(xùn)練集的統(tǒng)計(jì)特性會(huì)有比較好的響應(yīng);對(duì)輸入加入噪聲干擾,然后計(jì)??算輸出和原始輸入的誤差,可以得到降噪自編碼器,能夠強(qiáng)制模型學(xué)習(xí)出訓(xùn)練集??的分布信息,并對(duì)噪聲有一定抗干擾能力;對(duì)編碼器的梯度加以限制,使得輸入??小幅變化時(shí)編碼器權(quán)值基本保持不變,可以得到壓縮自編碼器。??對(duì)于分布較為簡(jiǎn)單的訓(xùn)練數(shù)據(jù)集,單層的自編碼器即可學(xué)習(xí)出有效的特征??
第2章相關(guān)研宄方法??沒有得到進(jìn)一步發(fā)展。在2012年,卷積神經(jīng)網(wǎng)絡(luò)在ImageNet競(jìng)賽中取得第一.??的成績(jī),自此卷積神經(jīng)網(wǎng)絡(luò)在圖像識(shí)別領(lǐng)域取得了飛速發(fā)展。卷積神經(jīng)網(wǎng)絡(luò)一??包含三種基本操作:卷積,激活和池化。卷積是一種線性數(shù)學(xué)運(yùn)算,圖2.4展??了輸入2D矩陣與卷積核進(jìn)行卷積操作基本過程;激活操作通常選取非線性激??函數(shù),如sigmoid、tanh或ReLU等函數(shù),以提高模型的非線性表達(dá)能力;池??操作是將輸出中特定位置的值替換為該點(diǎn)特定范圍內(nèi)數(shù)值的數(shù)學(xué)統(tǒng)計(jì)值的過??。卷積操作利用了三個(gè)重要的思想來提高卷積神經(jīng)網(wǎng)絡(luò)的表達(dá)能力[34]:稀疏??Input???
本文編號(hào):3377417
本文鏈接:http://www.sikaile.net/kejilunwen/zidonghuakongzhilunwen/3377417.html
最近更新
教材專著