基于改進型SSD網(wǎng)絡的人臉檢測
發(fā)布時間:2021-08-20 15:25
隨著深度學習技術的快速發(fā)展,人臉檢測技術取得很大的進展,成為近年來計算機視覺領域中的一個研究熱點。然而,人臉檢測易受到尺度變化、光照變化、遮擋方面等因素的影響,使得人臉檢測精度降低。與傳統(tǒng)檢測方法相比,SSD(Single Shot MultiBox Detector)網(wǎng)絡檢測方法具有高效的檢測速度和較好的檢測效果,但是也存在一些不足之處。因此本文提出基于改進的SSD網(wǎng)絡的人臉檢測方法,在檢測精度和檢測速度方面都取得了良好的效果。本文主要研究工作有如下兩個方面:(1)針對在多尺度等環(huán)境下的人臉檢測,傳統(tǒng)的SSD網(wǎng)絡的檢測效果存在漏檢和誤檢問題,提出基于深度殘差網(wǎng)絡(ResNeXt)的SSD網(wǎng)絡,基礎網(wǎng)絡用ResNeXt-50網(wǎng)絡替換原來的VGG16網(wǎng)絡,使用ResNeXt-50網(wǎng)絡結構不僅可以降低網(wǎng)絡訓練難度還可以減少特征提取的冗余度,不斷增強人臉特征表達能力,進一步提高人臉檢測精度。最后在WiderFace驗證集上的實驗結果,表明了基于ResNeXt網(wǎng)絡的SSD網(wǎng)絡能提高檢測精度。(2)為了解決SSD網(wǎng)絡的小人臉檢測精度問題,提出一種基于特征融合方法的SSD網(wǎng)絡。首先對高層的特征圖使...
【文章來源】:南昌大學江西省 211工程院校
【文章頁數(shù)】:64 頁
【學位級別】:碩士
【圖文】:
圖2.1深度學習發(fā)展歷程??第一代神經(jīng)網(wǎng)絡(1958-1969):神經(jīng)網(wǎng)絡最早起源于1943年的多層感知器??
個步驟。第一步是通過濾波器的尺寸作為滑動窗口的尺寸,用滑動窗??口從輸入圖像數(shù)據(jù)中選定某一區(qū)域;第二步是在卷積核運動期間將圖像上的每??個像素乘以與卷積核相對應的權重,然后將所有乘積相加以獲得最終輸出,如圖??2.2所示。??Input?5x5??__1__1?°?Q?Filter?3x3?Output?3x3??0?1110?101??0?0?J.__1__^?0?1?0?:?4??0?0?110?10?1??0?110?0?Bias=o??i??圖2.2卷積運算操作??池化層也可稱為下采樣層,其本質是對數(shù)據(jù)圖像特征進行向下采樣。池化層??卷積運算后的結果是輸出數(shù)據(jù)圖像中的特征圖特定區(qū)域的最大值或¥均值。在??卷積操作中,由于卷積核很小導致原始圖像上進行卷積后圖像仍然很大。因此,??使用池化層可以對數(shù)據(jù)降維,防止過擬合。在實際卷積網(wǎng)絡編程中,用到的池化??方法比較多,例如有最大池化、平均池化、重疊池化和空間金字塔池化等。但是,??最常用的使用方法是最大池化方法和平均池化方法。??全連接層是指兩個相鄰網(wǎng)絡層的神經(jīng)元之間以全連接的方式進行連接,目??的是為了整合多個特征信息,從上層獲得類別區(qū)分并將其映射其成為特征向量。??在卷積神經(jīng)網(wǎng)絡的結構中,經(jīng)過多個卷積層和池化層后,連接一個或多個全連接??層,用來結合先前網(wǎng)絡層中提取到的特征。但是,這種全連接方式存在缺點,最??后一步直接特征映射可能會破壞圖像的空間結構。因此,最近研宄人員提出使用??更小的卷積層代替全連接層,并且基本在神經(jīng)網(wǎng)絡結果中使用1X1卷積核。??激活函數(shù)層是在卷積神經(jīng)網(wǎng)絡上運行的函數(shù),作用是將卷積層的輸入映射??到輸出。
?第2章基于深度學習的人臉檢測概述???2.深度殘差網(wǎng)絡(ResNet)??隨著網(wǎng)絡層數(shù)的增加,網(wǎng)絡模型精度會不斷提高。但當網(wǎng)絡層數(shù)增加到一定??數(shù)量時,訓練精度和測試精度會表現(xiàn)出迅速下降,因此當網(wǎng)絡變得非常深時,卷??積神經(jīng)網(wǎng)絡變得更加難以訓練。針對這些問題,He等人在2015年提出了?ResNet??網(wǎng)絡[46],并且獲得了?ILSVRC-2015分類競賽冠軍。ResNet網(wǎng)絡參數(shù)結構,深度??可達到152層,一般使用50或者101層,如圖2.3所示。ResNet網(wǎng)絡主要引入??了殘差學習單元,其核心思想是引入一個的恒等快捷連接(Identity?Shortcut??Connection),直接跳過一個或多個層,結構如圖2.4所示,具體殘差結構構造如??圖2.5所示。??.1'.?.?:?>?-uiiml?M/t*?j?1K-Ia>I?,4?1a\i*i?l.i\?^?i?I'M?lYl.iyr??conv?1?112-112?viiuic?^??'?^?max?pH?l?Miuk*?2??〇.<n2x?V-.Sf,?m?二"」“?,[.?f?1?:?m??,?-2?1?、,..?:.*?■;?.,.、?.?.V?M?*?^?3???V?<、4?;??、_?‘,’、.、?[?I?*?1.?256?^?1???J?l???1.25h??卜1?I〉?f?!?■丨.i:S??卜丨.丨Js?’??tomrx?2K?/?,、2?.?'?'?4?3-3.?128?*4?V.?X?128?<4?HI?28?K??-?’.丨*>?[?1-1.512」?[h?I.M2?j?I???\.^\:??
【參考文獻】:
期刊論文
[1]基于多特征Mean Shift的人臉跟蹤算法[J]. 張濤,蔡燦輝. 電子與信息學報. 2009(08)
[2]基于HMM的面部表情圖像序列的分析與識別[J]. 金輝,高文. 自動化學報. 2002(04)
[3]基于模板匹配與支持矢量機的人臉檢測[J]. 梁路宏,艾海舟,肖習攀,葉航軍,徐光祐,張鈸. 計算機學報. 2002(01)
[4]人臉識別技術綜述[J]. 張翠平,蘇光大. 中國圖象圖形學報. 2000(11)
本文編號:3353747
【文章來源】:南昌大學江西省 211工程院校
【文章頁數(shù)】:64 頁
【學位級別】:碩士
【圖文】:
圖2.1深度學習發(fā)展歷程??第一代神經(jīng)網(wǎng)絡(1958-1969):神經(jīng)網(wǎng)絡最早起源于1943年的多層感知器??
個步驟。第一步是通過濾波器的尺寸作為滑動窗口的尺寸,用滑動窗??口從輸入圖像數(shù)據(jù)中選定某一區(qū)域;第二步是在卷積核運動期間將圖像上的每??個像素乘以與卷積核相對應的權重,然后將所有乘積相加以獲得最終輸出,如圖??2.2所示。??Input?5x5??__1__1?°?Q?Filter?3x3?Output?3x3??0?1110?101??0?0?J.__1__^?0?1?0?:?4??0?0?110?10?1??0?110?0?Bias=o??i??圖2.2卷積運算操作??池化層也可稱為下采樣層,其本質是對數(shù)據(jù)圖像特征進行向下采樣。池化層??卷積運算后的結果是輸出數(shù)據(jù)圖像中的特征圖特定區(qū)域的最大值或¥均值。在??卷積操作中,由于卷積核很小導致原始圖像上進行卷積后圖像仍然很大。因此,??使用池化層可以對數(shù)據(jù)降維,防止過擬合。在實際卷積網(wǎng)絡編程中,用到的池化??方法比較多,例如有最大池化、平均池化、重疊池化和空間金字塔池化等。但是,??最常用的使用方法是最大池化方法和平均池化方法。??全連接層是指兩個相鄰網(wǎng)絡層的神經(jīng)元之間以全連接的方式進行連接,目??的是為了整合多個特征信息,從上層獲得類別區(qū)分并將其映射其成為特征向量。??在卷積神經(jīng)網(wǎng)絡的結構中,經(jīng)過多個卷積層和池化層后,連接一個或多個全連接??層,用來結合先前網(wǎng)絡層中提取到的特征。但是,這種全連接方式存在缺點,最??后一步直接特征映射可能會破壞圖像的空間結構。因此,最近研宄人員提出使用??更小的卷積層代替全連接層,并且基本在神經(jīng)網(wǎng)絡結果中使用1X1卷積核。??激活函數(shù)層是在卷積神經(jīng)網(wǎng)絡上運行的函數(shù),作用是將卷積層的輸入映射??到輸出。
?第2章基于深度學習的人臉檢測概述???2.深度殘差網(wǎng)絡(ResNet)??隨著網(wǎng)絡層數(shù)的增加,網(wǎng)絡模型精度會不斷提高。但當網(wǎng)絡層數(shù)增加到一定??數(shù)量時,訓練精度和測試精度會表現(xiàn)出迅速下降,因此當網(wǎng)絡變得非常深時,卷??積神經(jīng)網(wǎng)絡變得更加難以訓練。針對這些問題,He等人在2015年提出了?ResNet??網(wǎng)絡[46],并且獲得了?ILSVRC-2015分類競賽冠軍。ResNet網(wǎng)絡參數(shù)結構,深度??可達到152層,一般使用50或者101層,如圖2.3所示。ResNet網(wǎng)絡主要引入??了殘差學習單元,其核心思想是引入一個的恒等快捷連接(Identity?Shortcut??Connection),直接跳過一個或多個層,結構如圖2.4所示,具體殘差結構構造如??圖2.5所示。??.1'.?.?:?>?-uiiml?M/t*?j?1K-Ia>I?,4?1a\i*i?l.i\?^?i?I'M?lYl.iyr??conv?1?112-112?viiuic?^??'?^?max?pH?l?Miuk*?2??〇.<n2x?V-.Sf,?m?二"」“?,[.?f?1?:?m??,?-2?1?、,..?:.*?■;?.,.、?.?.V?M?*?^?3???V?<、4?;??、_?‘,’、.、?[?I?*?1.?256?^?1???J?l???1.25h??卜1?I〉?f?!?■丨.i:S??卜丨.丨Js?’??tomrx?2K?/?,、2?.?'?'?4?3-3.?128?*4?V.?X?128?<4?HI?28?K??-?’.丨*>?[?1-1.512」?[h?I.M2?j?I???\.^\:??
【參考文獻】:
期刊論文
[1]基于多特征Mean Shift的人臉跟蹤算法[J]. 張濤,蔡燦輝. 電子與信息學報. 2009(08)
[2]基于HMM的面部表情圖像序列的分析與識別[J]. 金輝,高文. 自動化學報. 2002(04)
[3]基于模板匹配與支持矢量機的人臉檢測[J]. 梁路宏,艾海舟,肖習攀,葉航軍,徐光祐,張鈸. 計算機學報. 2002(01)
[4]人臉識別技術綜述[J]. 張翠平,蘇光大. 中國圖象圖形學報. 2000(11)
本文編號:3353747
本文鏈接:http://www.sikaile.net/kejilunwen/zidonghuakongzhilunwen/3353747.html
最近更新
教材專著