姿態(tài)和遮擋魯棒的人臉關鍵點檢測算法研究
發(fā)布時間:2022-02-18 17:10
隨著人工智能時代的到來,以人臉圖像為中心的計算機視覺得到了快速的發(fā)展。人臉關鍵點檢測,又名人臉對齊,作為諸如人臉識別、表情識別等高級別視覺任務的基礎技術,是多媒體領域研究的熱點。由于人臉外觀存在剛性與非剛性的復雜形變,傳統(tǒng)人臉關鍵點檢測算法常對挑戰(zhàn)性場景較為敏感,比如人臉的大角度姿態(tài)變換,以及部分遮擋等。近年來,深度學習的發(fā)展給人臉關鍵點檢測技術帶來了曙光,因此本文的工作將以深度神經(jīng)網(wǎng)絡為主、以傳統(tǒng)算法為輔,對人臉關鍵點檢測問題作進一步的研究,本文的主要工作如下:(1)基于人臉區(qū)域規(guī)范化和可變形沙漏網(wǎng)絡的二階段人臉關鍵點檢測。沙漏網(wǎng)絡是用于人臉關鍵點檢測的經(jīng)典網(wǎng)絡,但是其對大角度姿態(tài)變化較為敏感。為了提高沙漏網(wǎng)絡對大角度姿態(tài)變化以及表情變化的魯棒性,提出二階段模型用于人臉關鍵點檢測。首先,通過使用空間變換網(wǎng)絡校正人臉,簡化了傳統(tǒng)上使用檢測的關鍵點和人臉均值形狀進行普氏分析,進而采用仿射變換來規(guī)范化人臉區(qū)域的方法。由此不同姿態(tài)變化的人臉圖像都可以被變換成規(guī)范狀態(tài),實驗證明有助于提升之后的人臉關鍵點檢測的性能。其次,由可變形卷積網(wǎng)絡得到啟發(fā),將可變形卷積與原始沙漏網(wǎng)絡結(jié)合?勺冃紊陈┚W(wǎng)絡的...
【文章來源】:安徽大學安徽省211工程院校
【文章頁數(shù)】:70 頁
【學位級別】:碩士
【部分圖文】:
級聯(lián)形狀回歸模型預測過程
第二章人臉關鍵點檢測相關理論8第二章人臉關鍵點檢測相關理論近年來人臉關鍵點檢測算法主要由深度學習主導,用于人臉關鍵點檢測相關的深度神經(jīng)網(wǎng)絡是卷積神經(jīng)網(wǎng)絡。本章首先對這些相關技術做簡要介紹,并介紹相關的評估數(shù)據(jù)集。2.1卷積神經(jīng)網(wǎng)絡相關理論在深度學習中,卷積神經(jīng)網(wǎng)絡是最常用的深度網(wǎng)絡之一,主要用于視覺任務,比如圖像和視頻識別、圖像分類、醫(yī)學圖像處理以及圖像跟蹤定位等。當然,卷積神經(jīng)網(wǎng)絡也可處理自然語言處理等非視覺任務。卷積神經(jīng)網(wǎng)絡具有不同于其他網(wǎng)絡的一種數(shù)學運算——卷積、池化運算。2.1.1卷積層通常根據(jù)卷積神經(jīng)網(wǎng)絡的設計規(guī)則,輸入的RGB三通道的圖像通常以四維張量的形式表示為n×c×h×w,n,c,h,w分別代表圖像數(shù)量、圖像深度、圖像高度以及圖像寬度。同樣,整個網(wǎng)絡中的特征圖也是以這種形式表示。卷積層具有以下屬性:1)有固定尺寸的卷積核;2)有輸入以及輸出特征圖通道數(shù)量的定義;3)卷積核的深度必須等于輸入特征圖的通道數(shù),輸出特征圖的通道數(shù)顯然與卷積核的個數(shù)一一對應。卷積計算的示意圖如下圖所示:圖2.1卷積計算過程Figure2.1Calculationprocessofconvolution上圖為一個3×3卷積核對一個單通道的輸入特征圖進行處理,生成的新特征圖輸入到網(wǎng)絡的下一層?梢钥闯觯矸e核只能以其自身大小來進行學習,這種特性稱之為卷
2.1.2池化層池化層是一種形式的降采樣,它的出現(xiàn)是為了進一步降低參數(shù)量,提高網(wǎng)絡的深度上限。簡單的說,池化層是對前一層特征圖的降維,即將輸入的特征圖劃分為若干矩形區(qū)域,對每個子區(qū)域計算得到一個值。根據(jù)采樣方式的不同池化操作有兩類:1)最大池化;2)平均池化。最大池化使用上一層特征圖的子區(qū)域中的最大值,平均池化使用上一層特征圖的子區(qū)域中的平均值。這種方式降低了特征圖的尺寸,進而使得網(wǎng)絡的整體參數(shù)量得到降低,并且可以減弱參數(shù)量過大帶來過擬合的副作用。如下圖所示為一個2×2大小的池化操作。圖2.2池化操作過程Figure2.2Processofpoolingoperation2.1.3全連接層在早期的神經(jīng)網(wǎng)絡設計中,全連接層是必不可少的存在。例如在完全連接網(wǎng)絡中所有層均為全連接層,早期卷積神經(jīng)網(wǎng)絡的設計理念也是由全連接層作為網(wǎng)絡的結(jié)尾。實際上,一系列的卷積層可以看作特征提取器,而最后的全連接層就是“分類器”。對于一個圖像分類網(wǎng)絡,類別共1000種,在一系列的卷積、池化、激活函數(shù)的變換之后得到了一個c×h×w(c,h,w分別表示特征圖的深度、高度及寬度)的特征圖,首個全連接層將其變換成m維的特征向量,其中m=c×h×w;緊接著下一個全連接層將此m維特征向量映射1000維向量,對應1000個類別。由于完全連接的特性,全連接層擁有巨大的參數(shù)量,因此最近主流卷積網(wǎng)絡的設計趨勢是將全連接層用全局平均池化(globalaveragepooling)來替代。例如對于以上的c×h×w特征圖,可以使用h×w大小的池化核進行全局池化,可以得到c維特征向量。但是這種方法必須在小尺寸特征圖上執(zhí)行(即一般h與w不大于4),否則可能大量丟失特征信息。
本文編號:3631221
【文章來源】:安徽大學安徽省211工程院校
【文章頁數(shù)】:70 頁
【學位級別】:碩士
【部分圖文】:
級聯(lián)形狀回歸模型預測過程
第二章人臉關鍵點檢測相關理論8第二章人臉關鍵點檢測相關理論近年來人臉關鍵點檢測算法主要由深度學習主導,用于人臉關鍵點檢測相關的深度神經(jīng)網(wǎng)絡是卷積神經(jīng)網(wǎng)絡。本章首先對這些相關技術做簡要介紹,并介紹相關的評估數(shù)據(jù)集。2.1卷積神經(jīng)網(wǎng)絡相關理論在深度學習中,卷積神經(jīng)網(wǎng)絡是最常用的深度網(wǎng)絡之一,主要用于視覺任務,比如圖像和視頻識別、圖像分類、醫(yī)學圖像處理以及圖像跟蹤定位等。當然,卷積神經(jīng)網(wǎng)絡也可處理自然語言處理等非視覺任務。卷積神經(jīng)網(wǎng)絡具有不同于其他網(wǎng)絡的一種數(shù)學運算——卷積、池化運算。2.1.1卷積層通常根據(jù)卷積神經(jīng)網(wǎng)絡的設計規(guī)則,輸入的RGB三通道的圖像通常以四維張量的形式表示為n×c×h×w,n,c,h,w分別代表圖像數(shù)量、圖像深度、圖像高度以及圖像寬度。同樣,整個網(wǎng)絡中的特征圖也是以這種形式表示。卷積層具有以下屬性:1)有固定尺寸的卷積核;2)有輸入以及輸出特征圖通道數(shù)量的定義;3)卷積核的深度必須等于輸入特征圖的通道數(shù),輸出特征圖的通道數(shù)顯然與卷積核的個數(shù)一一對應。卷積計算的示意圖如下圖所示:圖2.1卷積計算過程Figure2.1Calculationprocessofconvolution上圖為一個3×3卷積核對一個單通道的輸入特征圖進行處理,生成的新特征圖輸入到網(wǎng)絡的下一層?梢钥闯觯矸e核只能以其自身大小來進行學習,這種特性稱之為卷
2.1.2池化層池化層是一種形式的降采樣,它的出現(xiàn)是為了進一步降低參數(shù)量,提高網(wǎng)絡的深度上限。簡單的說,池化層是對前一層特征圖的降維,即將輸入的特征圖劃分為若干矩形區(qū)域,對每個子區(qū)域計算得到一個值。根據(jù)采樣方式的不同池化操作有兩類:1)最大池化;2)平均池化。最大池化使用上一層特征圖的子區(qū)域中的最大值,平均池化使用上一層特征圖的子區(qū)域中的平均值。這種方式降低了特征圖的尺寸,進而使得網(wǎng)絡的整體參數(shù)量得到降低,并且可以減弱參數(shù)量過大帶來過擬合的副作用。如下圖所示為一個2×2大小的池化操作。圖2.2池化操作過程Figure2.2Processofpoolingoperation2.1.3全連接層在早期的神經(jīng)網(wǎng)絡設計中,全連接層是必不可少的存在。例如在完全連接網(wǎng)絡中所有層均為全連接層,早期卷積神經(jīng)網(wǎng)絡的設計理念也是由全連接層作為網(wǎng)絡的結(jié)尾。實際上,一系列的卷積層可以看作特征提取器,而最后的全連接層就是“分類器”。對于一個圖像分類網(wǎng)絡,類別共1000種,在一系列的卷積、池化、激活函數(shù)的變換之后得到了一個c×h×w(c,h,w分別表示特征圖的深度、高度及寬度)的特征圖,首個全連接層將其變換成m維的特征向量,其中m=c×h×w;緊接著下一個全連接層將此m維特征向量映射1000維向量,對應1000個類別。由于完全連接的特性,全連接層擁有巨大的參數(shù)量,因此最近主流卷積網(wǎng)絡的設計趨勢是將全連接層用全局平均池化(globalaveragepooling)來替代。例如對于以上的c×h×w特征圖,可以使用h×w大小的池化核進行全局池化,可以得到c維特征向量。但是這種方法必須在小尺寸特征圖上執(zhí)行(即一般h與w不大于4),否則可能大量丟失特征信息。
本文編號:3631221
本文鏈接:http://www.sikaile.net/kejilunwen/shengwushengchang/3631221.html
最近更新
教材專著