基于改進(jìn)損失函數(shù)的YOLOV3的人臉檢測(cè)
發(fā)布時(shí)間:2021-07-30 17:21
人臉檢測(cè)技術(shù)是人臉識(shí)別技術(shù)的前置步驟,一直受到人們的重視。近年來隨著深度學(xué)習(xí)的發(fā)展,人臉檢測(cè)技術(shù)作為計(jì)算機(jī)視覺的一個(gè)重要研究方向也有了很大的進(jìn)步。人臉檢測(cè)受復(fù)雜環(huán)境以及表情、遮擋、姿勢(shì)變化等因素的影響,檢測(cè)精度和速度往往不能達(dá)到預(yù)期目標(biāo)。YOLOv3網(wǎng)絡(luò)是一種非常優(yōu)秀的目標(biāo)檢測(cè)算法,它既能夠達(dá)到檢測(cè)的實(shí)時(shí)性要求,又能夠得到較好的檢測(cè)精度。針對(duì)YOLOv3檢測(cè)存在的漏檢誤檢問題,本文提出了一種基于改進(jìn)損失函數(shù)的YOLOv3人臉檢測(cè)算法。首先,通過K均值聚類算法得到9個(gè)適合人臉數(shù)據(jù)集的先驗(yàn)框;然后,提出應(yīng)用了一種新的邊界框回歸損失函數(shù)廣義交并比和平衡YOLOv3單步法正負(fù)樣本不平衡的焦點(diǎn)損失作為置信度函數(shù)來提高檢測(cè)的精度;最后,用殘差塊改進(jìn)網(wǎng)絡(luò)最后的目標(biāo)檢測(cè)層。在Wider Face人臉數(shù)據(jù)庫上對(duì)改進(jìn)的YOLOv3的模型進(jìn)行訓(xùn)練和測(cè)試,實(shí)驗(yàn)結(jié)果表明,本文提出的基于改進(jìn)損失函數(shù)YOLOv3的人臉檢測(cè)方法比原方法更加優(yōu)秀,所做的改進(jìn)是可行有效的。
【文章來源】:南昌大學(xué)江西省 211工程院校
【文章頁數(shù)】:54 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖1.2檢測(cè)算法對(duì)比數(shù)據(jù)???YOLOv3算法己經(jīng)獲得了極大的成果,比其他的檢測(cè)網(wǎng)絡(luò)更加優(yōu)秀,但是它??仍然有不少缺點(diǎn),在檢測(cè)時(shí)仍然會(huì)存在漏檢還有定位錯(cuò)誤等問題,在高速檢測(cè)的??同時(shí)檢測(cè)的精度仍然不夠高
、Y0L0v3網(wǎng)絡(luò)。然后將這些深度學(xué)習(xí)的檢測(cè)算法應(yīng)用到人臉檢??測(cè)。本章將詳細(xì)介紹Y0L0v3網(wǎng)絡(luò)所使用的殘差網(wǎng)絡(luò)、邊框回歸、交并比以及??Darknet53?網(wǎng)絡(luò)。??2.?1卷積神經(jīng)網(wǎng)絡(luò)??卷積神經(jīng)網(wǎng)絡(luò)(CNN)是多層級(jí)的神經(jīng)網(wǎng)絡(luò),在上世紀(jì)的90年代,LeCun??等人_確定了?CNN網(wǎng)絡(luò)的結(jié)構(gòu),并且對(duì)網(wǎng)絡(luò)的結(jié)構(gòu)加以完善。他們提出了叫做??LeNet-5的多層神經(jīng)網(wǎng)絡(luò),這種神經(jīng)網(wǎng)絡(luò)能夠分類手寫的數(shù)字,網(wǎng)絡(luò)可以使用??BP(backpr〇Pagati〇n)算法進(jìn)行訓(xùn)練,網(wǎng)絡(luò)結(jié)構(gòu)如圖2.1所示。卷積神經(jīng)網(wǎng)絡(luò)可以??得到原始圖像的有效表征。它具有權(quán)值共享、局部連接等優(yōu)點(diǎn),是一種特殊的前??饋神經(jīng)網(wǎng)絡(luò)。它相較于傳統(tǒng)的圖像處理算法的特殊之處就是它不用進(jìn)行圖像預(yù)處??理過程,特別是那些需要靠人工參與的圖像預(yù)處理過程,也就是說卷積神經(jīng)網(wǎng)絡(luò)??直接對(duì)輸入的原始圖像進(jìn)行一系列工作。??C3:?f,?maps16@10x10??INPUT?6?2SemaPS?S41m?〒拳??32x32??丨?工;v,??I?Gaussian?connections??Convolutions?Subsampiing?Convolutions?Subsampling?Full?coinection??圖2.?1?LeNet-5網(wǎng)絡(luò)結(jié)構(gòu)??2.1.1卷積神經(jīng)網(wǎng)絡(luò)概述??卷積祌經(jīng)網(wǎng)絡(luò)主要有卷積層和池化層與全連接層和激活函數(shù)組成。??8??
?2基于深度學(xué)習(xí)的人臉檢測(cè)概述???速度,最終直接使用神經(jīng)網(wǎng)絡(luò)來輸出邊框回歸(boundingbox,?bbox)的位置和??所屬類別。??YOLO算法是直接把整張圖片用來進(jìn)行檢測(cè)的,因此它可以編碼全局信息,??能夠減少將背景檢測(cè)為目標(biāo)的錯(cuò)誤。YOLO算法的泛化能力非常強(qiáng),也能夠遷移??到其他領(lǐng)域里去。??YOLO檢測(cè)過程如下圖2.5所示:??F?H?2.?Run?convolutional?network.???tf??I?3.?Non-max?suppression.?L_—_______??圖2.?5?YOLO檢測(cè)流程??YOLO算法直接通過端到端的來進(jìn)行目標(biāo)的檢測(cè),它使用單一的卷積神經(jīng)網(wǎng)??絡(luò)來實(shí)現(xiàn)傳統(tǒng)的目標(biāo)檢測(cè)的過程,然后使用卷積神經(jīng)網(wǎng)絡(luò)來直接回歸得到目標(biāo)的??坐標(biāo)位置。算法的做法如下圖2.6所示:??.1邏H??|?Vi—:??雙舞-.....-十-一上———二一—?w??????????1?1?????;.i???:???11?1"??圖2.?6?Y0L0具體檢測(cè)過程??YOLO將輸入的圖片分成SXS個(gè)單元格,如果待檢測(cè)圖片屮物體的中心點(diǎn)??在某個(gè)單元格中,那么這個(gè)單元格就負(fù)責(zé)對(duì)這個(gè)物體進(jìn)行檢測(cè)。每一個(gè)單元格都??13??
【參考文獻(xiàn)】:
期刊論文
[1]改進(jìn)的YOLO V3算法及其在小目標(biāo)檢測(cè)中的應(yīng)用[J]. 鞠默然,羅海波,王仲博,何淼,常錚,惠斌. 光學(xué)學(xué)報(bào). 2019(07)
碩士論文
[1]基于深度學(xué)習(xí)的人臉圖像超分辨率重建[D]. 史鵬濤.南昌大學(xué) 2019
[2]基于深度學(xué)習(xí)的人臉檢測(cè)和識(shí)別方法研究[D]. 劉婧月.電子科技大學(xué) 2018
本文編號(hào):3311814
【文章來源】:南昌大學(xué)江西省 211工程院校
【文章頁數(shù)】:54 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖1.2檢測(cè)算法對(duì)比數(shù)據(jù)???YOLOv3算法己經(jīng)獲得了極大的成果,比其他的檢測(cè)網(wǎng)絡(luò)更加優(yōu)秀,但是它??仍然有不少缺點(diǎn),在檢測(cè)時(shí)仍然會(huì)存在漏檢還有定位錯(cuò)誤等問題,在高速檢測(cè)的??同時(shí)檢測(cè)的精度仍然不夠高
、Y0L0v3網(wǎng)絡(luò)。然后將這些深度學(xué)習(xí)的檢測(cè)算法應(yīng)用到人臉檢??測(cè)。本章將詳細(xì)介紹Y0L0v3網(wǎng)絡(luò)所使用的殘差網(wǎng)絡(luò)、邊框回歸、交并比以及??Darknet53?網(wǎng)絡(luò)。??2.?1卷積神經(jīng)網(wǎng)絡(luò)??卷積神經(jīng)網(wǎng)絡(luò)(CNN)是多層級(jí)的神經(jīng)網(wǎng)絡(luò),在上世紀(jì)的90年代,LeCun??等人_確定了?CNN網(wǎng)絡(luò)的結(jié)構(gòu),并且對(duì)網(wǎng)絡(luò)的結(jié)構(gòu)加以完善。他們提出了叫做??LeNet-5的多層神經(jīng)網(wǎng)絡(luò),這種神經(jīng)網(wǎng)絡(luò)能夠分類手寫的數(shù)字,網(wǎng)絡(luò)可以使用??BP(backpr〇Pagati〇n)算法進(jìn)行訓(xùn)練,網(wǎng)絡(luò)結(jié)構(gòu)如圖2.1所示。卷積神經(jīng)網(wǎng)絡(luò)可以??得到原始圖像的有效表征。它具有權(quán)值共享、局部連接等優(yōu)點(diǎn),是一種特殊的前??饋神經(jīng)網(wǎng)絡(luò)。它相較于傳統(tǒng)的圖像處理算法的特殊之處就是它不用進(jìn)行圖像預(yù)處??理過程,特別是那些需要靠人工參與的圖像預(yù)處理過程,也就是說卷積神經(jīng)網(wǎng)絡(luò)??直接對(duì)輸入的原始圖像進(jìn)行一系列工作。??C3:?f,?maps16@10x10??INPUT?6?2SemaPS?S41m?〒拳??32x32??丨?工;v,??I?Gaussian?connections??Convolutions?Subsampiing?Convolutions?Subsampling?Full?coinection??圖2.?1?LeNet-5網(wǎng)絡(luò)結(jié)構(gòu)??2.1.1卷積神經(jīng)網(wǎng)絡(luò)概述??卷積祌經(jīng)網(wǎng)絡(luò)主要有卷積層和池化層與全連接層和激活函數(shù)組成。??8??
?2基于深度學(xué)習(xí)的人臉檢測(cè)概述???速度,最終直接使用神經(jīng)網(wǎng)絡(luò)來輸出邊框回歸(boundingbox,?bbox)的位置和??所屬類別。??YOLO算法是直接把整張圖片用來進(jìn)行檢測(cè)的,因此它可以編碼全局信息,??能夠減少將背景檢測(cè)為目標(biāo)的錯(cuò)誤。YOLO算法的泛化能力非常強(qiáng),也能夠遷移??到其他領(lǐng)域里去。??YOLO檢測(cè)過程如下圖2.5所示:??F?H?2.?Run?convolutional?network.???tf??I?3.?Non-max?suppression.?L_—_______??圖2.?5?YOLO檢測(cè)流程??YOLO算法直接通過端到端的來進(jìn)行目標(biāo)的檢測(cè),它使用單一的卷積神經(jīng)網(wǎng)??絡(luò)來實(shí)現(xiàn)傳統(tǒng)的目標(biāo)檢測(cè)的過程,然后使用卷積神經(jīng)網(wǎng)絡(luò)來直接回歸得到目標(biāo)的??坐標(biāo)位置。算法的做法如下圖2.6所示:??.1邏H??|?Vi—:??雙舞-.....-十-一上———二一—?w??????????1?1?????;.i???:???11?1"??圖2.?6?Y0L0具體檢測(cè)過程??YOLO將輸入的圖片分成SXS個(gè)單元格,如果待檢測(cè)圖片屮物體的中心點(diǎn)??在某個(gè)單元格中,那么這個(gè)單元格就負(fù)責(zé)對(duì)這個(gè)物體進(jìn)行檢測(cè)。每一個(gè)單元格都??13??
【參考文獻(xiàn)】:
期刊論文
[1]改進(jìn)的YOLO V3算法及其在小目標(biāo)檢測(cè)中的應(yīng)用[J]. 鞠默然,羅海波,王仲博,何淼,常錚,惠斌. 光學(xué)學(xué)報(bào). 2019(07)
碩士論文
[1]基于深度學(xué)習(xí)的人臉圖像超分辨率重建[D]. 史鵬濤.南昌大學(xué) 2019
[2]基于深度學(xué)習(xí)的人臉檢測(cè)和識(shí)別方法研究[D]. 劉婧月.電子科技大學(xué) 2018
本文編號(hào):3311814
本文鏈接:http://www.sikaile.net/kejilunwen/zidonghuakongzhilunwen/3311814.html
最近更新
教材專著