基于集成卷積神經(jīng)網(wǎng)絡(luò)的手寫體數(shù)字識別研究
發(fā)布時(shí)間:2021-03-24 02:37
手寫體數(shù)字識別作為模式識別的一個(gè)重要分支,它主要研究如何通過計(jì)算機(jī)智能地識別出不同場景下的阿拉伯?dāng)?shù)字。目前,手寫體數(shù)字識別技術(shù)被廣泛應(yīng)用于互聯(lián)網(wǎng)、金融、教育等行業(yè)。21世紀(jì)以來,伴隨著互聯(lián)網(wǎng)與大數(shù)據(jù)地快速發(fā)展、全球信息化與自動化程度地不斷提升,需要對手寫體數(shù)字進(jìn)行識別處理的工作越來越多,比如銀行核對金融票據(jù)、公司核對財(cái)務(wù)報(bào)表、郵政自動分揀以及學(xué)校的試卷分?jǐn)?shù)統(tǒng)計(jì),傳統(tǒng)的人工處理具有很強(qiáng)的局限性,特別是速度上難以滿足相關(guān)需求。自動識別的方式不僅可以提高數(shù)字識別處理的效率、減少人力的消耗,還能有效地降低人為操作導(dǎo)致的錯(cuò)誤率,讓相關(guān)工作更加自動化、準(zhǔn)確化和高效化。本文首先以單個(gè)卷積神經(jīng)網(wǎng)絡(luò)為基礎(chǔ),對手寫體數(shù)字識別任務(wù)進(jìn)行研究,提出了一種融合優(yōu)化算法,并在MNIST數(shù)據(jù)集和USPS數(shù)據(jù)集上證明了該算法的可行性,之后結(jié)合卷積神經(jīng)網(wǎng)絡(luò)和集成學(xué)習(xí)進(jìn)行進(jìn)一步研究,提升識別性能。本文首先對卷積神經(jīng)網(wǎng)絡(luò)相關(guān)理論進(jìn)行了介紹,包括人工神經(jīng)網(wǎng)絡(luò)、神經(jīng)元模型、卷積層、下采樣層、全連接層、反向傳播算法、局部感受野、權(quán)值共享、損失函數(shù)、激活函數(shù)、過擬合、正則化方法、Dropout策略等。之后,對集成學(xué)習(xí)相關(guān)內(nèi)容進(jìn)行了介...
【文章來源】:華中師范大學(xué)湖北省 211工程院校 教育部直屬院校
【文章頁數(shù)】:59 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖2.3卷積層不意圖??圖2.3中,卷積操作后將會得到一個(gè)6*6的特征圖
,碩士學(xué)位論文??MASTER'S?THESIS??劃分為一組非重疊的矩形,然后對于所有的子區(qū)域,最大池化會輸出該區(qū)域內(nèi)最大??的元素,而平均池化會輸出該區(qū)域內(nèi)所有元素的平均值。??卷積層的使用使得需要訓(xùn)練的網(wǎng)絡(luò)參數(shù)大大減少,但實(shí)際上需要學(xué)習(xí)的參數(shù)仍??然很多。例如,某卷積層輸入特征圖的大小為200*200,若使用大小為5*5的卷積??核,以1為步長與其進(jìn)行卷積,最終會得到大小為(200-5+1?)*?(200-5+1)?=196*196??的輸出特征圖的。卷積后得到的結(jié)果仍然具有較大尺寸,這可能不符合網(wǎng)絡(luò)訓(xùn)練的??要求。然而,在卷積操作后,真正需要關(guān)注的是各個(gè)特征的相對位置,而不是其具??體位置。因此,可以使用池化操作對原始特征進(jìn)行采樣,進(jìn)而減少訓(xùn)練參數(shù)并減小??過擬合。例如,使用大小為2*2的池化核對大小為196*196的特征圖進(jìn)行池化操作??后,得到的特征圖大小為^*^?=?98*98。一般地,使用大小為c*d的池化核對??2?2??大小為a*b的特征圖進(jìn)行池化操作,若a可以被c整除、b可以被d整除,則可以??得到大小為■的特征圖。圖2.4演示了大小為8*8的輸入特征圖與大小為2*2的??c?d??池化核之間的池化操作:??輸入特征圖?池化輸出??圖2.4池化層示意圖??2.2.3全連接層??卷積層和池化層提取出了不同層次的局部特征,其特征圖中的神經(jīng)元僅與上一??層特征圖中部分區(qū)域內(nèi)的神經(jīng)元存在關(guān)聯(lián)。而全連接層中的神經(jīng)元與其上一層特征??圖中的每一個(gè)神經(jīng)元均有關(guān)聯(lián)。所以全連接層能將之前從卷積層和池化層中己經(jīng)提??取出的所有局部特征進(jìn)行整合,因而全連接層的輸出一般可作為分類器的輸入。??8??
nffljX碩士學(xué)位論文??MASTER'S?THESIS??MNIST數(shù)據(jù)集常被用于深度學(xué)習(xí)領(lǐng)域的算法研究實(shí)驗(yàn),共包含70000個(gè)帶標(biāo)簽??的手寫體數(shù)字樣本,是公認(rèn)的手寫體數(shù)字?jǐn)?shù)據(jù)集。MN1ST數(shù)據(jù)集包含0至9的阿拉??伯?dāng)?shù)字圖片,這些數(shù)字都經(jīng)過尺寸標(biāo)準(zhǔn)化處理并位于圖像中心,每一張圖片的大小??均為28X28的灰度圖片。本章實(shí)驗(yàn)將MNIST數(shù)據(jù)集分為訓(xùn)練數(shù)據(jù)集、驗(yàn)證數(shù)據(jù)集??和測試數(shù)據(jù)集,分別包含50000、10000和10000個(gè)樣本。圖3.5展示了?MNIST數(shù)??據(jù)集中不同數(shù)字的部分樣本,圖3.6展示了數(shù)字“3”的部分樣本,可以看出,不同??類別的樣本之間特征差異明顯,而相同類別的樣本由于書寫者習(xí)慣不同也存在一定??的特征差異,甚至有部分樣本人的肉眼也難以判斷其所屬類別。由于MNIST數(shù)據(jù)??集中的圖片己經(jīng)進(jìn)行了二值化、中心化等預(yù)處理,并且其尺寸與本文所設(shè)計(jì)的卷積??神經(jīng)網(wǎng)絡(luò)的輸入層圖片像素要求相同,所以將標(biāo)準(zhǔn)化的圖片歸一化后作為輸入層的??輸入圖像。??30[?][5][5][〇][5]0[1][2;??ZEffltUHSEIZlEtE??g囹國g]回區(qū)][5]區(qū)??3][3]g][5]S[l][J][3][l][5??30SSIZ1S]0[Z]E][Z??S?iT?^?3?3?^??ZItZISOlZICZISISEIZ??圖3.5?MNIST數(shù)據(jù)集示例圖片??26??
【參考文獻(xiàn)】:
期刊論文
[1]基于分類器集成的高光譜遙感圖像分類方法[J]. 樊利恒,呂俊偉,鄧江生. 光學(xué)學(xué)報(bào). 2014(09)
碩士論文
[1]基于集成卷積神經(jīng)網(wǎng)絡(luò)的交通標(biāo)志識別研究[D]. 易億.重慶郵電大學(xué) 2019
[2]基于集成卷積神經(jīng)網(wǎng)絡(luò)的年齡估計(jì)研究[D]. 馮燕燕.廣西師范大學(xué) 2019
[3]基于深度殘差網(wǎng)絡(luò)的手寫體數(shù)字識別研究[D]. 覃帥.西安電子科技大學(xué) 2019
[4]基于多尺度特征融合卷積神經(jīng)網(wǎng)絡(luò)的宮頸癌細(xì)胞檢測與識別[D]. 陸春宇.哈爾濱理工大學(xué) 2019
[5]基于卷積神經(jīng)網(wǎng)絡(luò)的圖像分類算法研究[D]. 嚴(yán)寒.西北大學(xué) 2018
[6]基于深度學(xué)習(xí)的飛機(jī)分類算法研究[D]. 孫振華.東南大學(xué) 2018
[7]基于神經(jīng)網(wǎng)絡(luò)的手寫體數(shù)字識別系統(tǒng)的研究[D]. 候亞偉.上海應(yīng)用技術(shù)大學(xué) 2018
[8]深度學(xué)習(xí)中優(yōu)化算法的研究與改進(jìn)[D]. 張慧.北京郵電大學(xué) 2018
[9]基于集成學(xué)習(xí)模型的圖片特征提取和分類技術(shù)研究[D]. 韓碩.南京郵電大學(xué) 2017
[10]基于改進(jìn)卷積神經(jīng)網(wǎng)絡(luò)算法的研究與應(yīng)用[D]. 王飛飛.南京郵電大學(xué) 2016
本文編號:3096892
【文章來源】:華中師范大學(xué)湖北省 211工程院校 教育部直屬院校
【文章頁數(shù)】:59 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖2.3卷積層不意圖??圖2.3中,卷積操作后將會得到一個(gè)6*6的特征圖
,碩士學(xué)位論文??MASTER'S?THESIS??劃分為一組非重疊的矩形,然后對于所有的子區(qū)域,最大池化會輸出該區(qū)域內(nèi)最大??的元素,而平均池化會輸出該區(qū)域內(nèi)所有元素的平均值。??卷積層的使用使得需要訓(xùn)練的網(wǎng)絡(luò)參數(shù)大大減少,但實(shí)際上需要學(xué)習(xí)的參數(shù)仍??然很多。例如,某卷積層輸入特征圖的大小為200*200,若使用大小為5*5的卷積??核,以1為步長與其進(jìn)行卷積,最終會得到大小為(200-5+1?)*?(200-5+1)?=196*196??的輸出特征圖的。卷積后得到的結(jié)果仍然具有較大尺寸,這可能不符合網(wǎng)絡(luò)訓(xùn)練的??要求。然而,在卷積操作后,真正需要關(guān)注的是各個(gè)特征的相對位置,而不是其具??體位置。因此,可以使用池化操作對原始特征進(jìn)行采樣,進(jìn)而減少訓(xùn)練參數(shù)并減小??過擬合。例如,使用大小為2*2的池化核對大小為196*196的特征圖進(jìn)行池化操作??后,得到的特征圖大小為^*^?=?98*98。一般地,使用大小為c*d的池化核對??2?2??大小為a*b的特征圖進(jìn)行池化操作,若a可以被c整除、b可以被d整除,則可以??得到大小為■的特征圖。圖2.4演示了大小為8*8的輸入特征圖與大小為2*2的??c?d??池化核之間的池化操作:??輸入特征圖?池化輸出??圖2.4池化層示意圖??2.2.3全連接層??卷積層和池化層提取出了不同層次的局部特征,其特征圖中的神經(jīng)元僅與上一??層特征圖中部分區(qū)域內(nèi)的神經(jīng)元存在關(guān)聯(lián)。而全連接層中的神經(jīng)元與其上一層特征??圖中的每一個(gè)神經(jīng)元均有關(guān)聯(lián)。所以全連接層能將之前從卷積層和池化層中己經(jīng)提??取出的所有局部特征進(jìn)行整合,因而全連接層的輸出一般可作為分類器的輸入。??8??
nffljX碩士學(xué)位論文??MASTER'S?THESIS??MNIST數(shù)據(jù)集常被用于深度學(xué)習(xí)領(lǐng)域的算法研究實(shí)驗(yàn),共包含70000個(gè)帶標(biāo)簽??的手寫體數(shù)字樣本,是公認(rèn)的手寫體數(shù)字?jǐn)?shù)據(jù)集。MN1ST數(shù)據(jù)集包含0至9的阿拉??伯?dāng)?shù)字圖片,這些數(shù)字都經(jīng)過尺寸標(biāo)準(zhǔn)化處理并位于圖像中心,每一張圖片的大小??均為28X28的灰度圖片。本章實(shí)驗(yàn)將MNIST數(shù)據(jù)集分為訓(xùn)練數(shù)據(jù)集、驗(yàn)證數(shù)據(jù)集??和測試數(shù)據(jù)集,分別包含50000、10000和10000個(gè)樣本。圖3.5展示了?MNIST數(shù)??據(jù)集中不同數(shù)字的部分樣本,圖3.6展示了數(shù)字“3”的部分樣本,可以看出,不同??類別的樣本之間特征差異明顯,而相同類別的樣本由于書寫者習(xí)慣不同也存在一定??的特征差異,甚至有部分樣本人的肉眼也難以判斷其所屬類別。由于MNIST數(shù)據(jù)??集中的圖片己經(jīng)進(jìn)行了二值化、中心化等預(yù)處理,并且其尺寸與本文所設(shè)計(jì)的卷積??神經(jīng)網(wǎng)絡(luò)的輸入層圖片像素要求相同,所以將標(biāo)準(zhǔn)化的圖片歸一化后作為輸入層的??輸入圖像。??30[?][5][5][〇][5]0[1][2;??ZEffltUHSEIZlEtE??g囹國g]回區(qū)][5]區(qū)??3][3]g][5]S[l][J][3][l][5??30SSIZ1S]0[Z]E][Z??S?iT?^?3?3?^??ZItZISOlZICZISISEIZ??圖3.5?MNIST數(shù)據(jù)集示例圖片??26??
【參考文獻(xiàn)】:
期刊論文
[1]基于分類器集成的高光譜遙感圖像分類方法[J]. 樊利恒,呂俊偉,鄧江生. 光學(xué)學(xué)報(bào). 2014(09)
碩士論文
[1]基于集成卷積神經(jīng)網(wǎng)絡(luò)的交通標(biāo)志識別研究[D]. 易億.重慶郵電大學(xué) 2019
[2]基于集成卷積神經(jīng)網(wǎng)絡(luò)的年齡估計(jì)研究[D]. 馮燕燕.廣西師范大學(xué) 2019
[3]基于深度殘差網(wǎng)絡(luò)的手寫體數(shù)字識別研究[D]. 覃帥.西安電子科技大學(xué) 2019
[4]基于多尺度特征融合卷積神經(jīng)網(wǎng)絡(luò)的宮頸癌細(xì)胞檢測與識別[D]. 陸春宇.哈爾濱理工大學(xué) 2019
[5]基于卷積神經(jīng)網(wǎng)絡(luò)的圖像分類算法研究[D]. 嚴(yán)寒.西北大學(xué) 2018
[6]基于深度學(xué)習(xí)的飛機(jī)分類算法研究[D]. 孫振華.東南大學(xué) 2018
[7]基于神經(jīng)網(wǎng)絡(luò)的手寫體數(shù)字識別系統(tǒng)的研究[D]. 候亞偉.上海應(yīng)用技術(shù)大學(xué) 2018
[8]深度學(xué)習(xí)中優(yōu)化算法的研究與改進(jìn)[D]. 張慧.北京郵電大學(xué) 2018
[9]基于集成學(xué)習(xí)模型的圖片特征提取和分類技術(shù)研究[D]. 韓碩.南京郵電大學(xué) 2017
[10]基于改進(jìn)卷積神經(jīng)網(wǎng)絡(luò)算法的研究與應(yīng)用[D]. 王飛飛.南京郵電大學(xué) 2016
本文編號:3096892
本文鏈接:http://www.sikaile.net/kejilunwen/zidonghuakongzhilunwen/3096892.html
最近更新
教材專著