基于深度學(xué)習(xí)和遷移學(xué)習(xí)的書法漢字識別系統(tǒng)的研究與實現(xiàn)
發(fā)布時間:2020-12-23 21:08
書法漢字識別作為計算機視覺的分支,隨著圖像數(shù)字化技術(shù)的發(fā)展逐漸為人們所重視,且在書法圖像標(biāo)注、研究名家作品等方面有著不可或缺的價值。然而,書法圖像數(shù)據(jù)的稀缺性、流傳時產(chǎn)生的多噪性都給書法識別增加了難度和挑戰(zhàn)。與此同時,基于深度學(xué)習(xí)和遷移學(xué)習(xí)的圖像識別技術(shù)憑借識別準確度高、對小數(shù)據(jù)集泛化能力強等優(yōu)勢躍身為當(dāng)今計算機視覺領(lǐng)域研究熱點。將基于深度學(xué)習(xí)和遷移學(xué)習(xí)的圖像識別技術(shù)與書法漢字圖像相結(jié)合,以分析書法漢字識別領(lǐng)域的應(yīng)用需求,采集大量書法單字圖像作為數(shù)據(jù)集,使用遷移學(xué)習(xí)后的卷積神經(jīng)網(wǎng)絡(luò)提取圖像高層抽象特征,以完成本課題的書法漢字識別任務(wù)。首先,對獲取到的書法圖像數(shù)據(jù)集進行數(shù)據(jù)預(yù)處理,以備后期模型訓(xùn)練;其次,對大數(shù)據(jù)集上訓(xùn)練完成的模型和權(quán)重進行遷移,使其對書法圖像數(shù)據(jù)進行高層抽象特征的提取,構(gòu)建網(wǎng)絡(luò)模型;最后,根據(jù)訓(xùn)練好的網(wǎng)絡(luò)模型對書法圖像算出的識別概率值排序,得到書法識別結(jié)果并對其漢字釋義、相似書法進行展示。該系統(tǒng)將為書法圖像數(shù)字化標(biāo)注或書法作品研究方面帶來巨大便利。本文從兩方面研究并實現(xiàn)了該書法漢字識別系統(tǒng):第一:將深度學(xué)習(xí)中的深度神經(jīng)網(wǎng)絡(luò)與遷移學(xué)習(xí)中的模型遷移思想相結(jié)合。在具備大量圖像...
【文章來源】:北京郵電大學(xué)北京市 211工程院校 教育部直屬院校
【文章頁數(shù)】:76 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖2-1稀疏交互示意圖??
??和許多輸入產(chǎn)生間接交互,如圖2-2所示,可見卷積網(wǎng)絡(luò)更深層單元具有比淺層??單元更大的接受域。??Ov?Q?0.?Q??圖2-2神經(jīng)元與輸入間接交互示意圖??這使得稀疏交互具有代表性,可以間接窺見變量間的復(fù)雜連接內(nèi)容。??參數(shù)共享指的是在同一模型的不同函數(shù)間采用相同的參數(shù)。拿圖像處理舉??例,對一個輸入像素為1000?x?1000的圖像而言,假設(shè)隱藏層含有1〇9個神經(jīng)元。??傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)在進行前向傳播時采用全連接,將產(chǎn)生1000xl000xl09=l0ls個??權(quán)值參數(shù)。而卷積網(wǎng)絡(luò)中形象化地描述是,隱藏層含有綁定的權(quán)值。因為假設(shè)隱??藏層的每個神經(jīng)元僅與5?X?5個像素相連,那么109個神經(jīng)元使用的皆是這5?X?5??個權(quán)值,如同被綁定了一樣。無論隱藏層含有多少祌經(jīng)元,僅有這5x5個權(quán)值??被訓(xùn)練(即卷積核大小為5*5)。核的每一個元素都作用在輸入的每一位置上。??參數(shù)共享使得特征學(xué)習(xí)過程中只要求習(xí)得一個參數(shù)集合
??和許多輸入產(chǎn)生間接交互,如圖2-2所示,可見卷積網(wǎng)絡(luò)更深層單元具有比淺層??單元更大的接受域。??Ov?Q?0.?Q??圖2-2神經(jīng)元與輸入間接交互示意圖??這使得稀疏交互具有代表性,可以間接窺見變量間的復(fù)雜連接內(nèi)容。??參數(shù)共享指的是在同一模型的不同函數(shù)間采用相同的參數(shù)。拿圖像處理舉??例,對一個輸入像素為1000?x?1000的圖像而言,假設(shè)隱藏層含有1〇9個神經(jīng)元。??傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)在進行前向傳播時采用全連接,將產(chǎn)生1000xl000xl09=l0ls個??權(quán)值參數(shù)。而卷積網(wǎng)絡(luò)中形象化地描述是,隱藏層含有綁定的權(quán)值。因為假設(shè)隱??藏層的每個神經(jīng)元僅與5?X?5個像素相連,那么109個神經(jīng)元使用的皆是這5?X?5??個權(quán)值,如同被綁定了一樣。無論隱藏層含有多少祌經(jīng)元,僅有這5x5個權(quán)值??被訓(xùn)練(即卷積核大小為5*5)。核的每一個元素都作用在輸入的每一位置上。??參數(shù)共享使得特征學(xué)習(xí)過程中只要求習(xí)得一個參數(shù)集合
【參考文獻】:
期刊論文
[1]基于卷積神經(jīng)網(wǎng)絡(luò)的石刻書法字識別方法[J]. 溫佩芝,姚航,沈嘉煒. 計算機工程與設(shè)計. 2018(03)
[2]基于視覺特征的書法風(fēng)格識別[J]. 汪瀟,章夏芬,韓德志. 現(xiàn)代計算機(專業(yè)版). 2016(21)
[3]小篆文字的自動識別[J]. 戴瓊,周明全,付倩. 計算機技術(shù)與發(fā)展. 2016(03)
[4]中國書法的特征提取及識別[J]. 王民,曾寶瑩,要趁紅,田湘源,孫向南. 信息通信. 2015(07)
博士論文
[1]計算機書法若干關(guān)鍵技術(shù)研究[D]. 俞凱.浙江大學(xué) 2010
碩士論文
[1]基于卷積神經(jīng)網(wǎng)絡(luò)的書法風(fēng)格識別的研究[D]. 張福成.西安理工大學(xué) 2018
[2]基于CNN的書法風(fēng)格識別[D]. 燕飛躍.太原理工大學(xué) 2018
[3]中國書法字識別算法研究及應(yīng)用[D]. 林媛.浙江大學(xué) 2014
[4]書法字書體風(fēng)格識別技術(shù)[D]. 毛天驕.浙江大學(xué) 2014
本文編號:2934361
【文章來源】:北京郵電大學(xué)北京市 211工程院校 教育部直屬院校
【文章頁數(shù)】:76 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖2-1稀疏交互示意圖??
??和許多輸入產(chǎn)生間接交互,如圖2-2所示,可見卷積網(wǎng)絡(luò)更深層單元具有比淺層??單元更大的接受域。??Ov?Q?0.?Q??圖2-2神經(jīng)元與輸入間接交互示意圖??這使得稀疏交互具有代表性,可以間接窺見變量間的復(fù)雜連接內(nèi)容。??參數(shù)共享指的是在同一模型的不同函數(shù)間采用相同的參數(shù)。拿圖像處理舉??例,對一個輸入像素為1000?x?1000的圖像而言,假設(shè)隱藏層含有1〇9個神經(jīng)元。??傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)在進行前向傳播時采用全連接,將產(chǎn)生1000xl000xl09=l0ls個??權(quán)值參數(shù)。而卷積網(wǎng)絡(luò)中形象化地描述是,隱藏層含有綁定的權(quán)值。因為假設(shè)隱??藏層的每個神經(jīng)元僅與5?X?5個像素相連,那么109個神經(jīng)元使用的皆是這5?X?5??個權(quán)值,如同被綁定了一樣。無論隱藏層含有多少祌經(jīng)元,僅有這5x5個權(quán)值??被訓(xùn)練(即卷積核大小為5*5)。核的每一個元素都作用在輸入的每一位置上。??參數(shù)共享使得特征學(xué)習(xí)過程中只要求習(xí)得一個參數(shù)集合
??和許多輸入產(chǎn)生間接交互,如圖2-2所示,可見卷積網(wǎng)絡(luò)更深層單元具有比淺層??單元更大的接受域。??Ov?Q?0.?Q??圖2-2神經(jīng)元與輸入間接交互示意圖??這使得稀疏交互具有代表性,可以間接窺見變量間的復(fù)雜連接內(nèi)容。??參數(shù)共享指的是在同一模型的不同函數(shù)間采用相同的參數(shù)。拿圖像處理舉??例,對一個輸入像素為1000?x?1000的圖像而言,假設(shè)隱藏層含有1〇9個神經(jīng)元。??傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)在進行前向傳播時采用全連接,將產(chǎn)生1000xl000xl09=l0ls個??權(quán)值參數(shù)。而卷積網(wǎng)絡(luò)中形象化地描述是,隱藏層含有綁定的權(quán)值。因為假設(shè)隱??藏層的每個神經(jīng)元僅與5?X?5個像素相連,那么109個神經(jīng)元使用的皆是這5?X?5??個權(quán)值,如同被綁定了一樣。無論隱藏層含有多少祌經(jīng)元,僅有這5x5個權(quán)值??被訓(xùn)練(即卷積核大小為5*5)。核的每一個元素都作用在輸入的每一位置上。??參數(shù)共享使得特征學(xué)習(xí)過程中只要求習(xí)得一個參數(shù)集合
【參考文獻】:
期刊論文
[1]基于卷積神經(jīng)網(wǎng)絡(luò)的石刻書法字識別方法[J]. 溫佩芝,姚航,沈嘉煒. 計算機工程與設(shè)計. 2018(03)
[2]基于視覺特征的書法風(fēng)格識別[J]. 汪瀟,章夏芬,韓德志. 現(xiàn)代計算機(專業(yè)版). 2016(21)
[3]小篆文字的自動識別[J]. 戴瓊,周明全,付倩. 計算機技術(shù)與發(fā)展. 2016(03)
[4]中國書法的特征提取及識別[J]. 王民,曾寶瑩,要趁紅,田湘源,孫向南. 信息通信. 2015(07)
博士論文
[1]計算機書法若干關(guān)鍵技術(shù)研究[D]. 俞凱.浙江大學(xué) 2010
碩士論文
[1]基于卷積神經(jīng)網(wǎng)絡(luò)的書法風(fēng)格識別的研究[D]. 張福成.西安理工大學(xué) 2018
[2]基于CNN的書法風(fēng)格識別[D]. 燕飛躍.太原理工大學(xué) 2018
[3]中國書法字識別算法研究及應(yīng)用[D]. 林媛.浙江大學(xué) 2014
[4]書法字書體風(fēng)格識別技術(shù)[D]. 毛天驕.浙江大學(xué) 2014
本文編號:2934361
本文鏈接:http://www.sikaile.net/kejilunwen/zidonghuakongzhilunwen/2934361.html
最近更新
教材專著