天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 自動化論文 >

基于深度學(xué)習(xí)的表單識別系統(tǒng)的研究與實現(xiàn)

發(fā)布時間:2021-02-25 16:34
  表單以紙質(zhì)或數(shù)字(電子)形式存在于人們的日常生活中。紙質(zhì)表單文件易于閱讀和分享,數(shù)字則易于索引與保存。為了進行更有效的知識管理,通常需要先將紙質(zhì)表單轉(zhuǎn)換為數(shù)字格式,然后再進行表單文字信息的提取。傳統(tǒng)的表單數(shù)據(jù)一般通過手動錄入的方式進行信息的統(tǒng)計和分析,隨著人工智能,模式識別的研究和發(fā)展,人們獲取表單信息的方式不再局限于手動錄入或掃描儀的方式,而是利用計算機對表單圖像進行自動化識別,從而可以大幅度提高工作效率,為人們的生活與辦公提供便利。本文通過研究國內(nèi)外表單識別的發(fā)展現(xiàn)狀,在深度學(xué)習(xí)下的卷積神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)上,展開了對自然條件下表單文檔的定位以及特定類型表單上印刷體文字識別的研究。本文主要的研究工作有:(1)基于殘差網(wǎng)絡(luò)的表單定位算法研究針對表單文檔定位問題,通過對比本文提出的普通卷積神經(jīng)網(wǎng)絡(luò)模型與殘差網(wǎng)絡(luò)模型,選擇殘差網(wǎng)絡(luò)來處理表單文檔的定位,并將殘差網(wǎng)絡(luò)與擴張卷積、Dropout技術(shù)相結(jié)合來對表單進行更好地定位。為了使網(wǎng)絡(luò)模型更具有泛化性,在實驗中所包含的文檔不止表單,還包括論文、雜志等,則此時對于文檔的定位并不依賴于文檔的內(nèi)容本身。本文將表單的定位問題處理為八個特征點的檢測問題,即... 

【文章來源】:武漢工程大學(xué)湖北省

【文章頁數(shù)】:66 頁

【學(xué)位級別】:碩士

【部分圖文】:

基于深度學(xué)習(xí)的表單識別系統(tǒng)的研究與實現(xiàn)


ReLU激活函數(shù)②非線性處理在線性系統(tǒng)中,改變輸入通常產(chǎn)生一個成比例的輸出,此時的系統(tǒng)

網(wǎng)絡(luò)結(jié)構(gòu)圖,整體流,定位算法,文檔


整體流程圖如圖 3.2 所示。圖 3.2 文檔定位算法整體流程圖3.2.1 實驗流程(1)角點檢測在本章中,首先使用擴張卷積殘差網(wǎng)絡(luò)來獲得四個預(yù)測的角點,即TL,TR,BR 和 BL,網(wǎng)絡(luò)結(jié)構(gòu)如圖 3.3 所示。圖 3.3 擴張卷積殘差網(wǎng)絡(luò)結(jié)構(gòu)圖以“ICDAR 2015 SmartDoc Challenge 1”數(shù)據(jù)庫中樣本圖為例,提取的四個角點如圖 3.4 所示。

網(wǎng)絡(luò)結(jié)構(gòu)圖,卷積,殘差,角點檢測


圖 3.2 文檔定位算法整體流程圖3.2.1 實驗流程(1)角點檢測在本章中,首先使用擴張卷積殘差網(wǎng)絡(luò)來獲得四個預(yù)測的角點,即TL,TR,BR 和 BL,網(wǎng)絡(luò)結(jié)構(gòu)如圖 3.3 所示。

【參考文獻】:
期刊論文
[1]基于深度學(xué)習(xí)的場景文字檢測與識別[J]. 白翔,楊明錕,石葆光,廖明輝.  中國科學(xué):信息科學(xué). 2018(05)
[2]基于深度殘差網(wǎng)絡(luò)的脫機手寫漢字識別研究[J]. 張帆,張良,劉星,張宇.  計算機測量與控制. 2017(12)
[3]基于Gabor特征和協(xié)同神經(jīng)網(wǎng)絡(luò)的車牌識別方法[J]. 石貴民,余文森,肖鐘捷.  河北大學(xué)學(xué)報(自然科學(xué)版). 2016(02)
[4]基于多尺度梯度及深度神經(jīng)網(wǎng)絡(luò)的漢字識別[J]. 潘煒深,金連文,馮子勇.  北京航空航天大學(xué)學(xué)報. 2015(04)
[5]基于多重卷積神經(jīng)網(wǎng)絡(luò)的大模式聯(lián)機手寫文字識別[J]. 葛明濤,王小麗,潘立武.  現(xiàn)代電子技術(shù). 2014(20)
[6]基于ART神經(jīng)網(wǎng)絡(luò)的漢字識別[J]. 李龍,戴鳳智,于春雨,李玢瑤,張峻霞.  天津科技大學(xué)學(xué)報. 2013(04)
[7]支持向量機的古漢字識別研究[J]. 孫華,李愛平.  電腦知識與技術(shù). 2013(18)
[8]基于改進BP神經(jīng)網(wǎng)絡(luò)的手寫字符識別[J]. 許宜申,顧濟華,陶智,吳迪,朱明誠.  通信技術(shù). 2011(05)
[9]利用OCR識別技術(shù)實現(xiàn)視頻中文字的提取[J]. 陳義,李言俊,孫小煒.  計算機工程與應(yīng)用. 2010(10)

碩士論文
[1]基于Tesseract的電子票據(jù)云平臺的設(shè)計與實現(xiàn)[D]. 王希晨.南京大學(xué) 2016
[2]深度學(xué)習(xí)及其在手寫漢字識別中的應(yīng)用研究[D]. 王有旺.華南理工大學(xué) 2014



本文編號:3051246

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/zidonghuakongzhilunwen/3051246.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶7071b***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com