基于OCR的批量發(fā)票識別系統研究與實現
發(fā)布時間:2021-07-13 02:17
增值稅發(fā)票是一種記錄交易活動的會計憑證,是公司做賬的依據,同時也是繳稅的費用憑證,因此公司通常需要財務部門進行發(fā)票的管理工作。然而發(fā)票管理工作繁瑣且乏味,其工作量大且記錄信息多,人為記錄需要消耗大量的人力物力。隨著OCR技術的發(fā)展,許多領域在文本識別方面取得新的突破,利用OCR技術進行發(fā)票信息的自動識別記錄,能有效提高財務人員的工作效率。本文通過對發(fā)票版面進行分析,確定發(fā)票識別系統的任務,然后根據任務要求對OCR系統各模塊進行研究,設計了一款基于OCR的批量發(fā)票識別系統。首先采用掃描儀對發(fā)票進行圖像采集,掃描儀采集圖像效果清晰,并且能完成多張發(fā)票掃描的工作,符合本系統的要求。對發(fā)票圖像進行圖像預處理,包括歸一化大小,判斷發(fā)票是否需要翻轉,二值化,形態(tài)學處理等。然后對文本定位算法進行探究,由于信息是由打印機打印在發(fā)票上,因為擺放原因信息時有偏移,并且發(fā)票頁面常帶有未知干擾,不利于模板匹配定位、連通域算法定位。本文設計了多層自編碼+SVM的定位算法,能有效解決以上問題,成功完成信息文本定位。再采用改進的投影切割法完成單個字符切割。對于字符識別,由于本系統識別的信息均為數字打印字符,為了提高...
【文章來源】:廣東工業(yè)大學廣東省
【文章頁數】:68 頁
【學位級別】:碩士
【部分圖文】:
增值稅發(fā)票樣圖
圖 2-2 發(fā)票版面分析Fig. 2-2 Invoice layout analysis 系統設計與技術難點一個基于 OCR 的發(fā)票識別系統,基本任務是:采集發(fā)票圖像,自動識別的重要信息,對信息進行檢驗,最后將數據按順序記錄于 Excel 表中。按,系統由圖 2-3 中七個模塊構成。圖 2-3 系統框架圖
7圖 2-3 系統框架圖Fig. 2-3 System framework以看到,基于 OCR 的發(fā)票識別系統應包括以下模塊:入模塊:通過采集設備獲取發(fā)票圖像并輸入;處理模塊:包括歸一化處理、形態(tài)學處理等;位模塊:準確地對發(fā)票的重要信息進行定位;割模塊:對定位完成的信息進行單個字符切割;別模塊:對切割完成的單個字符進行識別;錄模塊:將識別到的信息,記錄到 Excel 對應位置;
【參考文獻】:
期刊論文
[1]電子發(fā)票對企業(yè)財務核算和管理的影響與建議[J]. 劉春雨. 現代營銷(下旬刊). 2019(02)
[2]電子發(fā)票對企業(yè)會計核算影響[J]. 聶艷. 財會學習. 2019(05)
[3]一種基于MSER和SWT的新型車牌檢測識別方法研究[J]. 王艷,謝廣蘇,沈曉宇. 計量學報. 2019(01)
[4]基于MSER與邊緣投影的車牌定位算法[J]. 鄭貴林,吳黃子桑. 計算機工程與設計. 2019(01)
[5]一種基于形態(tài)學與區(qū)域分析的車牌定位方法[J]. 羅山. 山西電子技術. 2018(06)
[6]基于數學形態(tài)學的差分圖像目標檢測算法研究[J]. 秦雨萍,張雙,張萍,尹福成. 艦船電子工程. 2018(04)
[7]基于SVM多分類的車牌相似字符識別方法研究[J]. 方玲玉,龔文友. 計算機與數字工程. 2017(07)
[8]基于圖像識別的移動端原始憑證電子化智能填單系統[J]. 魯靜,宋斌,向萬紅,吳士泓,孫曉東,唐靜. 計算機工程. 2017(06)
[9]文本檢測算法的發(fā)展與挑戰(zhàn)[J]. 李翌昕,馬盡文. 信號處理. 2017(04)
[10]局部HOG和分層LBP特征融合的車牌字符識別[J]. 高聰,王福龍. 計算機系統應用. 2017(04)
碩士論文
[1]基于MSER和隨機森林的實時交通標志的檢測和識別[D]. 付文彬.江西理工大學 2018
[2]基于深度學習的發(fā)票自動識別系統的設計與實現[D]. 黃志文.廣東工業(yè)大學 2018
[3]基于深度學習的印刷體漢字識別[D]. 劉冬民.廣州大學 2018
[4]復雜背景下證件識別技術的研究與實現[D]. 張翮.電子科技大學 2017
[5]基于目標表觀和幾何建模的物體檢測研究及應用[D]. 李健.浙江大學 2017
[6]基于OCR技術的原始憑證電子化管理系統的設計與實現[D]. 安然.吉林大學 2016
[7]基于視頻序列的運動人體檢測和跟蹤[D]. 吳亞順.西華大學 2015
[8]面向增值稅發(fā)票的圖像自動處理技術研究[D]. 謝志鋼.上海交通大學 2015
[9]機打普通商業(yè)發(fā)票識別系統研究[D]. 虞飛.華南理工大學 2013
[10]SVM多分類關鍵技術研究及其在車牌字符識別中的應用[D]. 郭萍萍.大連海事大學 2012
本文編號:3281133
【文章來源】:廣東工業(yè)大學廣東省
【文章頁數】:68 頁
【學位級別】:碩士
【部分圖文】:
增值稅發(fā)票樣圖
圖 2-2 發(fā)票版面分析Fig. 2-2 Invoice layout analysis 系統設計與技術難點一個基于 OCR 的發(fā)票識別系統,基本任務是:采集發(fā)票圖像,自動識別的重要信息,對信息進行檢驗,最后將數據按順序記錄于 Excel 表中。按,系統由圖 2-3 中七個模塊構成。圖 2-3 系統框架圖
7圖 2-3 系統框架圖Fig. 2-3 System framework以看到,基于 OCR 的發(fā)票識別系統應包括以下模塊:入模塊:通過采集設備獲取發(fā)票圖像并輸入;處理模塊:包括歸一化處理、形態(tài)學處理等;位模塊:準確地對發(fā)票的重要信息進行定位;割模塊:對定位完成的信息進行單個字符切割;別模塊:對切割完成的單個字符進行識別;錄模塊:將識別到的信息,記錄到 Excel 對應位置;
【參考文獻】:
期刊論文
[1]電子發(fā)票對企業(yè)財務核算和管理的影響與建議[J]. 劉春雨. 現代營銷(下旬刊). 2019(02)
[2]電子發(fā)票對企業(yè)會計核算影響[J]. 聶艷. 財會學習. 2019(05)
[3]一種基于MSER和SWT的新型車牌檢測識別方法研究[J]. 王艷,謝廣蘇,沈曉宇. 計量學報. 2019(01)
[4]基于MSER與邊緣投影的車牌定位算法[J]. 鄭貴林,吳黃子桑. 計算機工程與設計. 2019(01)
[5]一種基于形態(tài)學與區(qū)域分析的車牌定位方法[J]. 羅山. 山西電子技術. 2018(06)
[6]基于數學形態(tài)學的差分圖像目標檢測算法研究[J]. 秦雨萍,張雙,張萍,尹福成. 艦船電子工程. 2018(04)
[7]基于SVM多分類的車牌相似字符識別方法研究[J]. 方玲玉,龔文友. 計算機與數字工程. 2017(07)
[8]基于圖像識別的移動端原始憑證電子化智能填單系統[J]. 魯靜,宋斌,向萬紅,吳士泓,孫曉東,唐靜. 計算機工程. 2017(06)
[9]文本檢測算法的發(fā)展與挑戰(zhàn)[J]. 李翌昕,馬盡文. 信號處理. 2017(04)
[10]局部HOG和分層LBP特征融合的車牌字符識別[J]. 高聰,王福龍. 計算機系統應用. 2017(04)
碩士論文
[1]基于MSER和隨機森林的實時交通標志的檢測和識別[D]. 付文彬.江西理工大學 2018
[2]基于深度學習的發(fā)票自動識別系統的設計與實現[D]. 黃志文.廣東工業(yè)大學 2018
[3]基于深度學習的印刷體漢字識別[D]. 劉冬民.廣州大學 2018
[4]復雜背景下證件識別技術的研究與實現[D]. 張翮.電子科技大學 2017
[5]基于目標表觀和幾何建模的物體檢測研究及應用[D]. 李健.浙江大學 2017
[6]基于OCR技術的原始憑證電子化管理系統的設計與實現[D]. 安然.吉林大學 2016
[7]基于視頻序列的運動人體檢測和跟蹤[D]. 吳亞順.西華大學 2015
[8]面向增值稅發(fā)票的圖像自動處理技術研究[D]. 謝志鋼.上海交通大學 2015
[9]機打普通商業(yè)發(fā)票識別系統研究[D]. 虞飛.華南理工大學 2013
[10]SVM多分類關鍵技術研究及其在車牌字符識別中的應用[D]. 郭萍萍.大連海事大學 2012
本文編號:3281133
本文鏈接:http://www.sikaile.net/kejilunwen/shengwushengchang/3281133.html
最近更新
教材專著