中文票據(jù)圖像處理和智能識別技術(shù)研究
發(fā)布時間:2023-05-11 06:06
漢字由于本身具有字體風格多樣、字符集巨大、字符相似性高等特征,因此比英文字母更加難以識別,這就給識別研究帶來了很大的挑戰(zhàn)性。而中文票據(jù)則由于版面更為復雜包含各種印章、表格、不規(guī)則圖案等,因此比普通的標準中文文檔更具挑戰(zhàn)性。目前市場上雖然有各種型號的OCR設備,號稱識別率可達99.99%,但是在現(xiàn)實情況中,除名片、身份證等類的表面圖案復雜度低、面積較小、不易彎折、字體結(jié)構(gòu)比較單一的類別的目標物時比較容易識別,其它類似于票據(jù)類的薄紙質(zhì)類目標物,目前市場上的OCR產(chǎn)品對帶有中文的票據(jù)類目標物識別效果都不算太理想,有待進一步改進。本課題結(jié)合一些傳統(tǒng)圖像處理算法和目前性能比較好的幾個深度神經(jīng)網(wǎng)絡的算法,對傳統(tǒng)中文票據(jù)識別系統(tǒng)做了一些改進和優(yōu)化,本課題主要做了如下幾點的工作:首先,訓練樣本的制作部分,訓練數(shù)據(jù)集增廣的方法除了采用了傳統(tǒng)的仿射變換和加隨機噪聲的方法外,還引入了條件生成對抗網(wǎng)絡,對訓練樣本做了比較好的擴充,將十分有利于后面識別模型的訓練。其次,識別模型部分,采用了深度卷積神經(jīng)網(wǎng)絡,本課題將目前性能比較優(yōu)良的幾個神經(jīng)網(wǎng)絡分類算法架構(gòu),根據(jù)本課題的實際需求做了一下結(jié)構(gòu)上的調(diào)整,通過實驗我們...
【文章頁數(shù)】:66 頁
【學位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第一章 緒論
1.1 研究背景及意義
1.2 國內(nèi)外發(fā)展現(xiàn)狀
1.3 本文主要研究的內(nèi)容
第二章 票據(jù)識別系統(tǒng)相關理論知識
2.1 票據(jù)的去噪相關理論知識
2.1.1 RGB空間介紹
2.1.2 HSV空間介紹
2.2 感興趣文字區(qū)域定位相關原理
2.3 文字的切割部分相關原理
2.3.1 垂直投影法
2.3.2 OTSU自動閾值分割算法
2.4 數(shù)據(jù)集增廣相關原理
2.4.1 仿射變換
2.4.2 生成對抗網(wǎng)絡
2.5 識別算法相關原理
2.5.1 現(xiàn)有的識別算法
2.5.2 深度神經(jīng)網(wǎng)絡相關原理
2.6 糾錯算法相關原理
2.6.1 常規(guī)的統(tǒng)計學語言模型
2.6.2 LSTM網(wǎng)絡的介紹
第三章 文字切割與訓練字符集的獲取
3.1 原始票據(jù)圖片的預處理
3.1.1 原始票據(jù)在RGB域的分析
3.1.2 原始票據(jù)在HSV域的分析
3.2 感興趣文字區(qū)域的定位
3.2.1 霍夫變換直線檢測法
3.3 文字的切割
3.3.1 垂直投影法
3.3.2 改進型的連通域分割法
3.4 訓練樣本的制作
3.4.1 初始訓練集的制作
3.4.2 初略識別的模型創(chuàng)建
3.4.3 真實場景下的數(shù)據(jù)集的獲取
3.4.4 訓練集進一步增廣
第四章 識別和糾錯算法
4.1 識別算法
4.1.1 現(xiàn)有的識別算法
4.1.2 深度神經(jīng)網(wǎng)絡的方法
4.2 糾錯算法
4.2.1 常規(guī)的統(tǒng)計學語言模型
4.2.2 長短記憶網(wǎng)絡模型
4.3 算法模型的部署
第五章 系統(tǒng)設計與實驗結(jié)果分析
5.1 票據(jù)識別系統(tǒng)的流程
5.2 原始圖片的初步去噪實驗
5.3 文字區(qū)域的定位實驗
5.4 文字切割算法的驗證
5.5 識別模型和糾錯模型的測試
5.5.1 識別模型的單獨測試
5.5.2 識別模型和糾錯模型的聯(lián)合測試
5.6 系統(tǒng)測試
總結(jié)與展望
參考文獻
攻碩期間取得的成果
致謝
本文編號:3814317
【文章頁數(shù)】:66 頁
【學位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第一章 緒論
1.1 研究背景及意義
1.2 國內(nèi)外發(fā)展現(xiàn)狀
1.3 本文主要研究的內(nèi)容
第二章 票據(jù)識別系統(tǒng)相關理論知識
2.1 票據(jù)的去噪相關理論知識
2.1.1 RGB空間介紹
2.1.2 HSV空間介紹
2.2 感興趣文字區(qū)域定位相關原理
2.3 文字的切割部分相關原理
2.3.1 垂直投影法
2.3.2 OTSU自動閾值分割算法
2.4 數(shù)據(jù)集增廣相關原理
2.4.1 仿射變換
2.4.2 生成對抗網(wǎng)絡
2.5 識別算法相關原理
2.5.1 現(xiàn)有的識別算法
2.5.2 深度神經(jīng)網(wǎng)絡相關原理
2.6 糾錯算法相關原理
2.6.1 常規(guī)的統(tǒng)計學語言模型
2.6.2 LSTM網(wǎng)絡的介紹
第三章 文字切割與訓練字符集的獲取
3.1 原始票據(jù)圖片的預處理
3.1.1 原始票據(jù)在RGB域的分析
3.1.2 原始票據(jù)在HSV域的分析
3.2 感興趣文字區(qū)域的定位
3.2.1 霍夫變換直線檢測法
3.3 文字的切割
3.3.1 垂直投影法
3.3.2 改進型的連通域分割法
3.4 訓練樣本的制作
3.4.1 初始訓練集的制作
3.4.2 初略識別的模型創(chuàng)建
3.4.3 真實場景下的數(shù)據(jù)集的獲取
3.4.4 訓練集進一步增廣
第四章 識別和糾錯算法
4.1 識別算法
4.1.1 現(xiàn)有的識別算法
4.1.2 深度神經(jīng)網(wǎng)絡的方法
4.2 糾錯算法
4.2.1 常規(guī)的統(tǒng)計學語言模型
4.2.2 長短記憶網(wǎng)絡模型
4.3 算法模型的部署
第五章 系統(tǒng)設計與實驗結(jié)果分析
5.1 票據(jù)識別系統(tǒng)的流程
5.2 原始圖片的初步去噪實驗
5.3 文字區(qū)域的定位實驗
5.4 文字切割算法的驗證
5.5 識別模型和糾錯模型的測試
5.5.1 識別模型的單獨測試
5.5.2 識別模型和糾錯模型的聯(lián)合測試
5.6 系統(tǒng)測試
總結(jié)與展望
參考文獻
攻碩期間取得的成果
致謝
本文編號:3814317
本文鏈接:http://www.sikaile.net/kejilunwen/shengwushengchang/3814317.html
最近更新
教材專著