基于破損字符修復(fù)識別的文檔拼接工作研究
發(fā)布時間:2021-01-08 04:07
隨著深度學(xué)習(xí)時代的來臨,計算機視覺在許多語義理解任務(wù)上都取得了很好的成績,包括分類、檢測、分割。將破碎的文檔數(shù)據(jù)進(jìn)行拼接,并恢復(fù)出原狀是一個十分困難的問題。它涉及到計算機視覺和人工智能算法當(dāng)中的匹配、識別、大規(guī)模狀態(tài)空間當(dāng)中的搜索等問題。研究文檔拼接問題過程中涉及的上述這些技術(shù)除了其本身對計算機視覺和人工智能算法相關(guān)問題有重要的意義之外,解決文檔問題在考古、刑偵領(lǐng)域也有廣泛的應(yīng)用。本文注意到了文檔碎片條大多包含字符這一基本元素(完好字符或者破損字符),可以提供語義信息來實現(xiàn)文檔拼接工作。盡管光學(xué)字符識別技術(shù)已經(jīng)廣泛用于完好的字符,但在破損字符的識別上仍有難度。因此,本文試圖解決條形文檔重建工作,旨在通過修復(fù)識別碎片條邊緣上的破損字符,來完成文檔拼接重建工作。在這個問題當(dāng)中,我們將文檔拼接工作簡化為一類特殊的碎片,即假定為豎直切割的條形碎片條。另一個簡化為僅考慮英文字符和數(shù)字組成的文檔。本文主要研究了三個方面的內(nèi)容:(1)基于豎直切割的條形碎片條的文本檢測。(2)基于破損字符的修復(fù)識別工作。(3)基于豎直切割的條形碎片條的文檔匹配重建工作。因此,本文的主要貢獻(xiàn)如下:(1)設(shè)計了二階破損字...
【文章來源】:廈門大學(xué)福建省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:95 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 研究背景
1.2 研究問題
1.2.1 文檔拼接技術(shù)
1.2.2 字符識別技術(shù)
1.2.3 圖像修復(fù)技術(shù)
1.3 本文的主要研究內(nèi)容
1.4 本文的結(jié)構(gòu)安排
第二章 基于條形文檔的文本檢測
2.1 相關(guān)背景
2.2 行檢測算法
2.3 字符檢測算法
2.3.1 拼接字符分割
2.3.2 邊緣字符分割
2.4 實驗效果
2.4.1 行檢測效果
2.4.2 字符檢測效果
2.5 本章小結(jié)
第三章 破損字符修復(fù)識別器
3.1 相關(guān)背景
3.1.1 現(xiàn)有圖像修復(fù)技術(shù)的不足
3.1.2 條件生成對抗網(wǎng)絡(luò)
3.1.3 基于分類的生成對抗網(wǎng)絡(luò)
3.2 破損字符修復(fù)識別器
3.2.1 框架設(shè)計
3.2.2 整體識別策略
3.3 破損字符字形預(yù)測器
3.3.1 整體架構(gòu)
3.3.2 損失函數(shù)
3.3.3 模型設(shè)計
3.4 破損字符字體修復(fù)識別器
3.4.1 整體架構(gòu)
3.4.2 損失函數(shù)
3.4.3 模型設(shè)計
3.5 實驗設(shè)置
3.5.1 數(shù)據(jù)集
3.5.2 訓(xùn)練策略
3.5.3 掩模設(shè)計
3.5.4 評估方式
3.6 實驗效果
3.6.1 破損字符修復(fù)識別器實驗
3.6.2 破損字符字形預(yù)測器實驗
3.6.3 破損字符字體修復(fù)識別器實驗
3.7 本章小結(jié)
第四章 條形文檔拼接匹配算法
4.1 相關(guān)背景
4.2 局部匹配問題
4.3 全局重組搜索問題
4.3.1 排除無關(guān)序列方法
4.3.2 擇優(yōu)匹配方法
4.4 實驗設(shè)置
4.4.1 數(shù)據(jù)集
4.4.2 評估方式
4.5 實驗效果
4.5.1 文檔拼接實驗
4.5.2 破損字符修復(fù)識別器修復(fù)實驗
4.5.3 局部匹配實驗
4.5.4 全局重組搜索實驗
4.6 本章小結(jié)
第五章 總結(jié)與展望
5.1 總結(jié)
5.2 展望
參考文獻(xiàn)
致謝
本文編號:2963879
【文章來源】:廈門大學(xué)福建省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:95 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 研究背景
1.2 研究問題
1.2.1 文檔拼接技術(shù)
1.2.2 字符識別技術(shù)
1.2.3 圖像修復(fù)技術(shù)
1.3 本文的主要研究內(nèi)容
1.4 本文的結(jié)構(gòu)安排
第二章 基于條形文檔的文本檢測
2.1 相關(guān)背景
2.2 行檢測算法
2.3 字符檢測算法
2.3.1 拼接字符分割
2.3.2 邊緣字符分割
2.4 實驗效果
2.4.1 行檢測效果
2.4.2 字符檢測效果
2.5 本章小結(jié)
第三章 破損字符修復(fù)識別器
3.1 相關(guān)背景
3.1.1 現(xiàn)有圖像修復(fù)技術(shù)的不足
3.1.2 條件生成對抗網(wǎng)絡(luò)
3.1.3 基于分類的生成對抗網(wǎng)絡(luò)
3.2 破損字符修復(fù)識別器
3.2.1 框架設(shè)計
3.2.2 整體識別策略
3.3 破損字符字形預(yù)測器
3.3.1 整體架構(gòu)
3.3.2 損失函數(shù)
3.3.3 模型設(shè)計
3.4 破損字符字體修復(fù)識別器
3.4.1 整體架構(gòu)
3.4.2 損失函數(shù)
3.4.3 模型設(shè)計
3.5 實驗設(shè)置
3.5.1 數(shù)據(jù)集
3.5.2 訓(xùn)練策略
3.5.3 掩模設(shè)計
3.5.4 評估方式
3.6 實驗效果
3.6.1 破損字符修復(fù)識別器實驗
3.6.2 破損字符字形預(yù)測器實驗
3.6.3 破損字符字體修復(fù)識別器實驗
3.7 本章小結(jié)
第四章 條形文檔拼接匹配算法
4.1 相關(guān)背景
4.2 局部匹配問題
4.3 全局重組搜索問題
4.3.1 排除無關(guān)序列方法
4.3.2 擇優(yōu)匹配方法
4.4 實驗設(shè)置
4.4.1 數(shù)據(jù)集
4.4.2 評估方式
4.5 實驗效果
4.5.1 文檔拼接實驗
4.5.2 破損字符修復(fù)識別器修復(fù)實驗
4.5.3 局部匹配實驗
4.5.4 全局重組搜索實驗
4.6 本章小結(jié)
第五章 總結(jié)與展望
5.1 總結(jié)
5.2 展望
參考文獻(xiàn)
致謝
本文編號:2963879
本文鏈接:http://www.sikaile.net/kejilunwen/shengwushengchang/2963879.html
最近更新
教材專著