天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

復(fù)雜表格文檔圖像的模板識(shí)別與提取

發(fā)布時(shí)間:2023-06-04 21:10
  隨著互聯(lián)網(wǎng)信息技術(shù)的發(fā)展,越來越多的組織機(jī)構(gòu)開始構(gòu)建信息化系統(tǒng)以實(shí)現(xiàn)業(yè)務(wù)流程的無紙化處理,但涉及跨機(jī)構(gòu)的協(xié)同業(yè)務(wù)時(shí),由于保密等因素的限制,跨機(jī)構(gòu)的信息化系統(tǒng)構(gòu)建困難,所以目前協(xié)同業(yè)務(wù)基本仍在使用紙質(zhì)表格文檔作為業(yè)務(wù)載體。機(jī)構(gòu)收到業(yè)務(wù)表格后,需要將表格信息錄入內(nèi)部信息化系統(tǒng),錄入工作以往由人工進(jìn)行,而由于近些年業(yè)務(wù)數(shù)量持續(xù)增加,人工錄入無法滿足業(yè)務(wù)時(shí)效性要求,所以紙質(zhì)表格文檔的自動(dòng)錄入愈發(fā)重要。自動(dòng)錄入主要包括文本識(shí)別和版式提取,目前文本識(shí)別技術(shù)已經(jīng)成熟,所以重點(diǎn)在于提取表格的版式,表格根據(jù)版式可分為有框線表格與無框線表格。通過影印掃描后得到表格圖像,本文的目的就是從表格圖像中提取出表格的版式。為提取出表格版式,本文定義了表格模板,通過提取模板實(shí)現(xiàn)表格結(jié)構(gòu)與內(nèi)容的自動(dòng)化識(shí)別。其中,有框線表格圖像的模板提取分為三步,檢測(cè)表格框線、還原表格結(jié)構(gòu)、提取標(biāo)題域,提取出的模板可用于對(duì)單張有框線表格圖像進(jìn)行分類;無框線表格圖像的模板提取也分為三步,提取表格文字塊、標(biāo)注訓(xùn)練語料、訓(xùn)練構(gòu)詞模型,提取出的模板可用于驗(yàn)證單張無框線表格圖像識(shí)別結(jié)果并糾正文字塊劃分錯(cuò)誤。本文設(shè)計(jì)并實(shí)現(xiàn)了復(fù)雜表格文檔圖像模板識(shí)別...

【文章頁數(shù)】:96 頁

【學(xué)位級(jí)別】:碩士

【文章目錄】:
摘要
ABSTRACT
第一章 緒論
    1.1 研究背景及意義
    1.2 論文研究?jī)?nèi)容
    1.3 主要工作內(nèi)容
    1.4 論文章節(jié)安排
第二章 相關(guān)技術(shù)研究
    2.1 有框線表格還原技術(shù)
        2.1.1 表格框線檢測(cè)技術(shù)
        2.1.2 表格結(jié)構(gòu)還原技術(shù)
    2.2 無框線表格還原技術(shù)
    2.3 圖像相似度匹配技術(shù)
        2.3.1 基于顏色直方圖的相似度算法
        2.3.2 基于尺度不變特征變換的相似度算法
        2.3.3 基于感知哈希的相似度算法
    2.4 小結(jié)
第三章 系統(tǒng)需求分析及總體設(shè)計(jì)
    3.1 系統(tǒng)需求分析
        3.1.1 系統(tǒng)概述
        3.1.2 系統(tǒng)功能性需求
        3.1.3 系統(tǒng)非功能性需求
    3.2 系統(tǒng)總體設(shè)計(jì)
        3.2.1 系統(tǒng)總體架構(gòu)
        3.2.2 系統(tǒng)模塊劃分
    3.3 小結(jié)
第四章 模板提取與管理子系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)
    4.1 模板提取模塊設(shè)計(jì)與實(shí)現(xiàn)
        4.1.1 有框線表格圖像模板提取
        4.1.2 無框線表格圖像模板提取
        4.1.3 任務(wù)執(zhí)行程序的設(shè)計(jì)與實(shí)現(xiàn)
    4.2 Web接口模塊設(shè)計(jì)與實(shí)現(xiàn)
    4.3 通信模塊設(shè)計(jì)與實(shí)現(xiàn)
    4.4 存儲(chǔ)模塊設(shè)計(jì)與實(shí)現(xiàn)
    4.5 小結(jié)
第五章 表格識(shí)別與分類子系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)
    5.1 識(shí)別分類模塊設(shè)計(jì)與實(shí)現(xiàn)
        5.1.1 有框線表格圖像的識(shí)別與分類
        5.1.2 無框線表格圖像的識(shí)別
    5.2 Web接口模塊設(shè)計(jì)與實(shí)現(xiàn)
    5.3 對(duì)模板子系統(tǒng)存儲(chǔ)模塊的補(bǔ)充
    5.4 小結(jié)
第六章 系統(tǒng)測(cè)試
    6.1 測(cè)試環(huán)境
    6.2 模板提取與管理子系統(tǒng)功能測(cè)試
    6.3 表格識(shí)別與分類子系統(tǒng)功能測(cè)試
    6.4 模板提取及表格識(shí)別準(zhǔn)確性測(cè)試
    6.5 小結(jié)
第七章 結(jié)束語
    7.1 全文總結(jié)
    7.2 問題與下一步工作
參考文獻(xiàn)
附錄
致謝
攻讀學(xué)位期間發(fā)表的學(xué)術(shù)論文目錄



本文編號(hào):3831021

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/shengwushengchang/3831021.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶39626***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com