基于數(shù)字圖像處理的框圖識別技術(shù)研究
發(fā)布時間:2022-07-27 13:10
隨著計算機(jī)技術(shù)的發(fā)展以及智能手機(jī)與電子閱讀設(shè)備的逐漸普及,電子文檔已成為人們主要獲取信息的方式之一。大部分印刷體文檔是以圖片形式進(jìn)行存儲的。得益于光學(xué)字符識別技術(shù)的發(fā)展,人們可以直接從圖像中提取需要的數(shù)據(jù)進(jìn)行存儲、處理和檢索,減輕人手工錄入負(fù)擔(dān)。然而,文檔中還存在著大量框圖類圖像,現(xiàn)有的OCR技術(shù)難以直接提取其表達(dá)信息。目前,常規(guī)的印刷體框圖識別方案主要采用傳統(tǒng)方法通過檢測框圖的輪廓、角點,再依賴人工定義的特征進(jìn)行特征提取,對框圖中的關(guān)鍵區(qū)域進(jìn)行定位。但實際中框圖種類繁多,情況可能十分復(fù)雜,可能會存在斷邊、粘連或其他線元干擾等問題,這些情況都是傳統(tǒng)方法難以處理的?驁D還具有復(fù)雜的二維結(jié)構(gòu),識別中還得考慮圖元之間的連接關(guān)系。如何正確解析框圖的結(jié)構(gòu)關(guān)系也是該領(lǐng)域面臨的難點。本文通過分析研究框圖識別中幾個重要問題:框圖的關(guān)鍵區(qū)域檢測,框圖內(nèi)的字符切分與識別,框圖的結(jié)構(gòu)識別,將數(shù)字圖像處理以及深度學(xué)習(xí)的相關(guān)技術(shù)應(yīng)用到框圖識別中,最終完成本文的框圖識別技術(shù)研究。主要闡述了如何對收集到的數(shù)據(jù)集進(jìn)行標(biāo)注以及數(shù)據(jù)增強(qiáng),降噪等過程,使用基于YOLOv3深度學(xué)習(xí)目標(biāo)檢測算法對框圖圖像的關(guān)鍵區(qū)域進(jìn)行檢測,解...
【文章頁數(shù)】:67 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第1章 緒論
1.1 課題背景及研究的目的和意義
1.2 國內(nèi)外研究現(xiàn)狀
1.3 本文研究內(nèi)容
1.4 論文章節(jié)安排
第2章 框圖識別的相關(guān)技術(shù)和理論
2.1 引言
2.2 框圖類型與結(jié)構(gòu)分析
2.2.1 框圖主要類別介紹
2.2.2 框圖的結(jié)構(gòu)分析與描述
2.3 圖像特征提取與目標(biāo)檢測技術(shù)
2.3.1 傳統(tǒng)特征提取方法
2.3.2 深度特征提取方法
2.3.3 基于深度學(xué)習(xí)的目標(biāo)檢測技術(shù)
2.4 字符切分與識別方法
2.5 本章小結(jié)
第3章 基于YOLOv3的框圖圖像關(guān)鍵區(qū)域檢測
3.1 引言
3.2 圖像降噪處理
3.3 數(shù)據(jù)集制作
3.4 YOLOv3算法
3.4.1 YOLOv3網(wǎng)絡(luò)結(jié)構(gòu)
3.4.2 YOLOv3邊框回歸
3.4.3 YOLOv3損失函數(shù)
3.5 YOLOv3多尺度目標(biāo)檢測的優(yōu)化
3.5.1 目標(biāo)先驗框聚類分析
3.5.2 YOLOv3跨尺度檢測改進(jìn)
3.6 實驗結(jié)果及分析
3.6.1 評價指標(biāo)
3.6.2 實驗環(huán)境及主要參數(shù)
3.6.3 實驗結(jié)果及分析
3.7 本章小結(jié)
第4章 框圖中字符與結(jié)構(gòu)識別方法研究
4.1 引言
4.2 圖像二值化處理
4.3 字符切分
4.3.1 投影法粗切分
4.3.2 粘連字符細(xì)切分
4.3.3 字符切分實驗結(jié)果
4.4 基于卷積神經(jīng)網(wǎng)絡(luò)的字符識別
4.4.1 LeNet-5網(wǎng)絡(luò)結(jié)構(gòu)
4.4.2 添加批標(biāo)準(zhǔn)化層
4.4.3 字符分類實驗結(jié)果
4.5 箭頭與圖元連接線關(guān)系判定
4.5.1 箭頭與圖元關(guān)系的判定
4.5.2 連接線提取及與箭頭關(guān)系判定
4.6 框圖整體結(jié)構(gòu)識別
4.6.1 連接線細(xì)化處理
4.6.2 基本圖元邏輯關(guān)系判定
4.6.3 框圖識別結(jié)果分析
4.7 本章小結(jié)
結(jié)論
參考文獻(xiàn)
致謝
本文編號:3665517
【文章頁數(shù)】:67 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第1章 緒論
1.1 課題背景及研究的目的和意義
1.2 國內(nèi)外研究現(xiàn)狀
1.3 本文研究內(nèi)容
1.4 論文章節(jié)安排
第2章 框圖識別的相關(guān)技術(shù)和理論
2.1 引言
2.2 框圖類型與結(jié)構(gòu)分析
2.2.1 框圖主要類別介紹
2.2.2 框圖的結(jié)構(gòu)分析與描述
2.3 圖像特征提取與目標(biāo)檢測技術(shù)
2.3.1 傳統(tǒng)特征提取方法
2.3.2 深度特征提取方法
2.3.3 基于深度學(xué)習(xí)的目標(biāo)檢測技術(shù)
2.4 字符切分與識別方法
2.5 本章小結(jié)
第3章 基于YOLOv3的框圖圖像關(guān)鍵區(qū)域檢測
3.1 引言
3.2 圖像降噪處理
3.3 數(shù)據(jù)集制作
3.4 YOLOv3算法
3.4.1 YOLOv3網(wǎng)絡(luò)結(jié)構(gòu)
3.4.2 YOLOv3邊框回歸
3.4.3 YOLOv3損失函數(shù)
3.5 YOLOv3多尺度目標(biāo)檢測的優(yōu)化
3.5.1 目標(biāo)先驗框聚類分析
3.5.2 YOLOv3跨尺度檢測改進(jìn)
3.6 實驗結(jié)果及分析
3.6.1 評價指標(biāo)
3.6.2 實驗環(huán)境及主要參數(shù)
3.6.3 實驗結(jié)果及分析
3.7 本章小結(jié)
第4章 框圖中字符與結(jié)構(gòu)識別方法研究
4.1 引言
4.2 圖像二值化處理
4.3 字符切分
4.3.1 投影法粗切分
4.3.2 粘連字符細(xì)切分
4.3.3 字符切分實驗結(jié)果
4.4 基于卷積神經(jīng)網(wǎng)絡(luò)的字符識別
4.4.1 LeNet-5網(wǎng)絡(luò)結(jié)構(gòu)
4.4.2 添加批標(biāo)準(zhǔn)化層
4.4.3 字符分類實驗結(jié)果
4.5 箭頭與圖元連接線關(guān)系判定
4.5.1 箭頭與圖元關(guān)系的判定
4.5.2 連接線提取及與箭頭關(guān)系判定
4.6 框圖整體結(jié)構(gòu)識別
4.6.1 連接線細(xì)化處理
4.6.2 基本圖元邏輯關(guān)系判定
4.6.3 框圖識別結(jié)果分析
4.7 本章小結(jié)
結(jié)論
參考文獻(xiàn)
致謝
本文編號:3665517
本文鏈接:http://www.sikaile.net/kejilunwen/shengwushengchang/3665517.html
最近更新
教材專著