自然場景圖像中文本提取技術研究
發(fā)布時間:2017-04-30 12:01
本文關鍵詞:自然場景圖像中文本提取技術研究,由筆耕文化傳播整理發(fā)布。
【摘要】:作為人類思想和情感的載體,文本包含著至關重要的信息。自然場景圖像中的文本提取在導航、敏感信息監(jiān)管、場景理解、人機交互、基于內容的圖像檢索技術等方面都有廣闊的應用前景,成為近年來研究的熱點。本文依托國家“十二五”863計劃主題項目“電信網(wǎng)安全系統(tǒng)(二期)”,圍繞自然場景圖像中文本提取中的兩個關鍵技術,文本檢測和文本識別分別進行研究,并最終構建成場景文本提取系統(tǒng)。主要工作和貢獻如下:1.提出了一種基于樹修剪和多特征融合的場景文本檢測算法。首先,提取出圖像中的邊緣疊加的最大穩(wěn)定極值區(qū)作為字符候選區(qū)域,針對這些區(qū)域往往存在大量的重復文本區(qū)域和非文本區(qū)域將會干擾后續(xù)檢測的問題,基于最大穩(wěn)定極值區(qū)構成的樹結構,利用父子節(jié)點的寬高比和面積比,將重復的極值區(qū)域剔除;然后,利用場景文本的筆畫特征和邊緣上的梯度直方圖特征在區(qū)分文本區(qū)域和非文本區(qū)域上的互補性,基于貝葉斯分類器對兩種特征進行融合以剔除非文本區(qū)域;最后再根據(jù)字符的顏色、筆畫寬度、大小等特征,設定規(guī)則作為相似性標準合并文本區(qū)域。實驗結果表明,本文檢測算法的綜合性能指標略高于同類方法,且處理速度有較大提升。2.提出了一種基于稀疏編碼直方圖的場景文本識別算法。在上述的場景文本檢測方法產生的候選文本區(qū)域內使用此方法進一步對文本進行識別。首先,根據(jù)圖像中文本外觀復雜多變等特點,采用稀疏編碼直方圖特征對字符外觀進行描述;然后,以構建稀疏編碼直方圖特征改進基于部件的樹結構模型用于描述字符結構,并使用該模型得到單個字符的檢測分數(shù);最后,在字符識別結果的基礎上,利用字符的檢測分數(shù),相鄰字符區(qū)域的空間位置信息和語言知識融合構建條件隨機場模型識別單詞。實驗結果表明,本文識別方法的識別率高出同類方法5.35%。3.基于本文提出的基于樹修剪和多特征融合的場景文本檢測算法以及基于稀疏編碼直方圖的場景文本識別方法,設計了場景文本提取系統(tǒng)的主要功能模塊、組成結構、處理流程等,并基于MATLAB進行仿真。最后,利用通用數(shù)據(jù)集和現(xiàn)網(wǎng)中采集到的圖片對系統(tǒng)性能進行了驗證。
【關鍵詞】:場景文本提取 最大穩(wěn)定極值區(qū) 貝葉斯分類器 可變形部件模型 條件隨機場模型 稀疏編碼直方圖
【學位授予單位】:解放軍信息工程大學
【學位級別】:碩士
【學位授予年份】:2015
【分類號】:TP391.41
【目錄】:
- 摘要4-5
- Abstract5-11
- 第一章 緒論11-17
- 1.1 研究背景及意義11-12
- 1.2 自然場景文本提取面臨的挑戰(zhàn)12-15
- 1.2.1 自然場景中的文本分類12-13
- 1.2.2 自然場景中文本提取面臨的挑戰(zhàn)13-14
- 1.2.3 現(xiàn)有自然場景文本提取方法存在的問題14-15
- 1.3 本文研究貢獻和組織結構15-17
- 1.3.1 本文主要貢獻15-16
- 1.3.2 本文組織結構16-17
- 第二章 場景文本提取方法概述17-23
- 2.1 場景文本檢測的研究現(xiàn)狀17-18
- 2.1.1 基于連通區(qū)域分析的方法17
- 2.1.2 基于滑動窗口分類的方法17-18
- 2.1.3 現(xiàn)有方法的對比分析18
- 2.2 場景文本識別的研究現(xiàn)狀18-19
- 2.2.1 字符識別18-19
- 2.2.2 單詞識別19
- 2.2.3 現(xiàn)有方法的對比分析19
- 2.3 常用數(shù)據(jù)集及算法評估指標19-22
- 2.3.1 數(shù)據(jù)集20-21
- 2.3.2 算法評估指標21-22
- 2.4 本章小結22-23
- 第三章 基于樹修剪和多特征融合的場景文本檢測23-31
- 3.1 場景文本檢測23-28
- 3.1.1 邊緣疊加的MSER提取23-24
- 3.1.2 基于MSER樹修剪的重復文本候選區(qū)域剔除24-25
- 3.1.3 基于貝葉斯多特征融合的非文本候選區(qū)域剔除25-27
- 3.1.4 基于文本結構特點的文本候選區(qū)域合并27-28
- 3.2 實驗結果及分析28-29
- 3.3 本章小結29-31
- 第四章 基于稀疏編碼直方圖的場景文本識別31-41
- 4.1 場景文本識別算法流程31
- 4.2 字符的稀疏編碼直方圖特征描述31-32
- 4.2.1 稀疏編碼表示局部特征描述子31-32
- 4.2.2 稀疏編碼直方圖聚合32
- 4.2.3 高維稀疏編碼描述子降維32
- 4.3 基于HSC-TSM的字符識別32-34
- 4.4 基于CRF模型的單詞識別34-36
- 4.4.1 基于樹結構的圖構建35
- 4.4.2 代價函數(shù)35
- 4.4.3 基于TRW-S算法的單詞推斷35-36
- 4.5 實驗結果及分析36-39
- 4.5.1 字符識別的結果及分析36-37
- 4.5.2 單詞識別的結果及分析37-39
- 4.6 本章小結39-41
- 第五章 場景文本提取系統(tǒng)的設計與實現(xiàn)41-47
- 5.1 系統(tǒng)總體設計41-44
- 5.1.1 系統(tǒng)主要功能41-42
- 5.1.2 系統(tǒng)組成結構42
- 5.1.3 系統(tǒng)流程42-44
- 5.2 系統(tǒng)性能測試及分析44-45
- 5.2.1 測試集構造44
- 5.2.2 測試結果與分析44-45
- 5.3 本章小結45-47
- 第六章 總結與展望47-49
- 6.1 本文的工作總結47-48
- 6.2 下一步研究工作展望48-49
- 致謝49-51
- 參考文獻51-57
- 作者簡歷 攻讀碩士學位期間完成的主要工作57
【參考文獻】
中國期刊全文數(shù)據(jù)庫 前3條
1 張偉偉;湯光明;孫怡峰;李曉利;;基于DPM的自然場景下漢字識別方法[J];計算機應用研究;2013年03期
2 何耀平;徐麗珍;;自然場景下交通標志的自動識別算法[J];微計算機信息;2010年04期
3 莊越挺,劉駿偉,吳飛,潘云鶴,張引;基于支持向量機的視頻字幕自動定位與提取[J];計算機輔助設計與圖形學學報;2002年08期
本文關鍵詞:自然場景圖像中文本提取技術研究,由筆耕文化傳播整理發(fā)布。
,本文編號:336791
本文鏈接:http://www.sikaile.net/shoufeilunwen/xixikjs/336791.html
最近更新
教材專著