基于深度學(xué)習(xí)的自然場景文本檢測與識別研究
【文章頁數(shù)】:75 頁
【部分圖文】:
圖1.1基于MSER的自然場景文本檢測
了該領(lǐng)域研究的主要技術(shù)。1)傳統(tǒng)的自然場景文本檢測方法基于傳統(tǒng)的文本檢測技術(shù)包括處理連通域和處理滑動窗口的技術(shù)等。對于連通域的技術(shù)主要有最大穩(wěn)定極值區(qū)域[7](MSER)技術(shù)和Epshtein等人提出的筆畫寬度變換[8](SWT)技術(shù)等。SWT算法能夠獲得在規(guī)模和空間特征....
圖1.2基于Textboxes++任意方向排列的文本檢測
華中科技大學(xué)碩士學(xué)位論文Liao等人先是設(shè)計了Textboxes文本檢測方法[26],通過改進SSD網(wǎng)絡(luò),使得文本在每個區(qū)域存在可能性的計算速度得到提升。隨后他們改進之前的工作,設(shè)計了Textboxes++技術(shù)[27],并進一步改進網(wǎng)絡(luò)結(jié)構(gòu),把T....
圖1.3基于深度卷積神經(jīng)網(wǎng)絡(luò)的識別模型網(wǎng)絡(luò)結(jié)構(gòu)
華中科技大學(xué)碩士學(xué)位論文識別上[50]。該網(wǎng)絡(luò)通過深度卷積神經(jīng)網(wǎng)絡(luò)進行文本的特征提取,然后再采用遞歸神經(jīng)網(wǎng)絡(luò)取代語言模型對文本進行識別,可以識別帶標點的文本。然而該方法在文本較長的情況下識別率不高。隨后Shi等人采用的注意力模型來解決長文本問題[51]。
圖1.4基于字典搜索糾錯的端到端文字識別算法的結(jié)果
華中科技大學(xué)碩士學(xué)位論文就可以到達識別任務(wù)的方法,通過MSER提取圖像中的文本作為文本候選區(qū)域,再利用訓(xùn)練好的分類器過濾掉非文本區(qū)域,并把其他的文本候選區(qū)域放到字符識別模型中進行識別[7]。Matas等人對方法進行改進,引入了基于連通域文本的檢測方法,....
本文編號:3923869
本文鏈接:http://www.sikaile.net/kejilunwen/shengwushengchang/3923869.html