基于深度學(xué)習(xí)的文本識(shí)別與檢索應(yīng)用研究
發(fā)布時(shí)間:2021-12-11 10:39
隨著智能手機(jī)等便攜式拍攝設(shè)備的不斷普及,圖像正越來(lái)越多的被人們當(dāng)作信息載體的首選,計(jì)算機(jī)視覺(jué)技術(shù)的不斷革新,使得無(wú)人駕駛、人機(jī)交互、智能安防的等新興人工智能應(yīng)用場(chǎng)景也不斷增加。海量圖片信息時(shí)代的到來(lái)和不斷增加的人工智能應(yīng)用場(chǎng)景,如何讓計(jì)算機(jī)準(zhǔn)確的理解圖像信息正受到人們?cè)絹?lái)越多的關(guān)注。而文本元素因?yàn)槠湄S富的語(yǔ)義信息,對(duì)自然場(chǎng)景圖像中文本的檢測(cè)識(shí)別可以幫助計(jì)算機(jī)更準(zhǔn)確的理解圖像信息。另一方面,傳統(tǒng)的文本識(shí)別技術(shù)僅適用于各類字符大小規(guī)范、字體統(tǒng)一以及文本間隔固定的印刷體文檔識(shí)別,如各類證件、票據(jù)、文檔等。而對(duì)于存在于自然場(chǎng)景中的文本信息,由于背景復(fù)雜、字體字號(hào)多變以及噪聲多樣等原因,使得傳統(tǒng)的文本識(shí)別方式難以進(jìn)行有效的精準(zhǔn)識(shí)別。同時(shí),帶有文本信息的圖像數(shù)據(jù)量的不斷擴(kuò)大,對(duì)圖像數(shù)據(jù)的分類、編碼、存儲(chǔ)、檢索和維護(hù)等過(guò)程也提出了更高的要求,特別是圖像數(shù)據(jù)的檢索,針對(duì)圖像理解中的文本元素和證件、車牌、票據(jù)等文本載體中的文本內(nèi)容,構(gòu)建一個(gè)通過(guò)檢索文本信息從海量的圖像數(shù)據(jù)中得到包含文本信息的目標(biāo)圖像的檢索應(yīng)用也是一個(gè)新興的應(yīng)用方向。隨著近年來(lái)深度學(xué)習(xí)技術(shù)的不斷發(fā)展,區(qū)別于依靠人工經(jīng)驗(yàn)提取的特征,深度學(xué)習(xí)...
【文章來(lái)源】:大連海事大學(xué)遼寧省 211工程院校
【文章頁(yè)數(shù)】:90 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖1.1文本區(qū)域噪音嚴(yán)重??Fig.?1.1?A?lot?of?noise?in?the?text?area??-2?-??
?大連海事大學(xué)碩士學(xué)位論文???(3)文本樣式多樣、分布隨機(jī)。文檔圖像中文本信息布局相對(duì)固定,文本按行排??列,且行與行、字符與字符之間的間隔相對(duì)均勻,但在自然場(chǎng)景中的文本,文本位置、??文字大小與間隔甚至文字排列都十分隨意,有些廣告文本為了吸引眼球,一段文本內(nèi)容??常常結(jié)合多種文字大小和排列方式。一些手寫(xiě)體或者藝術(shù)體文本中還常常通過(guò)字符與字??符黏連、對(duì)字符進(jìn)行扭曲、變形和增加陰影邊框等方式產(chǎn)生各式各樣的文字效果,如圖??1.2所示。??圖1.2文本樣式多樣、分布隨機(jī)??Fig.?1.2?Variety?of?text?styles?and?random?text?positions??1.2.?2文本檢測(cè)識(shí)別技術(shù)研究現(xiàn)狀??傳統(tǒng)的文本檢測(cè)識(shí)別一般分為三個(gè)步驟:圖像預(yù)處理、文木區(qū)域檢測(cè)、文本識(shí)別。??其中文本識(shí)別又可以細(xì)分為特征提娶字符識(shí)別、結(jié)果矯正等[3]。??圖像預(yù)處理過(guò)程主要是為減少圖像中的無(wú)用信息,以便后續(xù)進(jìn)行文本特征提取和學(xué)??習(xí),預(yù)處理通常包括灰度化、降噪、二值化、文本尺度歸一化、傾斜校正等;叶然??要針對(duì)彩色圖像,二值化處理使得圖像只保留黑白兩種色彩,降噪是為了去除二值化后??留下的噪聲數(shù)據(jù),文本尺度歸一化是為了將文字圖像規(guī)整到統(tǒng)一的尺寸下方便進(jìn)行文字??識(shí)別,對(duì)傾斜圖像還需要進(jìn)行傾斜校正。??傳統(tǒng)的文本檢測(cè)算法主要根據(jù)兩類文本特征進(jìn)行檢測(cè):文本的節(jié)_特征和文木的顏??色亮度特征。由于文本筆畫(huà)的寬度、紋理、顏色和強(qiáng)度等都與背景饤較人的差異,所以??筆畫(huà)信息常作為文本檢測(cè)一個(gè)重要特征。自然場(chǎng)景中的文本顏色和亮度信息也常作為區(qū)??分背景和文本的一大依據(jù),其中自然場(chǎng)景屮文木信息,常常令邊緣顏色與
在相似度閾值為0.8的情況下在人工標(biāo)注圖像上達(dá)到了?70.6%的識(shí)別準(zhǔn)確率。??(4)實(shí)現(xiàn)了一個(gè)基于文本識(shí)別的圖像檢索應(yīng)用。通過(guò)python擴(kuò)展包Piexif操作圖??像Exif信息,在基于python的Web開(kāi)發(fā)微框架Flask上構(gòu)建了一個(gè)圖像檢索應(yīng)用,應(yīng)??用通過(guò)文本檢測(cè)識(shí)別模型得到圖像中文本信息并寫(xiě)入圖像Exif信息,并利用檢索詞匹配??Exif信息的方式得到目標(biāo)圖像,最后介紹了應(yīng)用實(shí)現(xiàn)的流程和方法,并對(duì)應(yīng)用各個(gè)功能??進(jìn)行了展示。??1.3.2本文結(jié)構(gòu)安排??文本結(jié)構(gòu)安排如圖1.4所示,章節(jié)具體內(nèi)容如下:??廣?1緒論?、??自然場(chǎng)杲下傳統(tǒng)OCR?|圖?檢索應(yīng)用仍是??技術(shù)準(zhǔn)確率急劇下降1新興方向??L?!?)??^?|??3基于CTPN的文本?^?'??習(xí)??卜基于文本識(shí)別??鱗理^?4;;二:二'…1的圖像檢素應(yīng)用j??L?J?^的文本識(shí)別模型」??I?I??6總結(jié)與展望??圖1.4結(jié)構(gòu)安排??Fig.?1.4?Chapter?structure??第一章緒論。本章首先講述了課題的研宄背景和意義;诂F(xiàn)實(shí)背景,著重強(qiáng)調(diào)??了文本檢測(cè)識(shí)別與圖像檢索研宄的價(jià)值與意義。分析與調(diào)研了文本檢測(cè)識(shí)別相關(guān)技術(shù)的??-8-??
【參考文獻(xiàn)】:
期刊論文
[1]自然場(chǎng)景圖像中的文本檢測(cè)方法研究[J]. 李東勤,王芳,周萬(wàn)懷. 重慶科技學(xué)院學(xué)報(bào)(自然科學(xué)版). 2016(06)
[2]漢字識(shí)別方法綜述[J]. 孫華,張航. 計(jì)算機(jī)工程. 2010(20)
[3]用于手寫(xiě)漢字識(shí)別的級(jí)聯(lián)MQDF分類器[J]. 付強(qiáng),丁曉青,劉長(zhǎng)松. 清華大學(xué)學(xué)報(bào)(自然科學(xué)版)網(wǎng)絡(luò).預(yù)覽. 2008(10)
碩士論文
[1]基于深度學(xué)習(xí)的圖像文本識(shí)別系統(tǒng)研究與實(shí)現(xiàn)[D]. 吳曉瑋.北京郵電大學(xué) 2018
[2]基于深度學(xué)習(xí)的自然場(chǎng)景文字識(shí)別[D]. 黃攀.浙江大學(xué) 2016
本文編號(hào):3534528
【文章來(lái)源】:大連海事大學(xué)遼寧省 211工程院校
【文章頁(yè)數(shù)】:90 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖1.1文本區(qū)域噪音嚴(yán)重??Fig.?1.1?A?lot?of?noise?in?the?text?area??-2?-??
?大連海事大學(xué)碩士學(xué)位論文???(3)文本樣式多樣、分布隨機(jī)。文檔圖像中文本信息布局相對(duì)固定,文本按行排??列,且行與行、字符與字符之間的間隔相對(duì)均勻,但在自然場(chǎng)景中的文本,文本位置、??文字大小與間隔甚至文字排列都十分隨意,有些廣告文本為了吸引眼球,一段文本內(nèi)容??常常結(jié)合多種文字大小和排列方式。一些手寫(xiě)體或者藝術(shù)體文本中還常常通過(guò)字符與字??符黏連、對(duì)字符進(jìn)行扭曲、變形和增加陰影邊框等方式產(chǎn)生各式各樣的文字效果,如圖??1.2所示。??圖1.2文本樣式多樣、分布隨機(jī)??Fig.?1.2?Variety?of?text?styles?and?random?text?positions??1.2.?2文本檢測(cè)識(shí)別技術(shù)研究現(xiàn)狀??傳統(tǒng)的文本檢測(cè)識(shí)別一般分為三個(gè)步驟:圖像預(yù)處理、文木區(qū)域檢測(cè)、文本識(shí)別。??其中文本識(shí)別又可以細(xì)分為特征提娶字符識(shí)別、結(jié)果矯正等[3]。??圖像預(yù)處理過(guò)程主要是為減少圖像中的無(wú)用信息,以便后續(xù)進(jìn)行文本特征提取和學(xué)??習(xí),預(yù)處理通常包括灰度化、降噪、二值化、文本尺度歸一化、傾斜校正等;叶然??要針對(duì)彩色圖像,二值化處理使得圖像只保留黑白兩種色彩,降噪是為了去除二值化后??留下的噪聲數(shù)據(jù),文本尺度歸一化是為了將文字圖像規(guī)整到統(tǒng)一的尺寸下方便進(jìn)行文字??識(shí)別,對(duì)傾斜圖像還需要進(jìn)行傾斜校正。??傳統(tǒng)的文本檢測(cè)算法主要根據(jù)兩類文本特征進(jìn)行檢測(cè):文本的節(jié)_特征和文木的顏??色亮度特征。由于文本筆畫(huà)的寬度、紋理、顏色和強(qiáng)度等都與背景饤較人的差異,所以??筆畫(huà)信息常作為文本檢測(cè)一個(gè)重要特征。自然場(chǎng)景中的文本顏色和亮度信息也常作為區(qū)??分背景和文本的一大依據(jù),其中自然場(chǎng)景屮文木信息,常常令邊緣顏色與
在相似度閾值為0.8的情況下在人工標(biāo)注圖像上達(dá)到了?70.6%的識(shí)別準(zhǔn)確率。??(4)實(shí)現(xiàn)了一個(gè)基于文本識(shí)別的圖像檢索應(yīng)用。通過(guò)python擴(kuò)展包Piexif操作圖??像Exif信息,在基于python的Web開(kāi)發(fā)微框架Flask上構(gòu)建了一個(gè)圖像檢索應(yīng)用,應(yīng)??用通過(guò)文本檢測(cè)識(shí)別模型得到圖像中文本信息并寫(xiě)入圖像Exif信息,并利用檢索詞匹配??Exif信息的方式得到目標(biāo)圖像,最后介紹了應(yīng)用實(shí)現(xiàn)的流程和方法,并對(duì)應(yīng)用各個(gè)功能??進(jìn)行了展示。??1.3.2本文結(jié)構(gòu)安排??文本結(jié)構(gòu)安排如圖1.4所示,章節(jié)具體內(nèi)容如下:??廣?1緒論?、??自然場(chǎng)杲下傳統(tǒng)OCR?|圖?檢索應(yīng)用仍是??技術(shù)準(zhǔn)確率急劇下降1新興方向??L?!?)??^?|??3基于CTPN的文本?^?'??習(xí)??卜基于文本識(shí)別??鱗理^?4;;二:二'…1的圖像檢素應(yīng)用j??L?J?^的文本識(shí)別模型」??I?I??6總結(jié)與展望??圖1.4結(jié)構(gòu)安排??Fig.?1.4?Chapter?structure??第一章緒論。本章首先講述了課題的研宄背景和意義;诂F(xiàn)實(shí)背景,著重強(qiáng)調(diào)??了文本檢測(cè)識(shí)別與圖像檢索研宄的價(jià)值與意義。分析與調(diào)研了文本檢測(cè)識(shí)別相關(guān)技術(shù)的??-8-??
【參考文獻(xiàn)】:
期刊論文
[1]自然場(chǎng)景圖像中的文本檢測(cè)方法研究[J]. 李東勤,王芳,周萬(wàn)懷. 重慶科技學(xué)院學(xué)報(bào)(自然科學(xué)版). 2016(06)
[2]漢字識(shí)別方法綜述[J]. 孫華,張航. 計(jì)算機(jī)工程. 2010(20)
[3]用于手寫(xiě)漢字識(shí)別的級(jí)聯(lián)MQDF分類器[J]. 付強(qiáng),丁曉青,劉長(zhǎng)松. 清華大學(xué)學(xué)報(bào)(自然科學(xué)版)網(wǎng)絡(luò).預(yù)覽. 2008(10)
碩士論文
[1]基于深度學(xué)習(xí)的圖像文本識(shí)別系統(tǒng)研究與實(shí)現(xiàn)[D]. 吳曉瑋.北京郵電大學(xué) 2018
[2]基于深度學(xué)習(xí)的自然場(chǎng)景文字識(shí)別[D]. 黃攀.浙江大學(xué) 2016
本文編號(hào):3534528
本文鏈接:http://www.sikaile.net/kejilunwen/shengwushengchang/3534528.html
最近更新
教材專著