基于深度學(xué)習(xí)的場(chǎng)景文字檢測(cè)與識(shí)別方法研究
發(fā)布時(shí)間:2021-01-28 01:42
場(chǎng)景文字檢測(cè)與識(shí)別是計(jì)算機(jī)視覺(jué)領(lǐng)域的重要任務(wù)。場(chǎng)景文字檢測(cè)的目標(biāo)是在自然場(chǎng)景圖像中定位文字實(shí)例。場(chǎng)景文字識(shí)別的目標(biāo)是將只包含單個(gè)文字實(shí)例的自然場(chǎng)景圖像轉(zhuǎn)化為計(jì)算機(jī)可以理解的字符串。相比于傳統(tǒng)的光學(xué)字符識(shí)別,場(chǎng)景文字檢測(cè)與識(shí)別面臨著圖像背景復(fù)雜,文字樣式多變,成像質(zhì)量不佳等諸多挑戰(zhàn)。為了解決上述問(wèn)題,本文建立了一個(gè)工業(yè)場(chǎng)景的文字圖像數(shù)據(jù)集,并提出了兩種新的基于深度學(xué)習(xí)的場(chǎng)景文字檢測(cè)與識(shí)別方法。首先,本文建立了一個(gè)工業(yè)領(lǐng)域的場(chǎng)景文字檢測(cè)與識(shí)別數(shù)據(jù)集——設(shè)備銘牌數(shù)據(jù)集。該數(shù)據(jù)集包含502張自然場(chǎng)景下拍攝的設(shè)備銘牌圖像,并對(duì)圖像中的銘牌位置、文字位置和內(nèi)容進(jìn)行了詳細(xì)的標(biāo)注。該數(shù)據(jù)集涵蓋了 175種不同種類的銘牌,包含中文字符、英文字符、數(shù)字、符號(hào)等多種字符,以及凸起文字、雕刻文字、印刷文字、手寫文字等多種形式的文字,具有很強(qiáng)的挑戰(zhàn)性。其次,本文針對(duì)透視變換影響文字檢測(cè)精度的問(wèn)題,提出了一種基于關(guān)鍵點(diǎn)定位的場(chǎng)景文字檢測(cè)方法。我們?cè)O(shè)計(jì)了一種關(guān)鍵點(diǎn)定位網(wǎng)絡(luò),用于定位文字區(qū)域的關(guān)鍵點(diǎn),并根據(jù)關(guān)鍵點(diǎn)位置對(duì)文字圖像進(jìn)行轉(zhuǎn)正。該方法不僅解決了透視變換影響文字檢測(cè)精度的問(wèn)題,還抑制了復(fù)雜的圖像背景對(duì)文字檢測(cè)的...
【文章來(lái)源】:中國(guó)科學(xué)院大學(xué)(中國(guó)科學(xué)院深圳先進(jìn)技術(shù)研究院)廣東省
【文章頁(yè)數(shù)】:55 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖2.1設(shè)備銘牌標(biāo)注樣例
?基于深度學(xué)習(xí)的場(chǎng)景文字檢測(cè)與識(shí)別方法研究???4000??3500??I3000??(U??^?2500??^?2000?■??I?1500?||??|||-??n?————屬.JLBI?Jl_I—麵_????I??0?250?500?750?1000?1250?1500?1750?2000??Length?of?Text?Region?in?Pixel??圖2.2文字實(shí)例長(zhǎng)度分布。??Figure?2.2?The?length?distribution?of?text?instance.??CO8000??93??O??(0??-M??-6000??■M??(0??J4000??〇?IllllllllllillllllHlIlllllllllllllliimiiim??0125?電?3AV4a?定.e?-額?C/kStT?壓?rE6nR?號(hào)?87N?流?Dlo9iPHdLBGIg0uslVI?器??圖2.3前50個(gè)字符類別的出現(xiàn)頻率。??Figure?2.3?The?frequency?of?top?50?character?categories.??140??120??Ei〇〇??E??J?80??|?60??illlh??50?100?150??Number?of?Text?Regions??圖2.4每張圖像中的文字實(shí)例個(gè)數(shù)。??Figure?2.4?The?number?of?text?instances?in?each?image.??10??
?基于深度學(xué)習(xí)的場(chǎng)景文字檢測(cè)與識(shí)別方法研究???4000??3500??I3000??(U??^?2500??^?2000?■??I?1500?||??|||-??n?————屬.JLBI?Jl_I—麵_????I??0?250?500?750?1000?1250?1500?1750?2000??Length?of?Text?Region?in?Pixel??圖2.2文字實(shí)例長(zhǎng)度分布。??Figure?2.2?The?length?distribution?of?text?instance.??CO8000??93??O??(0??-M??-6000??■M??(0??J4000??〇?IllllllllllillllllHlIlllllllllllllliimiiim??0125?電?3AV4a?定.e?-額?C/kStT?壓?rE6nR?號(hào)?87N?流?Dlo9iPHdLBGIg0uslVI?器??圖2.3前50個(gè)字符類別的出現(xiàn)頻率。??Figure?2.3?The?frequency?of?top?50?character?categories.??140??120??Ei〇〇??E??J?80??|?60??illlh??50?100?150??Number?of?Text?Regions??圖2.4每張圖像中的文字實(shí)例個(gè)數(shù)。??Figure?2.4?The?number?of?text?instances?in?each?image.??10??
本文編號(hào):3004124
【文章來(lái)源】:中國(guó)科學(xué)院大學(xué)(中國(guó)科學(xué)院深圳先進(jìn)技術(shù)研究院)廣東省
【文章頁(yè)數(shù)】:55 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖2.1設(shè)備銘牌標(biāo)注樣例
?基于深度學(xué)習(xí)的場(chǎng)景文字檢測(cè)與識(shí)別方法研究???4000??3500??I3000??(U??^?2500??^?2000?■??I?1500?||??|||-??n?————屬.JLBI?Jl_I—麵_????I??0?250?500?750?1000?1250?1500?1750?2000??Length?of?Text?Region?in?Pixel??圖2.2文字實(shí)例長(zhǎng)度分布。??Figure?2.2?The?length?distribution?of?text?instance.??CO8000??93??O??(0??-M??-6000??■M??(0??J4000??〇?IllllllllllillllllHlIlllllllllllllliimiiim??0125?電?3AV4a?定.e?-額?C/kStT?壓?rE6nR?號(hào)?87N?流?Dlo9iPHdLBGIg0uslVI?器??圖2.3前50個(gè)字符類別的出現(xiàn)頻率。??Figure?2.3?The?frequency?of?top?50?character?categories.??140??120??Ei〇〇??E??J?80??|?60??illlh??50?100?150??Number?of?Text?Regions??圖2.4每張圖像中的文字實(shí)例個(gè)數(shù)。??Figure?2.4?The?number?of?text?instances?in?each?image.??10??
?基于深度學(xué)習(xí)的場(chǎng)景文字檢測(cè)與識(shí)別方法研究???4000??3500??I3000??(U??^?2500??^?2000?■??I?1500?||??|||-??n?————屬.JLBI?Jl_I—麵_????I??0?250?500?750?1000?1250?1500?1750?2000??Length?of?Text?Region?in?Pixel??圖2.2文字實(shí)例長(zhǎng)度分布。??Figure?2.2?The?length?distribution?of?text?instance.??CO8000??93??O??(0??-M??-6000??■M??(0??J4000??〇?IllllllllllillllllHlIlllllllllllllliimiiim??0125?電?3AV4a?定.e?-額?C/kStT?壓?rE6nR?號(hào)?87N?流?Dlo9iPHdLBGIg0uslVI?器??圖2.3前50個(gè)字符類別的出現(xiàn)頻率。??Figure?2.3?The?frequency?of?top?50?character?categories.??140??120??Ei〇〇??E??J?80??|?60??illlh??50?100?150??Number?of?Text?Regions??圖2.4每張圖像中的文字實(shí)例個(gè)數(shù)。??Figure?2.4?The?number?of?text?instances?in?each?image.??10??
本文編號(hào):3004124
本文鏈接:http://www.sikaile.net/kejilunwen/zidonghuakongzhilunwen/3004124.html
最近更新
教材專著