基于神經(jīng)網(wǎng)絡(luò)的自然場(chǎng)景中的字符識(shí)別算法的研究與實(shí)現(xiàn)
發(fā)布時(shí)間:2022-02-22 17:44
近年來(lái),隨著移動(dòng)網(wǎng)絡(luò)的普及和手機(jī)的大量使用,人們從自然場(chǎng)景獲取和分享圖片的方式越來(lái)越多,從海量的自然場(chǎng)景圖片中識(shí)別出字符變得越來(lái)越重要,智慧城市、工業(yè)自動(dòng)化等都需要實(shí)時(shí)的識(shí)別出場(chǎng)景字符。場(chǎng)景字符識(shí)別屬于文本識(shí)別的范圍。在傳統(tǒng)的識(shí)別方法中,往往需要手動(dòng)去設(shè)計(jì)特征,鑒于背景的多樣化和隨意性,這種傳統(tǒng)的算法往往滿足不了實(shí)際的需求。而深度學(xué)習(xí)技術(shù)的快速發(fā)展為自然場(chǎng)景中字符檢測(cè)與識(shí)別帶來(lái)了新的契機(jī)。相比于傳統(tǒng)的識(shí)別方式,神經(jīng)網(wǎng)絡(luò)不但可以通過(guò)卷積自動(dòng)提取圖像特征,還可避免傳統(tǒng)方式中手工設(shè)計(jì)特征帶來(lái)的龐大的工作量,因此,使用神經(jīng)網(wǎng)絡(luò)進(jìn)行自然場(chǎng)景字符識(shí)別已經(jīng)成為當(dāng)前的主要研究方向。當(dāng)前的自然場(chǎng)景字符識(shí)別算法雖然已經(jīng)取得了很大的進(jìn)步,但是還存在以下問(wèn)題:對(duì)小目標(biāo)的檢測(cè)的效果不好;很難區(qū)分粘連的文本;對(duì)于彎曲文本,檢測(cè)和識(shí)別效果一直都不好。針對(duì)以上問(wèn)題,本文做了以下幾點(diǎn)創(chuàng)新性的改進(jìn)工作,具體研究工作如下:1、針對(duì)小目標(biāo)檢測(cè)效果不好的問(wèn)題,本文結(jié)合了基于像素分割的檢測(cè)方法和形態(tài)學(xué)中的腐蝕和膨脹算法,通過(guò)腐蝕去除無(wú)關(guān)小目標(biāo),再進(jìn)行膨脹對(duì)真正的小目標(biāo)區(qū)域進(jìn)行擴(kuò)張,從而能有效的檢測(cè)出小目標(biāo),在Total-Text...
【文章來(lái)源】:電子科技大學(xué)四川省211工程院校985工程院校教育部直屬院校
【文章頁(yè)數(shù)】:69 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
abstract
第一章 緒論
1.1 研究工作的背景與意義
1.2 自然環(huán)境下字符識(shí)別技術(shù)的國(guó)內(nèi)外研究歷史與現(xiàn)狀
1.2.1 基于候選框的文本檢測(cè)
1.2.2 基于分割的文本檢測(cè)
1.2.3 文本識(shí)別方法
1.3 本文的主要內(nèi)容與創(chuàng)新
1.4 本論文的結(jié)構(gòu)安排
第二章 相關(guān)理論和技術(shù)
2.1 卷積神經(jīng)網(wǎng)絡(luò)
2.1.1 卷積神經(jīng)網(wǎng)絡(luò)的基本原理
2.1.2 卷積神經(jīng)網(wǎng)絡(luò)的基本概念
2.1.3 優(yōu)化器
2.1.4 網(wǎng)絡(luò)的訓(xùn)練
2.1.5 卷積神經(jīng)網(wǎng)絡(luò)和傳統(tǒng)神經(jīng)網(wǎng)絡(luò)
2.2 循環(huán)神經(jīng)網(wǎng)絡(luò)
2.2.1 RNN
2.2.2 LSTM
2.2.3 LSTM的內(nèi)部原理
2.2.4 CTC
2.2.5 Attention機(jī)制
2.3 本章小結(jié)
第三章 文本檢測(cè)算法的研究與實(shí)現(xiàn)
3.1 文本檢測(cè)與識(shí)別的常用方案
3.2 通用的物體檢測(cè)模型
3.2.1 SSD
3.2.2 Faster-RCNN
3.3 PSENet
3.3.1 整體流程
3.3.2 主干網(wǎng)絡(luò)
3.3.3 漸進(jìn)式尺度擴(kuò)展算法
3.3.4 Label生成
3.3.5 損失函數(shù)
3.4 PSENet的改進(jìn)
3.4.1 主干網(wǎng)絡(luò)的改進(jìn)
3.4.2 label生成的改進(jìn)
3.4.3 Loss改進(jìn)
3.5 實(shí)驗(yàn)
3.5.1 搭建實(shí)驗(yàn)環(huán)境
3.5.2 準(zhǔn)備實(shí)驗(yàn)數(shù)據(jù)
3.5.3 定義評(píng)價(jià)指標(biāo)
3.5.4 定義網(wǎng)絡(luò)模型
3.5.5 模型的訓(xùn)練與測(cè)試
3.6 本章小結(jié)
第四章 文本識(shí)別算法的研究與實(shí)現(xiàn)
4.1 文本識(shí)別概述
4.2 典型的文本識(shí)別結(jié)構(gòu)
4.2.1 CRNN+CTC
4.2.2 CNN+Seq2Seq+Attention
4.2.3 Transformer
4.3 文本識(shí)別模塊的實(shí)現(xiàn)
4.3.1 識(shí)別架構(gòu)的設(shè)計(jì)與實(shí)現(xiàn)
4.3.2 Encoder實(shí)現(xiàn)
4.3.3 Decoder實(shí)現(xiàn)
4.3.4 數(shù)據(jù)與預(yù)處理
4.3.5 Loss函數(shù)選擇
4.3.6 訓(xùn)練過(guò)程設(shè)計(jì)
4.3.7 預(yù)測(cè)過(guò)程設(shè)計(jì)
4.3.8 文本識(shí)別效果展示
4.4 本章小結(jié)
第五章 全文總結(jié)與展望
5.1 全文總結(jié)
5.2 后續(xù)工作展望
致謝
參考文獻(xiàn)
本文編號(hào):3639935
【文章來(lái)源】:電子科技大學(xué)四川省211工程院校985工程院校教育部直屬院校
【文章頁(yè)數(shù)】:69 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
abstract
第一章 緒論
1.1 研究工作的背景與意義
1.2 自然環(huán)境下字符識(shí)別技術(shù)的國(guó)內(nèi)外研究歷史與現(xiàn)狀
1.2.1 基于候選框的文本檢測(cè)
1.2.2 基于分割的文本檢測(cè)
1.2.3 文本識(shí)別方法
1.3 本文的主要內(nèi)容與創(chuàng)新
1.4 本論文的結(jié)構(gòu)安排
第二章 相關(guān)理論和技術(shù)
2.1 卷積神經(jīng)網(wǎng)絡(luò)
2.1.1 卷積神經(jīng)網(wǎng)絡(luò)的基本原理
2.1.2 卷積神經(jīng)網(wǎng)絡(luò)的基本概念
2.1.3 優(yōu)化器
2.1.4 網(wǎng)絡(luò)的訓(xùn)練
2.1.5 卷積神經(jīng)網(wǎng)絡(luò)和傳統(tǒng)神經(jīng)網(wǎng)絡(luò)
2.2 循環(huán)神經(jīng)網(wǎng)絡(luò)
2.2.1 RNN
2.2.2 LSTM
2.2.3 LSTM的內(nèi)部原理
2.2.4 CTC
2.2.5 Attention機(jī)制
2.3 本章小結(jié)
第三章 文本檢測(cè)算法的研究與實(shí)現(xiàn)
3.1 文本檢測(cè)與識(shí)別的常用方案
3.2 通用的物體檢測(cè)模型
3.2.1 SSD
3.2.2 Faster-RCNN
3.3 PSENet
3.3.1 整體流程
3.3.2 主干網(wǎng)絡(luò)
3.3.3 漸進(jìn)式尺度擴(kuò)展算法
3.3.4 Label生成
3.3.5 損失函數(shù)
3.4 PSENet的改進(jìn)
3.4.1 主干網(wǎng)絡(luò)的改進(jìn)
3.4.2 label生成的改進(jìn)
3.4.3 Loss改進(jìn)
3.5 實(shí)驗(yàn)
3.5.1 搭建實(shí)驗(yàn)環(huán)境
3.5.2 準(zhǔn)備實(shí)驗(yàn)數(shù)據(jù)
3.5.3 定義評(píng)價(jià)指標(biāo)
3.5.4 定義網(wǎng)絡(luò)模型
3.5.5 模型的訓(xùn)練與測(cè)試
3.6 本章小結(jié)
第四章 文本識(shí)別算法的研究與實(shí)現(xiàn)
4.1 文本識(shí)別概述
4.2 典型的文本識(shí)別結(jié)構(gòu)
4.2.1 CRNN+CTC
4.2.2 CNN+Seq2Seq+Attention
4.2.3 Transformer
4.3 文本識(shí)別模塊的實(shí)現(xiàn)
4.3.1 識(shí)別架構(gòu)的設(shè)計(jì)與實(shí)現(xiàn)
4.3.2 Encoder實(shí)現(xiàn)
4.3.3 Decoder實(shí)現(xiàn)
4.3.4 數(shù)據(jù)與預(yù)處理
4.3.5 Loss函數(shù)選擇
4.3.6 訓(xùn)練過(guò)程設(shè)計(jì)
4.3.7 預(yù)測(cè)過(guò)程設(shè)計(jì)
4.3.8 文本識(shí)別效果展示
4.4 本章小結(jié)
第五章 全文總結(jié)與展望
5.1 全文總結(jié)
5.2 后續(xù)工作展望
致謝
參考文獻(xiàn)
本文編號(hào):3639935
本文鏈接:http://www.sikaile.net/kejilunwen/shengwushengchang/3639935.html
最近更新
教材專著