基于深度神經網絡的自然場景文本識別
發(fā)布時間:2022-08-09 09:33
文字,作為記錄思想、承載語言的工具,在人類社會的發(fā)展中發(fā)揮著舉足輕重的作用。自然場景下的文本含有豐富的信息,利用現代化技術獲取這些信息可以給人類的工作和生活帶來極大的便利。自然場景下的文本復雜多變,與排版標準、分辨率高的印刷文本相比,具有字體多樣、背景復雜、分布隨意、干擾因素多的特點,用傳統的光學字符識別技術(OCR技術)對其進行識別達到的識別率低,不能滿足實際使用需求。本文在對國內外自然場景文本識別及深度學習領域的相關文獻研究的基礎上,提出了基于深度學習的自然場景文本識別方法,以實現自然場景下的文本識別,達到一定的識別準確率和識別效率。本文的主要創(chuàng)新點和研究成果如下:(1)提出了一個卷積神經網絡(CNN)和遞歸神經網絡(RNN)相結合的端到端深度神經網絡框架。自然場景下的文本識別分為特征提取和特征識別兩部分,該模型采用編碼器-譯碼器結構,將卷積神經網絡作為模型的編碼器,完成特征提取部分的功能。遞歸神經網絡作為模型的譯碼器,結合前后輸入進行識別,完成特征識別部分的功能。將訓練后得到的最終模型在4個當下流行且具有代表性的數據集IC03、IC13、IIIT5K、SVT上進行測試。結果表明,...
【文章頁數】:64 頁
【學位級別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 研究背景及意義
1.2 國內外研究現狀
1.2.1 基于字符的識別
1.2.2 基于整個單詞的識別
1.3 本文主要研究內容
1.3.1 主要研究內容
1.3.2 論文的組織結構
第2章 深度學習基本理論
2.1 深度學習概述
2.2 卷積神經網絡
2.2.1 卷積層
2.2.2 池化層
2.2.3 激活函數
2.2.4 損失函數
2.3 循環(huán)神經網絡
2.3.1 LSTM
2.3.2 GRU
2.4 神經網絡的訓練
2.4.1 訓練策略
2.4.1.1 標準梯度下降法
2.4.1.2 隨機梯度下降法
2.4.1.3 小批量梯度下降法
2.4.2 優(yōu)化器
2.4.2.1 動量
2.4.2.2 Adagrad
2.4.2.3 AdaDelta
2.4.2.4 Adam
2.4.3 過擬合解決辦法
2.4.3.1 提前終止
2.4.3.2 數據集增廣
2.4.3.3 Dropout
2.5 小結
第3章 深度神經網絡
3.1 引言
3.2 深度神經網絡
3.2.1 模型結構
3.2.2 卷積神經網絡層
3.2.3 雙向LSTM網絡層
3.2.4 轉錄層
3.3 網絡訓練
3.4 實驗與分析
3.4.1 軟硬件環(huán)境配置
3.4.2 深度學習框架TensorFlow
3.4.3 數據集
3.4.3.1 訓練集
3.4.3.2 測試集
3.4.4 實驗結果分析
3.5 小結
第4章 基于注意力機制的深度神經網絡
4.1 引言
4.2 注意力機制
4.2.1 軟注意力機制
4.2.2 硬注意力機制
4.3 基于軟注意力機制的深度神經網絡
4.4 實驗結果分析
4.5 小結
結論
參考文獻
附錄 A (攻讀碩士學位期間所發(fā)表的學術論文)
附錄 B (攻讀碩士學位期間所參加的學術科研活動)
致謝
本文編號:3672313
【文章頁數】:64 頁
【學位級別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 研究背景及意義
1.2 國內外研究現狀
1.2.1 基于字符的識別
1.2.2 基于整個單詞的識別
1.3 本文主要研究內容
1.3.1 主要研究內容
1.3.2 論文的組織結構
第2章 深度學習基本理論
2.1 深度學習概述
2.2 卷積神經網絡
2.2.1 卷積層
2.2.2 池化層
2.2.3 激活函數
2.2.4 損失函數
2.3 循環(huán)神經網絡
2.3.1 LSTM
2.3.2 GRU
2.4 神經網絡的訓練
2.4.1 訓練策略
2.4.1.1 標準梯度下降法
2.4.1.2 隨機梯度下降法
2.4.1.3 小批量梯度下降法
2.4.2 優(yōu)化器
2.4.2.1 動量
2.4.2.2 Adagrad
2.4.2.3 AdaDelta
2.4.2.4 Adam
2.4.3 過擬合解決辦法
2.4.3.1 提前終止
2.4.3.2 數據集增廣
2.4.3.3 Dropout
2.5 小結
第3章 深度神經網絡
3.1 引言
3.2 深度神經網絡
3.2.1 模型結構
3.2.2 卷積神經網絡層
3.2.3 雙向LSTM網絡層
3.2.4 轉錄層
3.3 網絡訓練
3.4 實驗與分析
3.4.1 軟硬件環(huán)境配置
3.4.2 深度學習框架TensorFlow
3.4.3 數據集
3.4.3.1 訓練集
3.4.3.2 測試集
3.4.4 實驗結果分析
3.5 小結
第4章 基于注意力機制的深度神經網絡
4.1 引言
4.2 注意力機制
4.2.1 軟注意力機制
4.2.2 硬注意力機制
4.3 基于軟注意力機制的深度神經網絡
4.4 實驗結果分析
4.5 小結
結論
參考文獻
附錄 A (攻讀碩士學位期間所發(fā)表的學術論文)
附錄 B (攻讀碩士學位期間所參加的學術科研活動)
致謝
本文編號:3672313
本文鏈接:http://www.sikaile.net/kejilunwen/shengwushengchang/3672313.html
最近更新
教材專著