基于EAST與ASTER的自然場景圖像中文本檢測與識別研究
發(fā)布時間:2021-08-31 15:12
伴隨著互聯網時代的到來,自然場景圖片的獲取與存儲越來越便捷,自然場景圖片記錄著人們的生活以及重要的信息。圖片中的文字蘊含有豐富的語義信息,如何從自然場景圖像中準確的提取出文字在視頻檢索、車牌識別、導航系統(tǒng)、工業(yè)生產自動化等領域具有重要的應用價值。不同于文檔圖像,自然場景圖像的背景復雜、圖片的清晰度差異大,文字區(qū)域的規(guī)則多樣化使得傳統(tǒng)的OCR技術無法應用到自然場景中的文字識別上。近年來基于深度學習的技術滲透到各個應用場景,本文結合現有流行的EAST文本檢測算法和ASTER文本識別技術,對自然場景圖片中文字的提取進行了研究。首先,針對感受野能力不足的問題,本文實現了一種改進的EAST文本檢測模型,該模型利用深度殘差網絡抓取更深層的圖像特征,特征融合前在輸出步長為8和16的特征映射層后加入ASPP模塊進行感受野的擴張,接著通過雙線性上采樣到合適尺寸與淺層的特征映射串聯進行特征融合,最后通過卷積輸出到輸出層。在網絡的訓練上,本文修改了損失函數通過結合Focal Loss和Dice loss兩大損失函數進行網絡的訓練。通過在實驗數據上的檢測證明該模型能很好地完成在自然場景下的文本檢測功能。然后,...
【文章來源】:武漢郵電科學研究院湖北省
【文章頁數】:75 頁
【學位級別】:碩士
【部分圖文】:
驗證集上損失函數值
整流網絡實
ASTER與本文識別算法訓練Loss下降過程
【參考文獻】:
期刊論文
[1]基于改進EAST的自然場景文本定位算法[J]. 楊飚,杜曉宇. 計算機工程與應用. 2019(18)
[2]卷積神經網絡CNN算法在文本分類上的應用研究[J]. 侯小培,高迎. 科技與創(chuàng)新. 2019(04)
[3]自然場景圖像中的文本檢測綜述[J]. 王潤民,桑農,丁丁,陳杰,葉齊祥,高常鑫,劉麗. 自動化學報. 2018(12)
[4]復雜場景文本段識別[J]. 王孝男,張利,何思楠. 計算機應用研究. 2019(09)
[5]卷積神經網絡在車輛識別中的應用[J]. 彭清,季桂樹,謝林江,張少波. 計算機科學與探索. 2018(02)
[6]基于深度學習方法的復雜場景下車輛目標檢測[J]. 宋煥生,張向清,鄭寶峰,嚴騰. 計算機應用研究. 2018(04)
[7]卷積神經網絡在印章編號識別中的應用[J]. 陽哲. 現代計算機(專業(yè)版). 2016(04)
博士論文
[1]基于卷積神經網絡的計算機視覺關鍵技術研究[D]. 李彥冬.電子科技大學 2017
[2]面向不平衡數據的支持向量機分類方法研究[D]. 楊智明.哈爾濱工業(yè)大學 2009
碩士論文
[1]自然場景圖像中的文本檢測與識別技術研究[D]. 周鵬飛.西安理工大學 2019
[2]基于深度學習的自然場景文本檢測算法研究[D]. 張艾萱.北方工業(yè)大學 2019
[3]文本檢測模型在視頻場景中的字幕召回問題研究[D]. 劉鈺濤.華中科技大學 2019
[4]復雜自然場景中文本檢測技術的研究[D]. 黃梅玲.南京郵電大學 2018
[5]基于深度學習的自然場景文本定位與識別研究[D]. 張平.西安電子科技大學 2018
[6]自然場景下的文本檢測算法研究[D]. 王志元.江西理工大學 2018
[7]基于深度學習的自然場景文本檢測與識別[D]. 方清.電子科技大學 2018
[8]基于卷積神經網絡的ECG身份識別技術研究[D]. 徐雯靜.東北林業(yè)大學 2016
[9]自然場景中的文本檢測研究[D]. 劉可豹.北京交通大學 2015
本文編號:3375116
【文章來源】:武漢郵電科學研究院湖北省
【文章頁數】:75 頁
【學位級別】:碩士
【部分圖文】:
驗證集上損失函數值
整流網絡實
ASTER與本文識別算法訓練Loss下降過程
【參考文獻】:
期刊論文
[1]基于改進EAST的自然場景文本定位算法[J]. 楊飚,杜曉宇. 計算機工程與應用. 2019(18)
[2]卷積神經網絡CNN算法在文本分類上的應用研究[J]. 侯小培,高迎. 科技與創(chuàng)新. 2019(04)
[3]自然場景圖像中的文本檢測綜述[J]. 王潤民,桑農,丁丁,陳杰,葉齊祥,高常鑫,劉麗. 自動化學報. 2018(12)
[4]復雜場景文本段識別[J]. 王孝男,張利,何思楠. 計算機應用研究. 2019(09)
[5]卷積神經網絡在車輛識別中的應用[J]. 彭清,季桂樹,謝林江,張少波. 計算機科學與探索. 2018(02)
[6]基于深度學習方法的復雜場景下車輛目標檢測[J]. 宋煥生,張向清,鄭寶峰,嚴騰. 計算機應用研究. 2018(04)
[7]卷積神經網絡在印章編號識別中的應用[J]. 陽哲. 現代計算機(專業(yè)版). 2016(04)
博士論文
[1]基于卷積神經網絡的計算機視覺關鍵技術研究[D]. 李彥冬.電子科技大學 2017
[2]面向不平衡數據的支持向量機分類方法研究[D]. 楊智明.哈爾濱工業(yè)大學 2009
碩士論文
[1]自然場景圖像中的文本檢測與識別技術研究[D]. 周鵬飛.西安理工大學 2019
[2]基于深度學習的自然場景文本檢測算法研究[D]. 張艾萱.北方工業(yè)大學 2019
[3]文本檢測模型在視頻場景中的字幕召回問題研究[D]. 劉鈺濤.華中科技大學 2019
[4]復雜自然場景中文本檢測技術的研究[D]. 黃梅玲.南京郵電大學 2018
[5]基于深度學習的自然場景文本定位與識別研究[D]. 張平.西安電子科技大學 2018
[6]自然場景下的文本檢測算法研究[D]. 王志元.江西理工大學 2018
[7]基于深度學習的自然場景文本檢測與識別[D]. 方清.電子科技大學 2018
[8]基于卷積神經網絡的ECG身份識別技術研究[D]. 徐雯靜.東北林業(yè)大學 2016
[9]自然場景中的文本檢測研究[D]. 劉可豹.北京交通大學 2015
本文編號:3375116
本文鏈接:http://www.sikaile.net/kejilunwen/shengwushengchang/3375116.html
最近更新
教材專著