天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 自動(dòng)化論文 >

基于深度學(xué)習(xí)的視頻文字檢測(cè)技術(shù)

發(fā)布時(shí)間:2021-07-24 23:20
  隨著互聯(lián)網(wǎng)技術(shù)的飛速發(fā)展,計(jì)算機(jī)視覺內(nèi)各個(gè)分支領(lǐng)域獲得突破性進(jìn)展,特別在圖像檢測(cè),目標(biāo)跟蹤方向,結(jié)合卷積神經(jīng)網(wǎng)絡(luò)的圖像特征提取能力,已經(jīng)獲得了優(yōu)異的成績(jī),在文字識(shí)別提取方向,深度學(xué)習(xí)與傳統(tǒng)圖像分析的結(jié)合使用使得圖像語義分析方向也有很大進(jìn)展。本論文中設(shè)計(jì)了一套完整的視頻文字識(shí)別的架構(gòu),結(jié)合圖像文字檢測(cè)技術(shù),視頻關(guān)鍵幀提取技術(shù)以及多語言文字識(shí)別技術(shù),實(shí)現(xiàn)了視頻內(nèi)部自然場(chǎng)景及人工添加文本的提取與識(shí)別。其中,文字檢測(cè)技術(shù)采用了YOLO與PixelLink相結(jié)合的方法,兩者原理可以互補(bǔ),對(duì)檢測(cè)性能略有提升,另外,視頻關(guān)鍵幀處理技術(shù)中使用了文字區(qū)域作為關(guān)注重點(diǎn),結(jié)合聚類算法與像素點(diǎn)等邏輯對(duì)幀畫面的重復(fù)信息進(jìn)行壓縮篩選。最終,利用卷積循環(huán)神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)對(duì)中文,英文,數(shù)字等字符的識(shí)別功能。在分別驗(yàn)證完各個(gè)模塊的功能以后,結(jié)合了三個(gè)模塊,實(shí)現(xiàn)了視頻內(nèi)文字的識(shí)別功能。 

【文章來源】:北京郵電大學(xué)北京市 211工程院校 教育部直屬院校

【文章頁數(shù)】:64 頁

【學(xué)位級(jí)別】:碩士

【部分圖文】:

基于深度學(xué)習(xí)的視頻文字檢測(cè)技術(shù)


圖2.1卷積神經(jīng)網(wǎng)絡(luò)(CNN)樣例圖??

原理圖,原理圖


2.3文字定位算法YOLO??YOLO算法將目標(biāo)檢測(cè)問題理解為回歸預(yù)測(cè),避免了對(duì)圖像進(jìn)行一系列改動(dòng)??生成中間圖像。YOLO之前的大多數(shù)物體檢測(cè)算法大多采用了分類器來進(jìn)行物體??檢測(cè),YOLO而是采用卷積神經(jīng)網(wǎng)絡(luò)對(duì)整個(gè)圖像的信息感知,直接預(yù)測(cè)目標(biāo)的邊??緣、并能夠依照框內(nèi)特征識(shí)別目標(biāo)內(nèi)容,從而實(shí)現(xiàn)端到端的目標(biāo)檢測(cè),如圖所示。??YOLO相比于之前的算法有許多優(yōu)點(diǎn),首先是檢測(cè)速率非?臁V暗乃惴ㄖ,??分類器會(huì)選取圖像中的不同尺寸不同位置作為備選區(qū)域,然后采用分類器去判定??其內(nèi)部是否包含物體,YOLO的檢測(cè)過程相比下較為簡(jiǎn)單,甚至可以實(shí)現(xiàn)實(shí)時(shí)物??體檢測(cè)。YOLO采大大減少背景預(yù)測(cè)錯(cuò)誤的產(chǎn)生,與其他方法所利用的滑動(dòng)窗口??或區(qū)域策略不同的是,用整張圖像的感知信息進(jìn)行預(yù)測(cè),而其他方法則缺少了對(duì)??整體畫面的信息感知,例如Fast?R-CNN方法經(jīng)常會(huì)將背景塊檢測(cè)為目標(biāo)物體,??而YOLO方法中背景預(yù)測(cè)錯(cuò)誤率大大降低。YOLO可以學(xué)習(xí)到目標(biāo)的概括信息。??YOLO在某種程度上檢測(cè)要比其他物體檢測(cè)方法好,因?yàn)椋伲希蹋峡梢詫?duì)物體信??息進(jìn)行訓(xùn)練學(xué)習(xí)到高度泛化的特征,遷移性比其他方法強(qiáng)很多。??Inference??

原理圖,原理圖,官方,數(shù)據(jù)集


圖2.?3?darknet-53的網(wǎng)絡(luò)結(jié)構(gòu)??采用YOLOv3目前可以直接采用官方網(wǎng)站所訓(xùn)練好的一系列模型,除了可以??采取這些訓(xùn)練好的模型進(jìn)行微調(diào)遷移以外,一般情況下要訓(xùn)練自己的數(shù)據(jù)集,所??

【參考文獻(xiàn)】:
期刊論文
[1]基于深度學(xué)習(xí)文字檢測(cè)的復(fù)雜環(huán)境車牌定位方法[J]. 李海燕,常富蓉.  現(xiàn)代計(jì)算機(jī)(專業(yè)版). 2017(33)
[2]基于小波變換的視頻流鏡頭切分及關(guān)鍵幀提取[J]. 吳紹根.  計(jì)算機(jī)與數(shù)字工程. 2016(09)
[3]基于目標(biāo)變化的監(jiān)控視頻關(guān)鍵幀提取方法[J]. 周萍.  計(jì)算機(jī)與現(xiàn)代化. 2016(08)
[4]基于改進(jìn)分塊顏色特征和二次提取的關(guān)鍵幀提取算法[J]. 劉華詠,李濤.  計(jì)算機(jī)科學(xué). 2015(12)
[5]基于關(guān)鍵幀多特征融合的視頻拷貝檢測(cè)[J]. 張興忠,李皓,張三義.  太原理工大學(xué)學(xué)報(bào). 2015(05)
[6]基于顏色聚類和多幀融合的視頻文字識(shí)別方法[J]. 易劍,彭宇新,肖建國.  軟件學(xué)報(bào). 2011(12)
[7]基于梯度離散余弦變換的視頻文字定位[J]. 顏俊華,李丹,周亞同.  計(jì)算機(jī)科學(xué). 2011(09)
[8]基于文字穿越線和筆畫連通性的視頻文字提取方法[J]. 田破荒,彭天強(qiáng),李弼程.  電子學(xué)報(bào). 2009(01)
[9]一種基于直方圖特征和AdaBoost的圖像中的文字定位算法[J]. 李闖,丁曉青,吳佑壽.  中國圖象圖形學(xué)報(bào). 2006(03)

博士論文
[1]故事視頻的語義分析與提取[D]. 趙志誠.北京郵電大學(xué) 2008

碩士論文
[1]PixelLink:基于實(shí)例分割的自然場(chǎng)景文本檢測(cè)算法[D]. 鄧丹.浙江大學(xué) 2018
[2]視頻摘要的算法研究[D]. 張亞洲.杭州電子科技大學(xué) 2017
[3]基于內(nèi)容的視頻檢索關(guān)鍵技術(shù)的研究[D]. 白慧茹.太原理工大學(xué) 2017
[4]基于聚類的視頻分類方法研究[D]. 查日盼.淮北師范大學(xué) 2017
[5]基于OpenCV手機(jī)拍照快遞單文字識(shí)別的研究[D]. 馬玲玉.哈爾濱商業(yè)大學(xué) 2016
[6]基于深度學(xué)習(xí)的自然場(chǎng)景文字識(shí)別[D]. 黃攀.浙江大學(xué) 2016
[7]視頻檢索中維吾爾文字幕關(guān)鍵幀提取研究[D]. 閆軻.新疆大學(xué) 2015
[8]基于深度學(xué)習(xí)的自然場(chǎng)景文本識(shí)別系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D]. 馬然.吉林大學(xué) 2015
[9]視頻檢索中基于多特征的關(guān)鍵幀提取算法研究[D]. 柳雪.中國礦業(yè)大學(xué) 2015
[10]復(fù)雜背景圖像中的文字提取算法研究[D]. 汪波.長(zhǎng)安大學(xué) 2014



本文編號(hào):3301633

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/zidonghuakongzhilunwen/3301633.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶0790e***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com