網(wǎng)絡圖片敏感文字的檢測研究與實現(xiàn)

發(fā)布時間：2021-02-01 21:06

　　隨著互聯(lián)網(wǎng)的快速發(fā)展與應用,網(wǎng)絡安全的風險和威脅日益突出。一些不法分子利用音頻、文字和圖片的傳播途徑在網(wǎng)絡上進行恐怖、淫穢、洗錢、反動、賭博等犯罪活動,嚴重影響了廣大網(wǎng)民的身心健康。目前,純文本形式的敏感信息過濾技術發(fā)展成熟,并得到了廣泛的應用。對于其它的傳播途徑,相關的監(jiān)管手段還存在著不足。針對一些文字嵌入到圖片的傳播形式,本文結合了當前自然場景的文本檢測與識別的新成果,提出了一種網(wǎng)絡圖片的敏感文本信息檢測方法。（1）針對網(wǎng)絡敏感文字圖片不同尺度的文字定位困難的問題,本文在Textboxes++文字定位算法的基礎上進行改進,提出了DG-Textboxes++文字定位算法,該算法優(yōu)化了特征提取網(wǎng)絡并引入可形變卷積,使其感受野來適應文字序列的變化,并對冗余的定位框進行了優(yōu)化。該文字定位算法在ICDAR2015數(shù)據(jù)集中綜合指標F＿mean達到了69.3%,能準確完成文字的定位。（2）針對網(wǎng)絡敏感文字圖片的中文識別困難的問題,本文在CRNN文字識別算法的基礎上進行改進,提出了DS-RCNN文字識別算法,該算法使用了深度的密集卷積神經(jīng)網(wǎng)絡來提取文字特征,并利用空間變換網(wǎng)絡來對網(wǎng)絡圖片中的傾斜中...

【文章來源】：重慶郵電大學重慶市

【文章頁數(shù)】：74 頁

【學位級別】：碩士

【部分圖文】：

各類網(wǎng)絡上的文字圖片示例

圖片,樣本

重慶郵電大學碩士學位論文第1章緒論7了完整的網(wǎng)絡圖片的敏感信息解決方案，對圖片的定位、提取和圖片信息的壓縮進行了研究，開發(fā)了基于文字與膚色關鍵語義的敏感影像檢測應用系統(tǒng)，并應用到廣東移動現(xiàn)網(wǎng)系統(tǒng)中。宋曉敏[30]提出了基于貝葉斯算法的文本分類模型，該模型將詞頻-逆文檔頻率特征的權重導入到貝葉斯分類器中，提高了中文文本分類的準確性。文獻[31]在深入研究和利用深度學習相關算法的基礎上，采用了基于FPGA與CPU的異構架構對含有敏感文字圖片進行定位與識別，其方案中特征提取部分采用的是VGG-16[32]網(wǎng)絡，隨著網(wǎng)絡規(guī)模和深度的提升，會產(chǎn)生過擬合并難以實現(xiàn)收斂。隨著深度學習在不同領域上的快速發(fā)展與應用，一些新的算法模型用于文本的分類和文本的情感分析等方面有了更多的研究成果，這對于圖片的敏感信息文本的相關研究有著較好的啟發(fā)。趙宇蕾[33]提出了基于深度學習的中文醫(yī)療化驗單圖像的檢測模型，并針對圖像特征尺度的問題，對不同的卷積進行有效融合，提高了檢測模型對醫(yī)療化驗單圖像的識別準確率。1.2.4當前工作研究難點通過對上述研究現(xiàn)狀的分析得知，敏感文字信息的圖片檢測存在以下幾個難點：1.圖片定位與識別的復雜性一些復雜背景的網(wǎng)絡圖片中存在文字大孝方向多變的現(xiàn)象，有的還包含了不規(guī)則文字，若傾斜角度較大會導致文字變形，使文字定位與識別的難度變大。比如曲形排列的文本形狀難以用一個矩形檢測框去覆蓋，無論是定位還是識別都比普通的文本行更具有挑戰(zhàn)性。如圖1.2所示，該廣告圖片中文字的大孝尺度多變且包含部分藝術字體。圖1.2典型難以定位與識別的圖片樣本

特征圖,示例,文本

重慶郵電大學碩士學位論文第2章基于DG-Textboxes++文字定位算法14播得到的。對于多尺度文本行來說，在DVGG特征提取網(wǎng)絡最后的3層3*3可形變卷積可以減少常規(guī)卷積核引入的大量背景對特征的干擾。2.3.2多方向的目標定位框設計SSD系列算法的默認框defaultbox與Faster-RCNN算法中anchor機制類似，設置一個默認框并利用卷積層來預測邊框相對于默認框的偏移量。在Textboxes++算法中，defaultbox定義的text-box層(conv4_3,conv7,conv8_2,conv9_2,conv_10_2，conv_11_2)生成在特征圖上，通過text-box層可直接預測文本出現(xiàn)的置信度分數(shù)和相應的邊框的偏移量。為了適應多角度的文本，Textboxes++在SSD和Textboxes的基礎上做了一些改進，其中的text-box層輸出一系列的多角度文本定位框使用{q}或者{r}集合來表示，同時輸出對應于多角度文本定位框的最小外界水平矩形框使用集合來表示。多角度文本定位框是通過defaultbox回歸得到的，如圖2.6表示，圖中綠色虛線表示與真值groundtruth匹配的defaultbox，黃色框表示groundtruth，紅色箭頭表示回歸的方向，黑色框表示未匹配到真值的defaultbox，綠色實線框表示對應groundtruth的最小外界水平矩形框[35]。圖2.6定位框表示的示例圖[35]假定對應輸入特征圖上有水平的defaultbox，用0(,,,)0000b=xywh表示，其中(,)00xy表示為defaultbox的中心坐標，0w和0h分別表示為寬和高�；貧w出來的多角度文本框有兩種表示方式，一種是使用四個點表示四邊形為：(,,,,,,,)qqqqqqqq0101020203030404=xyxyxyxy0q(2.6)另一種是使用四邊形的左上點、右上點和旋轉矩形的高表示為：(,,,,)rrrrr010102020=xyxyh0r(2.7)

【參考文獻】：
期刊論文
[1]基于詞頻統(tǒng)計的文本關鍵詞提取方法[J]. 羅燕,趙書良,李曉超,韓玉輝,丁亞飛. 計算機應用. 2016(03)
[2]基于小波變換的圖像中維吾爾文字定位[J]. 哈力旦·A,庫爾班·買提木沙. 計算機工程. 2011(08)

博士論文
[1]面向互聯(lián)網(wǎng)的圖像敏感內容分析系統(tǒng)的關鍵技術研究[D]. 李英.西安電子科技大學 2018
[2]基于圖像分析和深度學習的船名標識字符檢測與識別研究[D]. 劉寶龍.浙江大學 2018

碩士論文
[1]基于改進貝葉斯算法的中文信息分類研究[D]. 宋曉敏.北京郵電大學 2019
[2]中文醫(yī)療化驗單圖像的信息抽取與識別算法研究[D]. 趙宇蕾.北京交通大學 2019
[3]基于異構計算的圖片敏感文字檢測系統(tǒng)[D]. 彭海.電子科技大學 2018

本文編號：3013436

資料下載

論文發(fā)表

支付寶下載

Download by Alipay
微信下載

Download by Wechat
會員下載

Download by Member

本文鏈接：http://www.sikaile.net/kejilunwen/shengwushengchang/3013436.html

上一篇：蒙古文法律術語電子詞典的構建與應用研究
下一篇：配電網(wǎng)復合電能質量的仿真分析及綜合評估方法研究

論文發(fā)表

·知網(wǎng)|萬方|維普|龍源|省級|國家級|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|

天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

網(wǎng)絡圖片敏感文字的檢測研究與實現(xiàn)