天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

購(gòu)物平臺(tái)商品信息圖片中的文字識(shí)別

發(fā)布時(shí)間:2020-12-26 17:05
  隨著互聯(lián)網(wǎng)的飛速發(fā)展,越來(lái)越多的人們開(kāi)始習(xí)慣于在電子商務(wù)平臺(tái)上購(gòu)物。商品信息圖片這種簡(jiǎn)潔生動(dòng)而又豐富準(zhǔn)確的視覺(jué)信息給消費(fèi)者帶來(lái)便利的同時(shí)也給電子商務(wù)網(wǎng)站的管理人員帶來(lái)了技術(shù)方面的挑戰(zhàn)。由于商品信息圖片中文字的表現(xiàn)形式為受到字符多樣性、背景紋理等條件干擾的光學(xué)字符,從而不能被計(jì)算機(jī)直接搜索和處理,這就造成了一部分不良商家通過(guò)把違規(guī)商品信息以圖片的形式面向消費(fèi)者展示同時(shí)還能規(guī)避網(wǎng)絡(luò)監(jiān)管的事情時(shí)有發(fā)生。因此,研究如何從這些電商圖像中準(zhǔn)確提取文字信息具有重要實(shí)用價(jià)值。自動(dòng)從商品信息圖片中提取文本信息將有助于電子商務(wù)企業(yè)在大數(shù)據(jù)時(shí)代提高商品的推薦效率、提升售后保障和信息化監(jiān)管水平。本文主要針對(duì)電商圖片中的字符定位和識(shí)別算法進(jìn)行了研究,在一系列關(guān)于圖像處理、文字特征提取、文字定位等算法的研究基礎(chǔ)上,拋棄了傳統(tǒng)“邊緣檢測(cè)+腐蝕膨脹”的特征提取方法,模擬肉眼的視覺(jué)機(jī)理提出了通過(guò)灰度聚類(lèi)、圖層分解、去噪等步驟進(jìn)行字符定位的方法,同時(shí)進(jìn)一步結(jié)合鄰近搜索和統(tǒng)計(jì)切割技術(shù)針對(duì)漢字的幾何特征進(jìn)行了字符切割,最后采用了卷積神經(jīng)網(wǎng)絡(luò)模型,通過(guò)多層卷積神經(jīng)網(wǎng)絡(luò),構(gòu)建了單字的識(shí)別模型,成功剔除了圖片的背景區(qū)域,實(shí)現(xiàn)了對(duì)于... 

【文章來(lái)源】:西北師范大學(xué)甘肅省

【文章頁(yè)數(shù)】:58 頁(yè)

【學(xué)位級(jí)別】:碩士

【部分圖文】:

購(gòu)物平臺(tái)商品信息圖片中的文字識(shí)別


電商平臺(tái)商

平臺(tái),商品,頁(yè)面,虛假宣傳


第1章緒論3(a)某平臺(tái)商品宣傳頁(yè)面(b)消費(fèi)者實(shí)際到手的物品圖1-1電商平臺(tái)商品虛假宣傳頁(yè)面圖(a)違規(guī)商品宣傳頁(yè)面(b)違規(guī)商品宣傳頁(yè)面圖1-2電商平臺(tái)違規(guī)商品頁(yè)面圖

過(guò)程圖,大腦,過(guò)程圖,卷積


第2章文字識(shí)別相關(guān)技術(shù)15模型。卷積神經(jīng)網(wǎng)絡(luò)是人工神經(jīng)網(wǎng)絡(luò)的一種,已成為當(dāng)前圖像識(shí)別領(lǐng)域的主流模型,它通過(guò)局部感知野和權(quán)值共享方法,降低了網(wǎng)絡(luò)模型的復(fù)雜度,減少了權(quán)值的數(shù)量,在網(wǎng)絡(luò)結(jié)構(gòu)上更類(lèi)似于生物神經(jīng)網(wǎng)絡(luò),這也預(yù)示著它必然具有更優(yōu)秀的效果。本文選擇卷積神經(jīng)網(wǎng)絡(luò)的主要原因包括以下三點(diǎn):1.對(duì)原始圖像自動(dòng)提取特征:卷積神經(jīng)網(wǎng)絡(luò)模型可以直接將原始圖像進(jìn)行輸入,免除了傳統(tǒng)模型的人工提取特征這一比較困難的核心部分。2.比傳統(tǒng)模型更高的精度:比如在MNIST手寫(xiě)數(shù)字識(shí)別任務(wù)中,可以達(dá)到99%以上的精度,這遠(yuǎn)高于傳統(tǒng)模型的精度。3.比傳統(tǒng)模型更好的泛化能力:這意味著圖像本身的形變(伸縮、旋轉(zhuǎn))以及圖像上的噪音對(duì)識(shí)別的結(jié)果影響不明顯,這正是一個(gè)效果良好的字符識(shí)別操作所必需的。卷積神經(jīng)網(wǎng)絡(luò)本質(zhì)上可以看作是全連接神經(jīng)網(wǎng)絡(luò)(例如眾所周知的多層感知器Multi-LayerPerceptron)的改進(jìn)版本。由于權(quán)重共享屬性,網(wǎng)絡(luò)中包含的參數(shù)數(shù)量大大減少,并且由于使用卷積核在圖像中的每個(gè)位置連續(xù)執(zhí)行卷積計(jì)算,具有提取局部特征的作用。以上的兩個(gè)屬性使卷積神經(jīng)網(wǎng)絡(luò)在進(jìn)行圖像處理任務(wù)時(shí)比全連接神經(jīng)網(wǎng)絡(luò)更方便[41]。卷積神經(jīng)網(wǎng)絡(luò)的靈感來(lái)自研究大腦視覺(jué)原理的過(guò)程,如圖2-1所示。諾貝爾醫(yī)學(xué)獎(jiǎng)獲得者TorstenWiesel和DavidHubel在1981年提出人類(lèi)的大腦在進(jìn)行視覺(jué)系統(tǒng)的信息處理時(shí)是通過(guò)分級(jí)的可視皮層進(jìn)行的。首先從瞳孔捕獲原始信號(hào),然后第一級(jí)皮層檢測(cè)原始信號(hào)的輪廓與邊緣,接著第二級(jí)皮層檢測(cè)基于前一層信息判斷的某些關(guān)鍵形狀,最后第三級(jí)皮層從第二級(jí)皮層檢測(cè)所得圖像中的信息高度抽象總結(jié)出具體對(duì)象。圖2-1大腦視覺(jué)原理過(guò)程圖


本文編號(hào):2940114

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/shoufeilunwen/xixikjs/2940114.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶(hù)0dc0d***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com