基于卷積神經(jīng)網(wǎng)絡(luò)的圖書頁面檢索方法
本文關(guān)鍵詞:基于卷積神經(jīng)網(wǎng)絡(luò)的圖書頁面檢索方法 出處:《華中科技大學(xué)學(xué)報(bào)(自然科學(xué)版)》2017年11期 論文類型:期刊論文
更多相關(guān)文章: 圖書頁面檢索 卷積神經(jīng)網(wǎng)絡(luò) 圖像分割 圖像校正 圖像檢索
【摘要】:針對現(xiàn)有圖書頁面檢索方法檢索精度低的問題,利用任務(wù)無關(guān)數(shù)據(jù)集訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò),提出了一種基于卷積神經(jīng)網(wǎng)絡(luò)的圖書頁面檢索方法.首先將待檢圖書頁面圖像進(jìn)行圖像分割和畸變校正,降低背景的干擾和幾何畸變的影響;然后將校正后的圖像輸入卷積神經(jīng)網(wǎng)絡(luò)提取圖像特征;最后使用夾角余弦距離來度量待檢圖像和候選圖像的相似度.實(shí)驗(yàn)結(jié)果表明:本方法在測試數(shù)據(jù)集上的Top-5命中率為97.31%,而直接使用任務(wù)無關(guān)數(shù)據(jù)集訓(xùn)練的卷積神經(jīng)網(wǎng)絡(luò)的Top-5命中率僅為58.47%.本方法避免了耗費(fèi)大量的時(shí)間和精力去收集大規(guī)模圖書頁面圖像數(shù)據(jù)庫,而且利用卷積神經(jīng)網(wǎng)絡(luò)強(qiáng)大的圖像特征描述能力,取得了優(yōu)異的圖書頁面檢索精度.
[Abstract]:Aiming at the problem of low retrieval accuracy of existing book page retrieval methods, task-independent data sets are used to train convolutional neural networks. In this paper, a book page retrieval method based on convolution neural network is proposed. Firstly, image segmentation and distortion correction are carried out to reduce the influence of background interference and geometric distortion. Then the corrected image input convolution neural network is used to extract the image features. Finally, the angle cosine distance is used to measure the similarity between the image to be tested and the candidate image. The experimental results show that the Top-5 hit ratio of this method on the test data set is 97.31%. However, the Top-5 hit ratio of convolutional neural networks trained directly using task-independent data sets is only 58.47. This method avoids consuming a lot of time and effort to collect large scale book page image database. . Moreover, by using the powerful image feature description ability of the convolution neural network, the excellent retrieval accuracy of the book page is obtained.
【作者單位】: 華中師范大學(xué)國家數(shù)字化學(xué)習(xí)工程技術(shù)研究中心;華中師范大學(xué)教育信息技術(shù)協(xié)同創(chuàng)新中心;
【基金】:國家自然科學(xué)基金資助項(xiàng)目(61702208,41671377,61502195) 中央高;究蒲袠I(yè)務(wù)費(fèi)專項(xiàng)資金資助項(xiàng)目(CCNU17QN0003,CCNU2016A02020)
【分類號】:TP183;TP391.41
【正文快照】: 基于計(jì)算機(jī)視覺的圖書頁面檢索存在大量的潛在應(yīng)用,如圖書管理[1]、電子資源快速訪問[2-3]、增強(qiáng)現(xiàn)實(shí)和電子商務(wù)等.圖書頁面檢索是基于內(nèi)容的圖像檢索(CBIR)的一個(gè)特例.由于數(shù)據(jù)庫中保存的是圖書頁面的標(biāo)準(zhǔn)圖像,而用戶拍攝的待檢圖像中一般包含有大量的背景干擾并且存在嚴(yán)重的
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 曠章輝;王甲海;周雅蘭;;用改進(jìn)的競爭Hopfield神經(jīng)網(wǎng)絡(luò)求解多邊形近似問題[J];計(jì)算機(jī)科學(xué);2009年03期
2 高永建 ,吳健康;神經(jīng)網(wǎng)絡(luò)及其識別應(yīng)用簡介[J];電信科學(xué);1990年02期
3 謝國梁;;神經(jīng)網(wǎng)絡(luò):從希望到現(xiàn)實(shí)[J];激光與光電子學(xué)進(jìn)展;1991年01期
4 鄭士貴;文獻(xiàn)自動閱讀神經(jīng)網(wǎng)絡(luò)[J];管理科學(xué)文摘;1996年08期
5 呂芬;趙生妹;;基于Hopfield神經(jīng)網(wǎng)絡(luò)的噪聲字母識別[J];計(jì)算機(jī)與信息技術(shù);2005年12期
6 李毅;童紅俊;宋貴寶;李冬;;神經(jīng)網(wǎng)絡(luò)在飛行器航跡仿真計(jì)算中的應(yīng)用[J];海軍航空工程學(xué)院學(xué)報(bào);2006年05期
7 林鋼;;基于SOM神經(jīng)網(wǎng)絡(luò)對潛在客戶的挖掘[J];南寧職業(yè)技術(shù)學(xué)院學(xué)報(bào);2006年04期
8 楊帆;陳勁杰;唐梅華;陳鑫;;簡論神經(jīng)網(wǎng)絡(luò)在搜索中的應(yīng)用[J];機(jī)械管理開發(fā);2008年01期
9 朱紅斌;;LVQ神經(jīng)網(wǎng)絡(luò)在交通事件檢測中的應(yīng)用[J];計(jì)算機(jī)工程與應(yīng)用;2008年34期
10 李彤巖;李興明;;神經(jīng)網(wǎng)絡(luò)在確定關(guān)聯(lián)規(guī)則挖掘算法權(quán)值中的應(yīng)用研究[J];計(jì)算機(jī)應(yīng)用研究;2008年05期
相關(guān)會議論文 前10條
1 陳文新;王長富;戴蓓倩;;基于神經(jīng)網(wǎng)絡(luò)的漢語四聲識別[A];第一屆全國語言識別學(xué)術(shù)報(bào)告與展示會論文集[C];1990年
2 李睿;李明軍;;一種模糊高斯基神經(jīng)網(wǎng)絡(luò)在數(shù)值逼近上的仿真[A];計(jì)算機(jī)技術(shù)與應(yīng)用進(jìn)展——全國第17屆計(jì)算機(jī)科學(xué)與技術(shù)應(yīng)用(CACIS)學(xué)術(shù)會議論文集(上冊)[C];2006年
3 許旭萍;臧道青;;采用Hopfield神經(jīng)網(wǎng)絡(luò)實(shí)施缸蓋表面點(diǎn)陣字符識別[A];第十五屆全國汽車檢測技術(shù)年會論文集[C];2011年
4 朱長春;;神經(jīng)網(wǎng)絡(luò)用于線性時(shí)固有系統(tǒng)的廣義狀態(tài)轉(zhuǎn)移矩陣的識別[A];中國工程物理研究院科技年報(bào)(1999)[C];1999年
5 王玉斌;李永明;王穎;;用數(shù)據(jù)挖掘和神經(jīng)網(wǎng)絡(luò)技術(shù)預(yù)測工程造價(jià)[A];第十一屆全國電工數(shù)學(xué)學(xué)術(shù)年會論文集[C];2007年
6 應(yīng)捷;袁一方;;神經(jīng)網(wǎng)絡(luò)指紋特征點(diǎn)匹配算法的改進(jìn)[A];2007'中國儀器儀表與測控技術(shù)交流大會論文集(二)[C];2007年
7 謝小良;符卓;;基于Hopfield神經(jīng)網(wǎng)絡(luò)的單周期船舶調(diào)度模型及算法[A];2008年全國開放式分布與并行計(jì)算機(jī)學(xué)術(shù)會議論文集(下冊)[C];2008年
8 陳意;;神經(jīng)網(wǎng)絡(luò)在船舶識別一個(gè)應(yīng)用[A];船舶航泊安全的新經(jīng)驗(yàn)新技術(shù)論文集(上冊)[C];2007年
9 王輝;楊杰;黎明;蔡念;;一種基于神經(jīng)網(wǎng)絡(luò)的圖像復(fù)原方法[A];2006年全國光電技術(shù)學(xué)術(shù)交流會會議文集(D 光電信息處理技術(shù)專題)[C];2006年
10 賈睿;徐啟強(qiáng);劉艷;;基于神經(jīng)網(wǎng)絡(luò)的網(wǎng)殼結(jié)構(gòu)近似分析研究[A];第二十一屆全國振動與噪聲高技術(shù)及應(yīng)用學(xué)術(shù)會議論文集[C];2008年
相關(guān)重要報(bào)紙文章 前1條
1 中國科技大學(xué)計(jì)算機(jī)系 邢方亮;神經(jīng)網(wǎng)絡(luò)挑戰(zhàn)人類大腦[N];計(jì)算機(jī)世界;2003年
相關(guān)博士學(xué)位論文 前10條
1 李曉剛;基于神經(jīng)網(wǎng)絡(luò)的碼垛機(jī)器人視覺位姿測量及伺服控制研究[D];北京林業(yè)大學(xué);2015年
2 戶保田;基于深度神經(jīng)網(wǎng)絡(luò)的文本表示及其應(yīng)用[D];哈爾濱工業(yè)大學(xué);2016年
3 沈旭;基于序列深度學(xué)習(xí)的視頻分析:建模表達(dá)與應(yīng)用[D];中國科學(xué)技術(shù)大學(xué);2017年
4 諸勇;正交回歸神經(jīng)網(wǎng)絡(luò)及其在控制系統(tǒng)中的應(yīng)用[D];浙江大學(xué);1998年
5 田景文;地下油藏的仿真與預(yù)測[D];哈爾濱工程大學(xué);2001年
6 彭宏京;基于稀疏RAM的神經(jīng)網(wǎng)絡(luò)及其人臉識別應(yīng)用研究[D];南京航空航天大學(xué);2002年
7 王吉權(quán);BP神經(jīng)網(wǎng)絡(luò)的理論及其在農(nóng)業(yè)機(jī)械化中的應(yīng)用研究[D];沈陽農(nóng)業(yè)大學(xué);2011年
8 王鑫;基于表示學(xué)習(xí)的情感分析關(guān)鍵技術(shù)研究[D];哈爾濱工業(yè)大學(xué);2017年
9 郭海湘;石油儲層縱向預(yù)測軟硬計(jì)算融合的理論與方法研究[D];中國地質(zhì)大學(xué);2008年
10 葛利;基于過程神經(jīng)網(wǎng)絡(luò)的時(shí)序數(shù)據(jù)挖掘研究[D];哈爾濱工程大學(xué);2012年
相關(guān)碩士學(xué)位論文 前10條
1 陳彥至;神經(jīng)網(wǎng)絡(luò)降維算法研究與應(yīng)用[D];華南理工大學(xué);2015年
2 蔡邦宇;人臉識別中單次ERP時(shí)空特征分析及其快速檢索的應(yīng)用[D];浙江大學(xué);2015年
3 鄭川;垃圾評論檢測算法的研究[D];西南交通大學(xué);2015年
4 汪濟(jì)民;基于卷積神經(jīng)網(wǎng)絡(luò)的人臉檢測和性別識別研究[D];南京理工大學(xué);2015年
5 彭玲玲;基于不確定理論與機(jī)器學(xué)習(xí)的行人檢測[D];長安大學(xué);2015年
6 楊陳東;BP-Fisher判別分析法[D];長安大學(xué);2015年
7 孟鑫;基于Hadoop云平臺下的客流量預(yù)測研究[D];長安大學(xué);2015年
8 張勇;深度卷積神經(jīng)網(wǎng)絡(luò)在車牌和人臉檢測領(lǐng)域的應(yīng)用研究[D];鄭州大學(xué);2015年
9 宋璐璐;財(cái)經(jīng)職業(yè)技術(shù)學(xué)院票務(wù)管理系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];西安工業(yè)大學(xué);2015年
10 陳銳浩;基于神經(jīng)網(wǎng)絡(luò)的口令屬性分析工具開發(fā)[D];上海交通大學(xué);2015年
,本文編號:1409642
本文鏈接:http://www.sikaile.net/kejilunwen/zidonghuakongzhilunwen/1409642.html