天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 碩博論文 > 信息類碩士論文 >

基于CEF的頁面分割算法的研究

發(fā)布時間:2020-08-08 16:07
【摘要】:當(dāng)前,對Deep Web數(shù)據(jù)自動抽取的研究已經(jīng)有不少的研究成果。相比其他方法,基于網(wǎng)頁視覺信息的方法取得了更好的效果。它擺脫了網(wǎng)頁DOM樹的依賴,只利用網(wǎng)頁的視覺信息抽取數(shù)據(jù),提高了抽取的準(zhǔn)確性。然而,利用視覺信息抽取Deep Web數(shù)據(jù)的方法需要先將網(wǎng)頁劃分為單獨的視覺塊。目前,已經(jīng)有許多方法可以實現(xiàn)對網(wǎng)頁的劃分。在這些方法中,VIPS算法(基于視覺信息的頁面分割算法)取得的效果是最好的。相比于其他的方法,VIPS算法不依賴網(wǎng)頁的結(jié)構(gòu),即使網(wǎng)頁結(jié)構(gòu)發(fā)生變化,VIPS算法也能取得很好的效果。鑒于VIPS算法的優(yōu)點,本文采用VIPS算法實現(xiàn)了對網(wǎng)頁的分割。為了提高效率,本文選擇在CEF (Chromium Embedded Framework)框架中實現(xiàn)VIPS算法,并在CEF框架中實現(xiàn)了對頁面結(jié)點視覺信息的獲取。本文主要工作如下:(1)視覺塊抽取。首先利用JS獲取頁面結(jié)點的視覺信息。然后利用這些視覺信息結(jié)合給定的啟發(fā)式規(guī)則判斷DOM結(jié)點是否可以被繼續(xù)分割,將不能被分割的DOM結(jié)點作為一個視覺塊存放在集合中。(2)分隔條探測。首先將整個頁面當(dāng)作一個分隔條,根據(jù)已經(jīng)得到的視覺塊計算出分隔條的位置和大小。然后根據(jù)視覺塊與分隔條的位置關(guān)系分割、移除、修改分隔條。最后設(shè)置每個分隔條的權(quán)重。(3)內(nèi)容結(jié)構(gòu)構(gòu)建。從權(quán)重最小的分隔條集合開始,依次合并分隔條兩側(cè)的視覺塊形成一個新的視覺塊。然后選擇權(quán)重次小的分隔條集合并合并兩側(cè)的視覺塊,以此類推,直到遇到權(quán)重最大的分隔條集合。最終,內(nèi)容結(jié)構(gòu)構(gòu)建完成,得到該頁面對應(yīng)的視覺塊樹。實驗表明,本文提出的方法可以有效的對頁面進行視覺塊劃分。
【學(xué)位授予單位】:中國海洋大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2015
【分類號】:TP393.092

【相似文獻】

相關(guān)期刊論文 前10條

1 張艷濱;余雁;;視覺信息的多維性探究[J];大眾文藝;2013年04期

2 張恒;劉艷麗;;基于視覺信息融合的駕駛員疲勞監(jiān)測方法綜述[J];信息技術(shù);2008年06期

3 李剛;;視覺信息傳遞的模糊性[J];美術(shù)大觀;2010年03期

4 壽天德;尹德輝;;關(guān)于圖形、圖像與腦對視覺信息的處理[J];臨沂師范學(xué)院學(xué)報;2010年01期

5 ;非電話類服務(wù)[J];視聽界;1991年03期

6 韓叢耀;;中華藝術(shù)視覺信息數(shù)據(jù)庫建設(shè)構(gòu)想(上)——視覺信息處理機制的建模及在視覺信息數(shù)據(jù)庫建設(shè)中的應(yīng)用[J];中國教育信息化;2009年17期

7 王苗輝;;基于視知覺的視覺信息界面設(shè)計研究[J];包裝工程;2011年08期

8 汪云九,邢靜;視覺信息加工的一些理論和模型[J];機器人;1987年03期

9 刁云程;“視覺信息加工”研究圓滿結(jié)束[J];中國科學(xué)基金;1994年01期

10 陳果;張武昕;高雋;;微小目標(biāo)的視覺信息獲取及系統(tǒng)設(shè)計[J];合肥工業(yè)大學(xué)學(xué)報(自然科學(xué)版);2007年12期

相關(guān)會議論文 前10條

1 何蕓;杜誠;;21世紀(jì)的視覺信息技術(shù)[A];面向21世紀(jì)的科技進步與社會經(jīng)濟發(fā)展(上冊)[C];1999年

2 翁強;閆麗;翁偉生;;多維空間感知覺模型對視覺信息加工缺損的研究[A];第十一次中國生物物理學(xué)術(shù)大會暨第九屆全國會員代表大會摘要集[C];2009年

3 劉力;龔海韻;;果蠅蘑菇體對視覺信息的歸納作用[A];首屆中國神經(jīng)信息學(xué)討論會摘要[C];2000年

4 孫明;;視覺信息學(xué)的基本概念及其新技術(shù)在農(nóng)業(yè)中的應(yīng)用[A];中國農(nóng)業(yè)工程學(xué)會2011年學(xué)術(shù)年會論文集[C];2011年

5 王書榮;;視覺信息加工中的神經(jīng)元相互作用[A];第九次全國生物物理大會學(xué)術(shù)會議論文摘要集[C];2002年

6 蘇潤娥;吉國明;宋筆鋒;;人的視覺信息捕捉能力測試軟件[A];陜西省航空裝備制造技術(shù)發(fā)展——第九屆陜西省青年科學(xué)家論壇論文集[C];2006年

7 楊瑾;李瀟;王書榮;;家鴿背外側(cè)丘腦神經(jīng)元參與外側(cè)單眼視覺和環(huán)境亮度檢測[A];第九次全國生物物理大會學(xué)術(shù)會議論文摘要集[C];2002年

8 張春宇;張蔚;劉海鵬;于立平;王小捷;李睿凡;;基于視覺信息的漢語詞匯語義習(xí)得[A];中國計算機語言學(xué)研究前沿進展(2007-2009)[C];2009年

9 唐克倫;張湘?zhèn)?成思源;熊漢偉;張洪;;視覺信息與CMM測量數(shù)據(jù)的融合[A];第十二屆全國圖象圖形學(xué)學(xué)術(shù)會議論文集[C];2005年

10 李珊珊;于慶寶;馮士剛;鹿麒麟;唐一源;;視覺信息等級處理的雙腦協(xié)同性研究[A];大連理工大學(xué)生物醫(yī)學(xué)工程學(xué)術(shù)論文集(第2卷)[C];2005年

相關(guān)重要報紙文章 前2條

1 記者 班威;“家務(wù)機器人”能走能做家務(wù)[N];新華每日電訊;2010年

2 本報駐北京記者 李雪;北京心目影院 盲人的音畫世界[N];中國文化報;2014年

相關(guān)博士學(xué)位論文 前7條

1 查正軍;基于機器學(xué)習(xí)方法的視覺信息標(biāo)注研究[D];中國科學(xué)技術(shù)大學(xué);2009年

2 祝博薈;基于深度與視覺信息融合的行人檢測與再識別研究[D];東華大學(xué);2013年

3 何立火;視覺信息質(zhì)量感知模型及評價方法研究[D];西安電子科技大學(xué);2013年

4 尹顯東;多維隨機序列敏感視覺信息隱藏技術(shù)研究[D];電子科技大學(xué);2007年

5 沈喬楠;堆石混凝土施工管理中視覺信息的處理方法及應(yīng)用研究[D];清華大學(xué);2010年

6 王蒙軍;唇讀發(fā)聲器中視覺信息的檢測與處理[D];天津大學(xué);2007年

7 劉震;基于局部視覺信息的大規(guī)模圖像檢索研究[D];中國科學(xué)技術(shù)大學(xué);2015年

相關(guān)碩士學(xué)位論文 前10條

1 王苗苗;聯(lián)合鋒電位和局部場電位的視覺信息整合特性研究[D];鄭州大學(xué);2015年

2 凡思武;基于視覺信息和樹匹配的Deep Web數(shù)據(jù)抽取問題的研究[D];山東大學(xué);2015年

3 李雯琴;基于圖模型的Web表格中視覺信息的研究[D];復(fù)旦大學(xué);2014年

4 田麗;品牌視覺信息的圖形動態(tài)化創(chuàng)意呈現(xiàn)[D];南昌大學(xué);2015年

5 胡義坦;基于視覺信息的無人機著陸參數(shù)估計技術(shù)研究[D];南京航空航天大學(xué);2014年

6 朱冰陽;基于CEF的頁面分割算法的研究[D];中國海洋大學(xué);2015年

7 彭凌玲;視覺信息的能量[D];吉林大學(xué);2005年

8 張e

本文編號:2785789


資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/shoufeilunwen/xixikjs/2785789.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶f3f40***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com