天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

一種基于分隔條的網(wǎng)頁(yè)分塊算法

發(fā)布時(shí)間:2017-07-26 17:11

  本文關(guān)鍵詞:一種基于分隔條的網(wǎng)頁(yè)分塊算法


  更多相關(guān)文章: Web分塊 視覺(jué)特征 分隔條 網(wǎng)頁(yè)分塊


【摘要】:網(wǎng)絡(luò)信息時(shí)代的到來(lái)使得網(wǎng)絡(luò)中的信息量呈指數(shù)增長(zhǎng),由此研究如何從網(wǎng)頁(yè)中高效地提取出有用信息成為網(wǎng)絡(luò)信息檢索領(lǐng)域中的重要課題。從網(wǎng)頁(yè)的可視性和統(tǒng)一性兩大基本特征出發(fā),提出一種通過(guò)檢測(cè)分隔條對(duì)網(wǎng)頁(yè)進(jìn)行分塊的算法,并使用相對(duì)位置排版的概念解決在部分分塊的高度未知的情況下如何表示各分塊的相對(duì)位置的問(wèn)題。分塊過(guò)程中,通過(guò)已分塊數(shù)、節(jié)點(diǎn)的信息長(zhǎng)度、寬高等信息綜合確定分塊的終止條件,保證了算法的執(zhí)行效率和有效性。實(shí)驗(yàn)結(jié)果說(shuō)明,該算法具有較高的執(zhí)行效率。
【作者單位】: 遼寧科技大學(xué)軟件學(xué)院;
【關(guān)鍵詞】Web分塊 視覺(jué)特征 分隔條 網(wǎng)頁(yè)分塊
【分類(lèi)號(hào)】:TP393.092;TP391.3
【正文快照】: 0引言世界的信息化已經(jīng)到來(lái),網(wǎng)絡(luò)作為信息化的載體勢(shì)必會(huì)充斥著大量的信息,這些信息大多數(shù)是我們不關(guān)心的,因此對(duì)如何高效地從海量的網(wǎng)絡(luò)信息中提出有用的信息的研究是很有必要的。眾所周知,大多數(shù)網(wǎng)絡(luò)信息是通過(guò)網(wǎng)頁(yè)的形式展現(xiàn)的,網(wǎng)絡(luò)信息抽取轉(zhuǎn)換成了對(duì)這些網(wǎng)頁(yè)的分析與信息

【參考文獻(xiàn)】

中國(guó)期刊全文數(shù)據(jù)庫(kù) 前4條

1 于滿泉,陳鐵睿,許洪波;基于分塊的網(wǎng)頁(yè)信息解析器的研究與設(shè)計(jì)[J];計(jì)算機(jī)應(yīng)用;2005年04期

2 黃文蓓;楊靜;顧君忠;;基于分塊的網(wǎng)頁(yè)正文信息提取算法研究[J];計(jì)算機(jī)應(yīng)用;2007年S1期

3 王磊;蔣建中;郭軍利;;基于擴(kuò)展DOM樹(shù)的Web頁(yè)面信息抽取[J];計(jì)算機(jī)應(yīng)用與軟件;2007年06期

4 孫曉輝;劉建;王勁林;陳曉;;基于CSS的網(wǎng)頁(yè)分割算法[J];微計(jì)算機(jī)應(yīng)用;2008年09期

【共引文獻(xiàn)】

中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條

1 宋健豪;趙剛;;基于啟發(fā)式規(guī)則優(yōu)化的網(wǎng)頁(yè)元素提取方法[J];信息安全與技術(shù);2012年06期

2 張敏;;基于確定性樹(shù)自動(dòng)機(jī)技術(shù)的信息抽取研究[J];才智;2011年36期

3 王楠;;一種實(shí)現(xiàn)Web數(shù)據(jù)到XML文檔的轉(zhuǎn)換算法[J];大連海事大學(xué)學(xué)報(bào);2010年03期

4 鄭志材;張晶;;基于JAVA的網(wǎng)絡(luò)蜘蛛的設(shè)計(jì)與實(shí)現(xiàn)[J];硅谷;2009年14期

5 柳永念;鐘誠(chéng);焦小焦;;基于單元識(shí)別的網(wǎng)頁(yè)信息抽取方法[J];廣西大學(xué)學(xué)報(bào)(自然科學(xué)版);2011年05期

6 任玉;樊勇;鄭家恒;;基于分塊的網(wǎng)頁(yè)主題文本抽取[J];廣西師范大學(xué)學(xué)報(bào)(自然科學(xué)版);2009年01期

7 張春元;;基于CRFs的新聞網(wǎng)頁(yè)主題內(nèi)容自動(dòng)抽取方法[J];廣西師范大學(xué)學(xué)報(bào)(自然科學(xué)版);2011年01期

8 縣小平;;垂直搜索引擎探索[J];甘肅高師學(xué)報(bào);2013年02期

9 吳斌杰;徐子瑋;虞飛華;;基于API的微博信息采集系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[J];電腦知識(shí)與技術(shù);2013年17期

10 向程冠;熊世桓;;一種基于特征樹(shù)的Web碎片信息抽取算法[J];蘭州理工大學(xué)學(xué)報(bào);2014年01期

中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前2條

1 梁勇;張文;;網(wǎng)絡(luò)輿情采集系統(tǒng)的設(shè)計(jì)[A];2011年全國(guó)通信安全學(xué)術(shù)會(huì)議論文集[C];2011年

2 吳倩;楊逍;張兆心;;基于視覺(jué)特征的網(wǎng)頁(yè)信息提取[A];第六屆全國(guó)信息檢索學(xué)術(shù)會(huì)議論文集[C];2010年

中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前2條

1 陳竹敏;面向垂直搜索引擎的主題爬行技術(shù)研究[D];山東大學(xué);2008年

2 孟憲軍;互聯(lián)網(wǎng)文本聚類(lèi)與檢索技術(shù)研究[D];哈爾濱工業(yè)大學(xué);2009年

中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條

1 呂芳芳;基于查詢擴(kuò)展的垂直搜索研究[D];山東科技大學(xué);2010年

2 王樂(lè)超;Web環(huán)境下文獻(xiàn)信息的提取與匹配研究[D];大連理工大學(xué);2010年

3 汪前秀;基于改進(jìn)的VSM的不良文本過(guò)濾模型研究[D];東北財(cái)經(jīng)大學(xué);2010年

4 陶小波;電子就業(yè)文本挖掘系統(tǒng)關(guān)鍵技術(shù)研究與應(yīng)用[D];浙江工商大學(xué);2011年

5 王偉;搜索引擎智能化技術(shù)中若干關(guān)鍵問(wèn)題的研究與實(shí)現(xiàn)[D];河北科技大學(xué);2011年

6 馬俊;基于購(gòu)物搜索引擎的網(wǎng)頁(yè)解析模塊的設(shè)計(jì)與實(shí)現(xiàn)[D];北京郵電大學(xué);2010年

7 侯明燕;基于網(wǎng)頁(yè)信息定位的數(shù)據(jù)抽取技術(shù)的研究[D];暨南大學(xué);2011年

8 王偉;基于網(wǎng)絡(luò)信息的熱點(diǎn)事件發(fā)現(xiàn)與分析研究[D];華東師范大學(xué);2011年

9 任昌;基于多特征融合的網(wǎng)頁(yè)對(duì)象自動(dòng)定位技術(shù)研究[D];中北大學(xué);2011年

10 易聰;基于Web挖掘的企業(yè)競(jìng)爭(zhēng)情報(bào)系統(tǒng)構(gòu)建研究[D];華南理工大學(xué);2011年

【二級(jí)參考文獻(xiàn)】

中國(guó)期刊全文數(shù)據(jù)庫(kù) 前8條

1 王琦,唐世渭,楊冬青,王騰蛟;基于DOM的網(wǎng)頁(yè)主題信息自動(dòng)提取[J];計(jì)算機(jī)研究與發(fā)展;2004年10期

2 張樹(shù)瑜,朱仲英;基于MT決策樹(shù)的Web信息抽取研究[J];計(jì)算機(jī)工程與應(yīng)用;2004年13期

3 李蕾;王勁林;白鶴;胡晶晶;;基于FFT的網(wǎng)頁(yè)正文提取算法研究與實(shí)現(xiàn)[J];計(jì)算機(jī)工程與應(yīng)用;2007年30期

4 李效東,顧毓清;基于DOM的Web信息提取[J];計(jì)算機(jī)學(xué)報(bào);2002年05期

5 于滿泉,陳鐵睿,許洪波;基于分塊的網(wǎng)頁(yè)信息解析器的研究與設(shè)計(jì)[J];計(jì)算機(jī)應(yīng)用;2005年04期

6 孫承杰,關(guān)毅;基于統(tǒng)計(jì)的網(wǎng)頁(yè)正文信息抽取方法的研究[J];中文信息學(xué)報(bào);2004年05期

7 羅永蓮;秦振吉;;新聞網(wǎng)頁(yè)主題內(nèi)容提取方法研究[J];微計(jì)算機(jī)應(yīng)用;2007年05期

8 吳鵬飛;孟祥增;劉俊曉;馬鳳娟;;網(wǎng)頁(yè)區(qū)域分割與識(shí)別技術(shù)[J];現(xiàn)代計(jì)算機(jī);2006年06期

【相似文獻(xiàn)】

中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條

1 竇朝暉,胡慶豐;Copy:提高分塊算法性能的有效方法[J];計(jì)算機(jī)工程與科學(xué);1999年06期

2 吳翔;譚李;陸文凱;張學(xué)工;;提高超大規(guī)模SVM訓(xùn)練計(jì)算速度的研究[J];模式識(shí)別與人工智能;2003年01期

3 王康,王小銘;一種基于顏色分塊特征的自適應(yīng)圖象檢索方法[J];計(jì)算機(jī)工程與應(yīng)用;2005年32期

4 楊麗娟;劉教民;王震洲;趙艷;;基于分塊幀差的視頻圖像運(yùn)動(dòng)檢測(cè)[J];河北科技大學(xué)學(xué)報(bào);2006年01期

5 韋立慶;陳秀宏;;分塊類(lèi)增廣PCA及其在人臉識(shí)別中的應(yīng)用[J];計(jì)算機(jī)工程;2011年03期

6 竇朝暉,胡慶豐,張秀山;主維對(duì)矩陣運(yùn)算性能的影響[J];國(guó)防科技大學(xué)學(xué)報(bào);1999年03期

7 陳興波;王曉明;;一種快速RSA算法的改進(jìn)[J];計(jì)算機(jī)工程與設(shè)計(jì);2006年22期

8 鄭秋梅;蔣曉紅;楊發(fā)科;高元濤;;基于分塊技術(shù)的圖像檢索方法的改進(jìn)與實(shí)現(xiàn)[J];計(jì)算機(jī)系統(tǒng)應(yīng)用;2008年02期

9 陳艷華;伊波;崔艷玲;李紅宇;;集合劃分的深層結(jié)構(gòu)的計(jì)算機(jī)輔助研究[J];電腦開(kāi)發(fā)與應(yīng)用;2008年07期

10 彭晶;林克正;;基于MPEG-7顏色特征的圖像檢索技術(shù)研究[J];計(jì)算機(jī)與信息技術(shù);2008年10期

中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前10條

1 王猛;侯德文;李玉山;;基于自適應(yīng)分塊和HVS的數(shù)字水印方案[A];山東省計(jì)算機(jī)學(xué)會(huì)2005年信息技術(shù)與信息化研討會(huì)論文集(一)[C];2005年

2 李嘉偉;孫明;;基于分塊LAB特征的粒子濾波目標(biāo)跟蹤算法[A];中國(guó)農(nóng)業(yè)工程學(xué)會(huì)2011年學(xué)術(shù)年會(huì)論文集[C];2011年

3 陳思坤;吳洪;;基于圖分塊并利用空間金字塔的醫(yī)學(xué)圖像分類(lèi)[A];第六屆和諧人機(jī)環(huán)境聯(lián)合學(xué)術(shù)會(huì)議(HHME2010)、第19屆全國(guó)多媒體學(xué)術(shù)會(huì)議(NCMT2010)、第6屆全國(guó)人機(jī)交互學(xué)術(shù)會(huì)議(CHCI2010)、第5屆全國(guó)普適計(jì)算學(xué)術(shù)會(huì)議(PCC2010)論文集[C];2010年

4 杜以華;高金花;文振q;;融合結(jié)構(gòu)信息與時(shí)域定序法的視頻拷貝檢測(cè)算法[A];第七屆和諧人機(jī)環(huán)境聯(lián)合學(xué)術(shù)會(huì)議(HHME2011)論文集【oral】[C];2011年

5 許洋;馮新桓;賈啟龍;唐寧九;;基于多路數(shù)據(jù)傳輸?shù)囊环N新型加密技術(shù)[A];全國(guó)第20屆計(jì)算機(jī)技術(shù)與應(yīng)用學(xué)術(shù)會(huì)議(CACIS·2009)暨全國(guó)第1屆安全關(guān)鍵技術(shù)與應(yīng)用學(xué)術(shù)會(huì)議論文集(上冊(cè))[C];2009年

6 汪麗華;汪道寅;王澤梁;;SIFT算法圖像自適應(yīng)優(yōu)化[A];浙江省電子學(xué)會(huì)2011學(xué)術(shù)年會(huì)論文集[C];2011年

7 吳成玉;邰曉英;趙杰煜;;顏色、紋理及相關(guān)反饋技術(shù)在圖像檢索中的綜合應(yīng)用[A];第二十屆全國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2003年

8 姜太平;占濤;王帥;梅英;;基于體繪制的真三維顯示中體素路徑優(yōu)化算法分析[A];第六屆和諧人機(jī)環(huán)境聯(lián)合學(xué)術(shù)會(huì)議(HHME2010)、第19屆全國(guó)多媒體學(xué)術(shù)會(huì)議(NCMT2010)、第6屆全國(guó)人機(jī)交互學(xué)術(shù)會(huì)議(CHCI2010)、第5屆全國(guó)普適計(jì)算學(xué)術(shù)會(huì)議(PCC2010)論文集[C];2010年

9 朱士蓉;謝昭;高雋;;一種圖模型下的柔性圖像分割方法[A];中國(guó)儀器儀表學(xué)會(huì)第十二屆青年學(xué)術(shù)會(huì)議論文集[C];2010年

10 文振q;高金花;劉朋飛;杜以華;張萌;;基于分塊DCT和PCA的圖像感知哈希算法研究[A];第十五屆全國(guó)圖象圖形學(xué)學(xué)術(shù)會(huì)議論文集[C];2010年

中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條

1 蔣杰;全球大規(guī)模虛擬地理環(huán)境構(gòu)建關(guān)鍵技術(shù)研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2010年

2 常為領(lǐng);面向?yàn)?zāi)備的無(wú)損數(shù)據(jù)壓縮關(guān)鍵技術(shù)研究[D];哈爾濱工業(yè)大學(xué);2010年

3 魏建生;高性能重復(fù)數(shù)據(jù)檢測(cè)與刪除技術(shù)研究[D];華中科技大學(xué);2012年

4 楊淑平;人臉特征提取與識(shí)別算法研究[D];中南大學(xué);2013年

5 檀敬東;文本挖掘的若干關(guān)鍵算法研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2010年

6 劉晨光;基于單目視頻無(wú)標(biāo)記點(diǎn)的三維人體姿態(tài)估計(jì)的研究[D];哈爾濱工業(yè)大學(xué);2011年

7 郭巖松;壓縮感知關(guān)鍵技術(shù)研究[D];天津大學(xué);2011年

8 呂沛;基于壓縮感知理論的水下成像技術(shù)和圖像壓縮編碼技術(shù)研究[D];中國(guó)科學(xué)院研究生院(西安光學(xué)精密機(jī)械研究所);2012年

9 王威;基于網(wǎng)格快速重構(gòu)的三維地質(zhì)體建模研究與應(yīng)用[D];中國(guó)科學(xué)院研究生院(武漢巖土力學(xué)研究所);2010年

10 王燦;基于在線重復(fù)數(shù)據(jù)消除的海量數(shù)據(jù)處理關(guān)鍵技術(shù)研究[D];電子科技大學(xué);2012年

中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條

1 閔慧;面向語(yǔ)義服務(wù)的大規(guī)模本體分塊映射研究[D];中南大學(xué);2013年

2 賴雅;基于圖分割的大規(guī)模本體分塊與映射研究[D];中南大學(xué);2011年

3 齊朗曄;基于分塊核函數(shù)特征的交通標(biāo)識(shí)識(shí)別[D];南京理工大學(xué);2013年

4 郭維;基于二部圖模型的大本體分塊與映射研究[D];中南大學(xué);2012年

5 王潤(rùn)梅;基于Laplace矩陣的大規(guī)模本體分塊映射的研究[D];中南大學(xué);2011年

6 孫運(yùn)蓮;基于分塊和核參數(shù)選擇的KPCA研究[D];哈爾濱工業(yè)大學(xué);2010年

7 盛名;基于自適應(yīng)分塊的密寫(xiě)算法研究[D];東北師范大學(xué);2010年

8 張建華;基于片段的大本體分塊與映射方法研究[D];中南大學(xué);2010年

9 李沃若;基于感知分塊的灰度化算法研究[D];浙江大學(xué);2008年

10 侯波;真實(shí)感三維地形造型及可視化[D];電子科技大學(xué);2005年

,

本文編號(hào):577446

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/guanlilunwen/ydhl/577446.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶f7b85***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com