基于網(wǎng)頁分塊技術(shù)主題爬行器的實(shí)現(xiàn)
[Abstract]:In view of the current situation that the search results of the general search engine are too many and the correlation with the topic is not strong, this paper proposes a method of implementing the theme crawler based on the web page partitioning technology, and implements a prototype system, Crawler1.. The experimental results show that the performance of the system is good and the correlation degree of the web pages is over 55%.
【作者單位】: 吉林大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院 吉林大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院 吉林大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院
【基金】:國家自然科學(xué)基金(批準(zhǔn)號:60373099)
【分類號】:TP393.092
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 李光敏;陳年生;許新山;;面向網(wǎng)頁結(jié)構(gòu)特征的Hopfield算法[J];計(jì)算機(jī)系統(tǒng)應(yīng)用;2011年07期
2 ;[J];;年期
3 ;[J];;年期
4 ;[J];;年期
5 ;[J];;年期
6 ;[J];;年期
7 ;[J];;年期
8 ;[J];;年期
9 ;[J];;年期
10 ;[J];;年期
相關(guān)會議論文 前1條
1 王英;左萬利;王鑫;彭濤;;基于多分類器的Deep Web入口發(fā)現(xiàn)[A];第六屆全國信息檢索學(xué)術(shù)會議論文集[C];2010年
相關(guān)博士學(xué)位論文 前2條
1 陳竹敏;面向垂直搜索引擎的主題爬行技術(shù)研究[D];山東大學(xué);2008年
2 張長利;面向特定領(lǐng)域的互聯(lián)網(wǎng)輿情分析技術(shù)研究[D];吉林大學(xué);2011年
相關(guān)碩士學(xué)位論文 前10條
1 姚斌;設(shè)計(jì)和實(shí)現(xiàn)一個(gè)主題搜索引擎[D];內(nèi)蒙古大學(xué);2004年
2 曹紅;林業(yè)主題搜索引擎研究[D];北京林業(yè)大學(xué);2005年
3 張長利;網(wǎng)頁相似性算法的研究與實(shí)現(xiàn)[D];吉林大學(xué);2005年
4 柳周頻;基于鏈接上下文的網(wǎng)頁預(yù)測[D];吉林大學(xué);2006年
5 董靜茹;基于鏈接背景信息的啟發(fā)式主題爬行[D];吉林大學(xué);2006年
6 聶頌;具有自動分類功能的主題搜索引擎的研究[D];天津大學(xué);2004年
7 王煜;基于頁面劃分的網(wǎng)面預(yù)測[D];吉林大學(xué);2005年
8 楊月奎;基于語義的主題爬行方向研究[D];西華大學(xué);2009年
9 王玉婷;基于用戶本體的初始URLs選擇方法的研究[D];西華大學(xué);2009年
10 萬小容;基于主題信息采集中網(wǎng)頁分類系統(tǒng)研究[D];昆明理工大學(xué);2006年
,本文編號:2360345
本文鏈接:http://www.sikaile.net/kejilunwen/sousuoyinqinglunwen/2360345.html