搜索引擎中爬蟲的若干問題研究.pdf 全文
本文關(guān)鍵詞:搜索引擎中爬蟲的若干問題研究,由筆耕文化傳播整理發(fā)布。
北京郵電大學(xué)
碩士學(xué)位論文
搜索引擎中爬蟲的若干問題研究
姓名:楊溥
申請學(xué)位級別:碩士
專業(yè):模式識別與智能系統(tǒng)
指導(dǎo)教師:郭軍
20090116
北京Illgi乜人學(xué)碩一I-學(xué)位論文
搜索引擎中爬蟲的若干問題研究
摘要
本文針對爬蟲在當(dāng)前網(wǎng)絡(luò)環(huán)境中衍生的不同的性質(zhì)提出一些針
對各個性質(zhì)的爬蟲構(gòu)架方法,,并對各種方法進行實驗分析,主要創(chuàng)新
工作和成果如下:
第一,總結(jié)了搜索引擎中爬蟲的基本性質(zhì)。
介紹了搜索引擎中爬蟲的第一個基本性質(zhì)多線程斷點續(xù)傳,并從
產(chǎn)生背景,實現(xiàn)和設(shè)計優(yōu)點三個方面進行闡述,然后介紹了搜索引擎
中爬蟲的第二個基本性質(zhì)內(nèi)部網(wǎng)可定制,也并從產(chǎn)生背景,實現(xiàn)和設(shè)
計優(yōu)點三個方面進行闡述。
第二,總結(jié)了搜索引擎中爬蟲的特色性質(zhì)。
介紹了搜索引擎中爬蟲的六個特色性質(zhì):針對布告欄的數(shù)據(jù)分
類,針對布告欄的并行式關(guān)聯(lián),針對論壇的自動動態(tài)更新,針對論壇
的同話題定位跟蹤,針對視頻的可預(yù)覽,針對視頻的真實尋址,并分
別從產(chǎn)生背景,實現(xiàn)和設(shè)計優(yōu)點三個方面進行詳盡闡述。
第三,本文給出八種不同爬蟲系統(tǒng)的設(shè)計方案及實現(xiàn)。
針對搜索引擎中爬蟲的兩個基本性質(zhì)和六個特色性質(zhì)實現(xiàn)爬蟲
系統(tǒng)的架構(gòu)和給出詳細(xì)的構(gòu)造分析。
第四,本文針對八種不同爬蟲系統(tǒng)給出實驗及結(jié)論。
對構(gòu)架出的爬蟲系統(tǒng)進行性能試驗分析,并給出分析結(jié)論。
關(guān)鍵詞:
信息檢索垂直信息檢索搜索引擎爬蟲基本性質(zhì)
本文關(guān)鍵詞:搜索引擎中爬蟲的若干問題研究,由筆耕文化傳播整理發(fā)布。
本文編號:82343
本文鏈接:http://www.sikaile.net/kejilunwen/sousuoyinqinglunwen/82343.html