基于Scrapy框架的校園搜索引擎設計
發(fā)布時間:2021-10-20 00:30
近年來隨著數(shù)字化校園建設進度的加快,高校校園網站中的信息不斷增加。校園網用戶量和問題數(shù)量的增加導致查找和索引信息變得困難,用戶搜索服務的準確率得不到保障。文章基于Scrapy框架對校園搜索引擎進行設計,利用URL去重策略來提升校園信息的查詢效率,使搜索結果達到滿意期望值。
【文章來源】:科技創(chuàng)新與應用. 2020,(14)
【文章頁數(shù)】:2 頁
【文章目錄】:
引言
1 建立搜索引擎流程分析
1.1 分析搜索引擎框架
1.2 網絡爬蟲
1.3 搜索引擎的索引
1.4 Web查詢界面
2 在搜索引擎中應用Scrapy爬蟲框架
2.1 Scrapy框架工作原理
2.2 Scrapy框架的網頁URL去重策略
2.3 Scrapy框架爬蟲防禁止策略
3 結束語
本文編號:3445894
【文章來源】:科技創(chuàng)新與應用. 2020,(14)
【文章頁數(shù)】:2 頁
【文章目錄】:
引言
1 建立搜索引擎流程分析
1.1 分析搜索引擎框架
1.2 網絡爬蟲
1.3 搜索引擎的索引
1.4 Web查詢界面
2 在搜索引擎中應用Scrapy爬蟲框架
2.1 Scrapy框架工作原理
2.2 Scrapy框架的網頁URL去重策略
2.3 Scrapy框架爬蟲防禁止策略
3 結束語
本文編號:3445894
本文鏈接:http://www.sikaile.net/kejilunwen/sousuoyinqinglunwen/3445894.html
教材專著