面向煙草行業(yè)的搜索引擎的研究與應(yīng)用
發(fā)布時間:2017-12-05 19:11
本文關(guān)鍵詞:面向煙草行業(yè)的搜索引擎的研究與應(yīng)用
更多相關(guān)文章: 搜索引擎 網(wǎng)絡(luò)爬蟲 主題判別 煙草行業(yè)
【摘要】:立足煙草行業(yè),結(jié)合筆者在實際項目中的開發(fā)經(jīng)歷,介紹了垂直搜索引擎的設(shè)計思路。分別對用戶接口模塊、檢索模塊、網(wǎng)頁解析模塊、網(wǎng)絡(luò)爬蟲模塊進行了梳理與總結(jié),重點闡述了網(wǎng)絡(luò)爬蟲的主題判別思路。在主題判別的過程中,將預(yù)判因子、元信息因子、詞庫因子納入主題相關(guān)度的計算,提高了搜索引擎的查準率。
【作者單位】: 浙江理工大學(xué)信息學(xué)院;
【分類號】:TP391.3
【正文快照】: 1項目背景性。正因如此,所有商業(yè)化的搜索引擎在頁面設(shè)計上都力求簡目前,煙草行業(yè)通用搜索引擎很難滿足用戶的需求。一方潔,在設(shè)計本行業(yè)的垂直搜索引擎時也要秉承這一原則,以免喧面,通用搜索引擎的智能水平有限,無法準確辨析“一詞多義”的賓奪主。關(guān)鍵詞,另一方面,煙草行業(yè),
本文編號:1255866
本文鏈接:http://www.sikaile.net/kejilunwen/sousuoyinqinglunwen/1255866.html
最近更新
教材專著