基于行業(yè)知識(shí)垂直搜索引擎的研究與實(shí)現(xiàn)
發(fā)布時(shí)間:2018-01-26 14:16
本文關(guān)鍵詞: 垂直搜索引擎 采集 設(shè)計(jì) 出處:《北京郵電大學(xué)》2012年碩士論文 論文類型:學(xué)位論文
【摘要】:搜索引擎為網(wǎng)絡(luò)用戶提供一個(gè)接口,幫助用戶在這浩如煙海的巨大信息庫里各取所需。但僅僅利用通用搜索引擎來實(shí)時(shí)更新網(wǎng)頁信息已經(jīng)不能滿足固定用戶更深入的需求,具體表現(xiàn)在信息覆蓋率和準(zhǔn)確率低、返回有效內(nèi)容不夠精準(zhǔn)、無效信息偏多等方面;另外,通用搜索引擎在維護(hù)龐大的網(wǎng)頁索引庫、采集信息、存儲(chǔ)信息等方面都呈現(xiàn)出困難。由此,面向?qū)I(yè)的垂直搜索引擎應(yīng)運(yùn)而生,彌補(bǔ)了通用搜索引擎的這些不足,本文介紹了北京移動(dòng)開發(fā)建設(shè)的基于行業(yè)知識(shí)的垂直搜索引擎系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)過程。主要工作如下: 首先簡要介紹了論文研究的背景和課題來源,以及搜索引擎技術(shù)的研究意義,國內(nèi)外發(fā)展現(xiàn)狀。其次論述了搜索引擎的基本概念以及通用搜索引擎與垂直搜索引擎相關(guān)技術(shù),分析兩類搜索引擎在各自應(yīng)用領(lǐng)域的優(yōu)缺點(diǎn),以及二者在關(guān)鍵技術(shù)、系統(tǒng)整體架構(gòu)等方面的異同,本文以BMCC項(xiàng)目中暴露出的搜索引擎問題為需求,根據(jù)實(shí)際應(yīng)用設(shè)計(jì)了基于垂直搜索引擎技術(shù)系統(tǒng)結(jié)構(gòu),改進(jìn)了原有系統(tǒng)的不足之處。接下來,闡述在BMCC項(xiàng)目中的主要功能模塊算法和關(guān)鍵技術(shù)的設(shè)計(jì)及其實(shí)現(xiàn)部分。最后詳述了系統(tǒng)的應(yīng)用成果。BMCC垂直搜索項(xiàng)目改進(jìn)原有搜索系統(tǒng)的不足之處并實(shí)現(xiàn)了新的應(yīng)用功能。本項(xiàng)目的工作流程、總體設(shè)計(jì)思路、具體關(guān)鍵技術(shù)實(shí)現(xiàn),對(duì)于垂直搜索引擎技術(shù)的研究以及搭建實(shí)用垂直搜索引擎系統(tǒng)都具有參考意義。 BMCC垂直搜索引擎系統(tǒng)已經(jīng)在實(shí)際中成功運(yùn)用,具有較好的效果,充分滿足了專業(yè)領(lǐng)域用戶的需求,具有廣闊的市場前景和實(shí)用價(jià)值。
[Abstract]:This paper introduces the design and realization process of vertical search engine system based on industry knowledge , which is based on industry knowledge in Beijing mobile development . The main work is as follows : This paper briefly introduces the background and subject source of the research and the research significance of the search engine technology , the research significance of the search engine technology and the development situation at home and abroad . Secondly , it discusses the advantages and disadvantages of the search engine and the related technologies of the general search engine and the vertical search engine . BMCC vertical search engine system has been successfully applied in practice , has good effect , fully satisfies the needs of users in the professional field , and has broad market prospect and practical value .
【學(xué)位授予單位】:北京郵電大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2012
【分類號(hào)】:TP391.3
【參考文獻(xiàn)】
相關(guān)期刊論文 前3條
1 李蕾;周延泉;王菁華;;基于全信息的中文信息抽取系統(tǒng)及應(yīng)用[J];北京郵電大學(xué)學(xué)報(bào);2005年06期
2 劉遷;賈惠波;;中文信息處理中自動(dòng)分詞技術(shù)的研究與展望[J];計(jì)算機(jī)工程與應(yīng)用;2006年03期
3 李慶虎,陳玉健,孫家廣;一種中文分詞詞典新機(jī)制——雙字哈希機(jī)制[J];中文信息學(xué)報(bào);2003年04期
相關(guān)碩士學(xué)位論文 前1條
1 薛建春;垂直搜索引擎中網(wǎng)絡(luò)蜘蛛的設(shè)計(jì)與實(shí)現(xiàn)[D];中國地質(zhì)大學(xué)(北京);2007年
,本文編號(hào):1465821
本文鏈接:http://www.sikaile.net/kejilunwen/sousuoyinqinglunwen/1465821.html
最近更新
教材專著