天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 搜索引擎論文 >

基于Nutch的移動(dòng)WEB搜索系統(tǒng)的研究與實(shí)現(xiàn)

發(fā)布時(shí)間:2018-04-01 02:06

  本文選題:移動(dòng)WEB 切入點(diǎn):搜索引擎 出處:《北京郵電大學(xué)》2013年碩士論文


【摘要】:隨著3G時(shí)代的到來(lái),移動(dòng)電話,便攜計(jì)算機(jī)等移動(dòng)設(shè)備的普及,越來(lái)越多的用戶使用移動(dòng)終端就能夠便捷的訪問(wèn)網(wǎng)絡(luò)。這樣用戶對(duì)于個(gè)性化和智能化搜索引擎的需求更加明顯,F(xiàn)有的移動(dòng)終端的搜索引擎,大都是直接把本地搜索引擎轉(zhuǎn)移到移動(dòng)終端。這些移動(dòng)搜索引擎僅僅利用純粹的文本相關(guān)度進(jìn)行搜索,甚至把用戶輸入的位置信息也當(dāng)做普通的文本關(guān)鍵字,并沒(méi)有很好的和用戶地理位置等移動(dòng)空間信息結(jié)合起來(lái),而人們?cè)谑褂靡苿?dòng)設(shè)備搜索時(shí)大多數(shù)需求都與空間位置密切相關(guān)。移動(dòng)用戶進(jìn)行搜索查詢時(shí),一般希望搜索引擎不僅可以提供與查詢內(nèi)容密切相關(guān)的網(wǎng)頁(yè),而且可以提供與用戶所在位置空間距離相近的網(wǎng)頁(yè)。因此,現(xiàn)有的移動(dòng)搜索引擎很難使用戶獲得理想的查詢結(jié)果。 本文針對(duì)移動(dòng)搜索引擎所面臨的問(wèn)題入手,研究同時(shí)基于文本相關(guān)性搜索和地理位置相近性搜索的解決方案,提出了一個(gè)基于Nutch的移動(dòng)WEB搜索系統(tǒng)的實(shí)現(xiàn)方案,搭建了一個(gè)基于位置和關(guān)鍵字雙重搜索的移動(dòng)WEB搜索系統(tǒng),實(shí)現(xiàn)了位置相關(guān)的空間搜索。根據(jù)網(wǎng)頁(yè)所描述內(nèi)容的地理位置信息對(duì)網(wǎng)頁(yè)進(jìn)行地理標(biāo)記,該方案可以搜索到與用戶所在位置相關(guān)的網(wǎng)頁(yè),可以用于解決移動(dòng)用戶搜索附近相關(guān)性結(jié)果的難題。通過(guò)使用Lucene和R-tree的混合索引,系統(tǒng)實(shí)現(xiàn)了對(duì)搜索排序結(jié)果的有效優(yōu)化,驗(yàn)證了混合索引結(jié)構(gòu)能夠更快速的為用戶提供綜合文本相關(guān)和距離相近性的結(jié)果。 本文闡述了整套系統(tǒng)的整體框架結(jié)構(gòu)設(shè)計(jì)和各個(gè)主要模塊的實(shí)現(xiàn)細(xì)節(jié),詳細(xì)介紹了網(wǎng)頁(yè)預(yù)處理模塊,索引建立模塊和搜索模塊的各個(gè)關(guān)鍵技術(shù),包括對(duì)網(wǎng)頁(yè)進(jìn)行地理標(biāo)記,基于文本聚類的混合索引插入算法,以及節(jié)點(diǎn)優(yōu)先隊(duì)列的搜索算法。最后,在功能方面和性能方面對(duì)系統(tǒng)進(jìn)行驗(yàn)證測(cè)試。測(cè)試結(jié)果表明,移動(dòng)WEB搜索系統(tǒng)具備了綜合地理位置和文本信息的雙重搜索功能,并具備較好的性能。
[Abstract]:With the arrival of the 3G era, the popularity of mobile phones, portable computers and other mobile devices, more and more users use mobile terminal can easily access the network. So the user for intelligent and personalized search engine needs more obvious. The mobile terminal of the existing search engines, are directly transferred from the local search engine mobile terminal. These mobile search engines use only pure text of the search, and even the location information of the user input as a normal text keyword, and not a very good geographical position and user mobile spatial information together, and people in the use of mobile devices to search the most requirements are closely related to the spatial position. Mobile users search query, search engines can not only provide general hope is closely related with the query content, and can provide It is very difficult for the existing mobile search engine to get the desired result of the query by the existing mobile search engine.
According to the mobile search engine facing problems, at the same time based on text search and Study on correlation between geographical proximity search solutions, proposed a mobile WEB based on Nutch search system, set up a mobile search system WEB position and double keyword search based implementation of space position the search. According to Geotag Web Geographic Information Page describes the content of the program can search and user location of related web pages can be used to solve the problem of mobile user search results. By mixing near correlation index using Lucene and R-tree, the system realizes the effective optimization of search results. Verify the hybrid index structure can more quickly provide users with comprehensive text and distance similar results.
This paper describes the implementation details of main module structure of the overall framework of the whole system design and each of the details of the web page preprocessing module, each key indexing module and search module, including Geotag ", mixed text clustering index insertion algorithm based on search algorithm and node priority queue. Finally, to test the system in function and performance. The test results show that the WEB mobile search system with the dual search function comprehensive geographic location and text information, and have a better performance.

【學(xué)位授予單位】:北京郵電大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2013
【分類號(hào)】:TP391.3;TN929.5

【參考文獻(xiàn)】

相關(guān)期刊論文 前6條

1 高紅;黃德根;楊元生;;漢語(yǔ)自動(dòng)分詞中中文地名識(shí)別[J];大連理工大學(xué)學(xué)報(bào);2006年04期

2 袁琦;;移動(dòng)搜索技術(shù)與業(yè)務(wù)發(fā)展研究[J];電信網(wǎng)技術(shù);2007年04期

3 皋磊,任立紅,丁永生;基于WAP的移動(dòng)電子商務(wù)系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J];計(jì)算機(jī)工程與應(yīng)用;2003年01期

4 張桂剛;;一種類自然語(yǔ)言驅(qū)動(dòng)的語(yǔ)義服務(wù)搜索方法[J];計(jì)算機(jī)科學(xué);2009年07期

5 華秀麗;朱巧明;李培峰;;語(yǔ)義分析與詞頻統(tǒng)計(jì)相結(jié)合的中文文本相似度量方法研究[J];計(jì)算機(jī)應(yīng)用研究;2012年03期

6 錢(qián)晶;張杰;張濤;;基于最大熵的漢語(yǔ)人名地名識(shí)別方法研究[J];小型微型計(jì)算機(jī)系統(tǒng);2006年09期

相關(guān)碩士學(xué)位論文 前10條

1 翁巖青;網(wǎng)頁(yè)抓取策略研究[D];哈爾濱工程大學(xué);2010年

2 楊曉東;中文命名實(shí)體識(shí)別及若干相關(guān)問(wèn)題的研究[D];江蘇大學(xué);2010年

3 史磊峰;移動(dòng)垂直搜索系統(tǒng)的研究[D];北京交通大學(xué);2010年

4 李景;基于DOM樹(shù)信息抽取的移動(dòng)網(wǎng)站開(kāi)發(fā)研究[D];中國(guó)海洋大學(xué);2011年

5 陳鎮(zhèn)虎;面向空間數(shù)據(jù)庫(kù)引擎的空間索引系統(tǒng)[D];北京工業(yè)大學(xué);2002年

6 陳敏;基于R-樹(shù)空間索引的優(yōu)化研究與應(yīng)用[D];福州大學(xué);2006年

7 江慧娜;中文搜索引擎的關(guān)鍵技術(shù)研究[D];北京化工大學(xué);2007年

8 牟力科;Web中文信息抽取技術(shù)與命名實(shí)體識(shí)別方法的研究[D];西北大學(xué);2008年

9 楊滋榮;基于Web數(shù)據(jù)挖掘的面向領(lǐng)域高性能信息檢索研究[D];貴州大學(xué);2008年

10 姚林濤;基于Lucene的Web搜索引擎實(shí)現(xiàn)[D];西安電子科技大學(xué);2008年



本文編號(hào):1693470

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/sousuoyinqinglunwen/1693470.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶cb2a6***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com