基于位置的移動web搜索方法研究
本文選題:移動搜索 + 位置。 參考:《華中科技大學(xué)》2012年碩士論文
【摘要】:隨著移動設(shè)備的普及和無線網(wǎng)絡(luò)的演化,移動搜索逐漸擴大其在搜索市場的份額,也成為搜索研究的一個重要領(lǐng)域。當(dāng)前的移動用戶終端搜索應(yīng)用或照搬web搜索引擎算法,,或僅僅對位置的進行簡單計算與排序,其結(jié)果排序并不能準(zhǔn)確地反映用戶與目標(biāo)之間的實際到達距離,用戶不能快捷的訪問與自己距離較近的目標(biāo),從而降低用戶搜索體驗。 本文研究的基于位置的移動web搜索方法,就是為了細化搜索,將位置的概念引入到移動搜索中來。對于移動web搜索方法中位置信息的使用和處理,主要有如何獲取位置信息以及如何使用位置信息兩方面。本文即是從這兩方面出發(fā),首先使用CRF(條件隨機場)方法提取頁面內(nèi)容中的地名詞匯,使用中文地名命名規(guī)則來去除地名歧義,使用決策樹算法來排除地名干擾,以此確定頁面內(nèi)容描述的位置信息;然后使用一種結(jié)合頁面重要度和頁面位置信息的綜合評分機制來對常規(guī)web搜索引擎的初步檢索結(jié)果進行基于位置的重排序,使排序結(jié)果的前N項具有更高的相關(guān)程度,從而提高用戶搜索體驗。 本文還為兩方面的研究分別設(shè)計了實驗來比較本方法的性能。實驗結(jié)果表明,結(jié)合CRF、命名規(guī)則和決策樹的頁面內(nèi)容位置抽取方法平均性能較好,結(jié)合重要度和位置信息的綜合評分機制在精確率上的性能較好。
[Abstract]:With the popularity of mobile devices and the evolution of wireless networks, mobile search has gradually expanded its share in the search market, and has become an important area of search research.The current mobile user terminal search application or copy of web search engine algorithm, or simply calculate and sort the location, the result sort can not accurately reflect the actual arrival distance between the user and the target.Users can not quickly access their own close to the target, thus reducing the user search experience.The mobile web search method based on location, which is studied in this paper, is to refine the search and introduce the concept of location into mobile search.For the use and processing of location information in mobile web search methods, there are two aspects: how to obtain location information and how to use location information.From these two aspects, this paper first uses the CRF (conditional random field) method to extract the toponymic vocabulary from the page content, uses the Chinese toponymic naming rules to remove the geographical names ambiguity, and uses the decision tree algorithm to eliminate the geographical names interference.Then, a comprehensive scoring mechanism combining page importance and page location information is used to reorder the initial retrieval results of conventional web search engine based on location.The first N items of sorting results have higher correlation degree, thus improving the user search experience.Experiments are also designed to compare the performance of this method.The experimental results show that the average performance of the page content location extraction method based on CRF, naming rules and decision tree is better, and the comprehensive scoring mechanism combined with importance and location information has better performance on accuracy rate.
【學(xué)位授予單位】:華中科技大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2012
【分類號】:TN929.5
【參考文獻】
相關(guān)期刊論文 前4條
1 李宇寧;忻展紅;;移動搜索業(yè)務(wù)發(fā)展方向分析[J];信息通信;2008年01期
2 陳明;孫麗麗;;基于WAP的移動搜索模型[J];計算機工程;2008年03期
3 李信利 ,馬軍 ,呂月娥 ,張德偉;基于文本分類的網(wǎng)頁排序算法[J];微計算機信息;2005年23期
4 左遠清,周洞汝,王波;自然語言處理在搜索引擎信息檢索中的應(yīng)用[J];現(xiàn)代計算機(專業(yè)版);2002年07期
相關(guān)博士學(xué)位論文 前1條
1 杜萍;基于本體的中國行政區(qū)劃地名識別與抽取研究[D];蘭州大學(xué);2011年
相關(guān)碩士學(xué)位論文 前6條
1 廖文平;基于CRF的中文地名識別研究[D];大連理工大學(xué);2010年
2 孫會嶺;移動環(huán)境中基于聚類的個性化推薦算法研究[D];燕山大學(xué);2011年
3 牟曉霞;我國移動搜索業(yè)務(wù)發(fā)展研究[D];北京郵電大學(xué);2007年
4 楊慧鋒;中國移動搜索概況研究[D];北京郵電大學(xué);2008年
5 史海峰;基于CRF的中文命名實體識別研究[D];蘇州大學(xué);2010年
6 孫珊珊;基于網(wǎng)頁聚類的搜索引擎結(jié)果排序[D];中國石油大學(xué);2010年
本文編號:1770635
本文鏈接:http://www.sikaile.net/kejilunwen/sousuoyinqinglunwen/1770635.html