基于決策樹(shù)方法的特定主題Web搜索策略
本文選題:查詢修改 切入點(diǎn):決策樹(shù) 出處:《計(jì)算機(jī)應(yīng)用》2006年01期
【摘要】:基于數(shù)據(jù)挖掘中決策樹(shù)方法提出了一種新的W eb搜索策略。在該策略中,通過(guò)對(duì)預(yù)先采集的W eb頁(yè)面進(jìn)行學(xué)習(xí)得到一棵決策樹(shù),然后對(duì)其進(jìn)行剪枝,得到簡(jiǎn)化布爾表達(dá)式形式的主題內(nèi)在規(guī)律性信息,在其基礎(chǔ)上進(jìn)行查詢修改,把修改后的查詢轉(zhuǎn)發(fā)到通用搜索引擎上,最終得到查詢結(jié)果。實(shí)驗(yàn)結(jié)果表明,提出的查詢策略對(duì)于特定主題的W eb搜索,查詢結(jié)果的質(zhì)量有明顯的改善和提升。
[Abstract]:Based on the decision tree method in data mining, a new Web search strategy is proposed. In this strategy, a decision tree is obtained by learning pre-collected Web pages, and then pruned. The inherent regular information of the subject in the form of simplified Boolean expressions is obtained, and the query is modified on the basis of it, and the modified query is forwarded to the general search engine. Finally, the query results are obtained. The experimental results show that, The proposed query strategy can significantly improve the quality of query results for Web search on a specific topic.
【作者單位】: 山東大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院 山東大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院
【分類號(hào)】:TP393.092
【相似文獻(xiàn)】
相關(guān)會(huì)議論文 前1條
1 王巖;;基于內(nèi)容的垃圾郵件過(guò)濾技術(shù)[A];中國(guó)通信學(xué)會(huì)第六屆學(xué)術(shù)年會(huì)論文集(中)[C];2009年
相關(guān)碩士學(xué)位論文 前8條
1 丁海燕;混合智能模型及其在入侵檢測(cè)中的應(yīng)用[D];東南大學(xué);2005年
2 向昕彥;決策樹(shù)在入侵檢測(cè)中的應(yīng)用研究[D];哈爾濱理工大學(xué);2009年
3 賈寶剛;數(shù)據(jù)挖掘在網(wǎng)絡(luò)入侵檢測(cè)系統(tǒng)中的應(yīng)用研究[D];中國(guó)石油大學(xué);2010年
4 任建玲;基于協(xié)議分析樹(shù)的入侵檢測(cè)技術(shù)研究[D];燕山大學(xué);2006年
5 陳云菁;P2P流量識(shí)別技術(shù)的研究[D];揚(yáng)州大學(xué);2009年
6 劉偉;基于數(shù)據(jù)挖掘的BBS用戶評(píng)價(jià)系統(tǒng)研究[D];長(zhǎng)春理工大學(xué);2011年
7 黃琦鋒;基于數(shù)據(jù)庫(kù)中知識(shí)發(fā)現(xiàn)技術(shù)的入侵檢測(cè)模型[D];福州大學(xué);2004年
8 白凡;改進(jìn)的K近鄰算法在網(wǎng)頁(yè)文本分類中的應(yīng)用[D];安徽大學(xué);2010年
,本文編號(hào):1653336
本文鏈接:http://www.sikaile.net/kejilunwen/sousuoyinqinglunwen/1653336.html