一種基于關(guān)鍵特征的搜索引擎結(jié)果聚類算法
本文關(guān)鍵詞: 搜索引擎 算法 特征提取 文檔聚類 向量空間模型VSM KFC算法 出處:《北京航空航天大學(xué)學(xué)報》2007年06期 論文類型:期刊論文
【摘要】:為了解決用戶在搜索引擎結(jié)果列表中尋找所需信息困難的問題,幫助用戶快速有效地定位有價值的Web文檔,與向量空間模型方法不同,采用基于關(guān)鍵特征的聚類算法(KFC).首先從搜索引擎返回結(jié)果的關(guān)鍵詞里選擇重要的詞作為關(guān)鍵特征,然后通過分析特征間的關(guān)系對特征聚類,最后基于特征聚類結(jié)果實現(xiàn)文檔的聚類.通過對實驗結(jié)果的測試表明了算法的有效性.
[Abstract]:In order to solve the problem that it is difficult for users to find the needed information in search engine results list, and to help users locate valuable Web documents quickly and effectively, it is different from vector space model. The key feature based clustering algorithm is adopted. Firstly, the key words are selected from the key words of the result returned by the search engine, and then the features are clustered by analyzing the relationship between the features. Finally, the document clustering is realized based on the feature clustering results, and the experimental results show that the algorithm is effective.
【作者單位】: 北京航空航天大學(xué)開發(fā)環(huán)境國家重點實驗室 北京航空航天大學(xué)開發(fā)環(huán)境國家重點實驗室 北京航空航天大學(xué)開發(fā)環(huán)境國家重點實驗室 北京航空航天大學(xué)開發(fā)環(huán)境國家重點實驗室
【基金】:國家科技基礎(chǔ)條件平臺建設(shè)資助項目(2005DKA63901)
【分類號】:TP391.3
【參考文獻(xiàn)】
相關(guān)期刊論文 前2條
1 姚莉秀,楊杰,葉晨洲,陳念貽;用于特征篩選的最近鄰(KNN)法[J];計算機與應(yīng)用化學(xué);2001年02期
2 耿玉良,陳家琪,王詠梅;中文Web檢索中聚類算法的改進(jìn)[J];計算機工程與設(shè)計;2005年10期
【共引文獻(xiàn)】
相關(guān)期刊論文 前10條
1 姚莉秀;用于特征篩選的基于目標(biāo)值的最近鄰法[J];紅外與激光工程;2001年05期
2 李云鵬;熊桂喜;;面向交通管理領(lǐng)域的分類索引算法[J];計算機工程;2009年20期
3 張光亞;李紅春;方柏山;;基于k-近鄰算法預(yù)測蛋白質(zhì)熱穩(wěn)定性的研究[J];計算機與應(yīng)用化學(xué);2008年01期
4 程菲;汪建海;羅鍵;;基于重復(fù)檢測的多摘要消重方法[J];計算機工程與設(shè)計;2006年23期
5 譚德坤;趙瓏;吳潤秀;孫輝;;基于UDDI Registry的智能檢索引擎的研究[J];計算機工程與設(shè)計;2007年04期
6 張永;侯莉莉;周振龍;;基于多Agent的智能信息檢索框架[J];計算機工程與設(shè)計;2007年05期
7 黃建春;鄒漢斌;李曉峰;;基于文本聚類的映射聚類算法研究[J];計算機工程與設(shè)計;2007年06期
8 原福永;張園園;;基于鏈接分析的相關(guān)排序方法的研究和改進(jìn)[J];計算機工程與設(shè)計;2007年07期
9 郭建永;蔡勇;甄艷霞;;基于文本聚類技術(shù)的主題發(fā)現(xiàn)[J];計算機工程與設(shè)計;2008年06期
10 段淮川;胡平;;基于主題特征和時間因子的改進(jìn)PageRank算法[J];計算機工程與設(shè)計;2010年04期
相關(guān)博士學(xué)位論文 前2條
1 萬星;水電科學(xué)中若干新方法應(yīng)用研究[D];四川大學(xué);2006年
2 程偉;基于機器視覺的旋切單板檢測系統(tǒng)研究[D];南京林業(yè)大學(xué);2007年
相關(guān)碩士學(xué)位論文 前9條
1 劉文輝;基于鏈接結(jié)構(gòu)的網(wǎng)頁排序算法研究[D];哈爾濱工程大學(xué);2010年
2 關(guān)菲;決策樹的啟發(fā)式模式研究及其在屬性約簡中的應(yīng)用[D];河北科技大學(xué);2010年
3 晏偉峰;鄰域粗糙集及其基于鄰域粗糙集的分類算法[D];江西師范大學(xué);2011年
4 蔣丹丹;基于廣義信息熵的決策樹模型及其在績效評價中的應(yīng)用[D];河北科技大學(xué);2012年
5 趙琛;用于中藥分析的近紅外光譜多元校正方法學(xué)研究[D];浙江大學(xué);2003年
6 秦蓓蕾;清江流域水文中長期預(yù)測研究[D];四川大學(xué);2004年
7 戴露;雅魯藏布江中游段徑流預(yù)測研究[D];四川大學(xué);2006年
8 關(guān)大偉;數(shù)據(jù)挖掘中的數(shù)據(jù)預(yù)處理[D];吉林大學(xué);2006年
9 鄭世茶;基于機器視覺技術(shù)的棉花病害識別[D];江蘇大學(xué);2007年
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 白寶興;管道內(nèi)表面質(zhì)量檢測系統(tǒng)設(shè)計[J];中國圖象圖形學(xué)報;1998年06期
2 張亮;郭桂蓉;莊釗文;何松華;馬莉波;;雷達(dá)目標(biāo)高分辨距離像數(shù)據(jù)預(yù)處理方法研究[J];電子學(xué)報;1998年06期
3 沈同圣;任建存;馮亞林;周曉東;;紅外成像制導(dǎo)中目標(biāo)識別方法探討[J];紅外與激光工程;1998年05期
4 劉守生,丁勇,胡壽松;一種特征提取新方法[J];信號處理;1999年S1期
5 李平,蔣振剛;神經(jīng)網(wǎng)絡(luò)對手寫字符識別特征的提取[J];長春光學(xué)精密機械學(xué)院學(xué)報;2000年02期
6 孟國強;基于車輛牌照識別系統(tǒng)字符的特征提取方法研究[J];河南科學(xué);2003年06期
7 邵云生,徐國華;雷達(dá)艦船目標(biāo)的混合特征提取算法的設(shè)計與實現(xiàn)[J];艦船電子對抗;2004年02期
8 崔晨e,
本文編號:1497901
本文鏈接:http://www.sikaile.net/kejilunwen/sousuoyinqinglunwen/1497901.html