一種基于形式概念分析的Web文檔標簽聚類方法
本文關鍵詞:一種基于形式概念分析的Web文檔標簽聚類方法
【摘要】:針對現(xiàn)有搜索引擎的搜索結果數(shù)目龐大要從中找到有用信息十分困難的問題,基于將Web搜索結果進行聚類可以方便用戶快速瀏覽搜索結果的思想,提出了一種基于形式概念分析的Web搜索結果聚類方法。首先從搜索結果中集中提取關鍵短語和非關鍵短語,然后從搜索結果集到關鍵短語和非關鍵短語集上建立形式背景,采用一種較快概念格生成算法在該形式背景上生成概念格,概念格上的一個概念表達了具有確定意義的主題,即得到Web搜索結果的一個類:每個概念內(nèi)涵具有的關鍵短語或非關鍵短語作為類標記;概念的外延所包含的搜索結果文檔作為該類的內(nèi)容;搜索結果各個類之間的層次關系通過概念格上的層次關系得以體現(xiàn)。
【作者單位】: 西華大學檔案館;西華大學數(shù)學與計算機學院;77538部隊;
【關鍵詞】: Web搜索結果組織 文檔聚類 形式概念分析
【基金】:國家自然科學基金項目(61271413) 教育部“春暉計劃”項目(12226531) 四川省人事廳學術與技術帶頭人培養(yǎng)計劃(12226463)
【分類號】:TP391.1
【正文快照】: 0引言搜索引擎能夠幫助用戶在海量的互聯(lián)網(wǎng)資源中獲取有用信息。然而,現(xiàn)有搜索引擎返回的搜索結果文檔數(shù)目非常龐大,要從這么多的結果中找到有用信息,有時顯得很困難。如何滿足不同類型用戶的不同需要,辦法之一就是對搜索結果進行合理組織。Hearst等[1]的研究已經(jīng)證明了“聚
【參考文獻】
中國博士學位論文全文數(shù)據(jù)庫 前1條
1 杜亞軍;搜索引擎智能行為的研究及實現(xiàn)[D];西南交通大學;2005年
【共引文獻】
中國期刊全文數(shù)據(jù)庫 前6條
1 劉煒;陳俊杰;;元搜索引擎中的推理技術[J];廣西師范大學學報(自然科學版);2007年04期
2 謝春芝;杜亞軍;;基于進化論觀點的概念格構建算法[J];廣西師范大學學報(自然科學版);2010年01期
3 陳俊杰;劉煒;;一種基于本體的個性化模式庫建模方法[J];計算機研究與發(fā)展;2007年07期
4 劉煒;李舟軍;;一種基于移動服務器端的樹圖建模方法[J];計算機科學;2011年04期
5 趙思佳;尹婷;;基于規(guī)則引擎的個性化主題網(wǎng)頁爬蟲的研究[J];計算機技術與發(fā)展;2011年03期
6 黃曉丹;王粉花;王志良;;情感決策的智能家居虛擬人路徑規(guī)劃[J];智能系統(tǒng)學報;2010年04期
中國博士學位論文全文數(shù)據(jù)庫 前2條
1 劉煒;智能元搜索引擎中個性化模式庫的研究[D];太原理工大學;2007年
2 王春元;公共網(wǎng)絡信息系統(tǒng)安全管理的研究[D];合肥工業(yè)大學;2009年
中國碩士學位論文全文數(shù)據(jù)庫 前10條
1 陳文斐;基于形式概念分析的中文網(wǎng)頁分類研究[D];西華大學;2011年
2 趙思佳;基于規(guī)則引擎的個性化網(wǎng)頁爬蟲研究[D];中南大學;2010年
3 唐俊;基于概念格的個性化信息檢索研究[D];西華大學;2006年
4 項磊;搜索引擎中初始URLS優(yōu)化研究[D];西華大學;2007年
5 董占兵;基于形式概念分析的主題搜索策略研究[D];西華大學;2007年
6 王競;基于形式概念分析的Web搜索結果聚類方法的研究[D];西華大學;2008年
7 李新春;基于WordNet的概念格語義匹配算法及其在搜索引擎上的應用[D];西華大學;2008年
8 許威;基于概念格的查詢擴展系統(tǒng)及建格算法研究[D];北京郵電大學;2008年
9 黃少林;基于用戶興趣分析的個性化搜索引擎研究[D];首都師范大學;2009年
10 楊月奎;基于語義的主題爬行方向研究[D];西華大學;2009年
【二級參考文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 何學鋒,彭超群,張曾榮;科技期刊7項重要計量指標間的相互關系[J];編輯學報;2003年06期
2 王紅梅,朱洪秀,王凌;對中文搜索引擎未來發(fā)展的探討[J];東北電力學院學報;2001年04期
3 張衛(wèi)豐,徐寶文;Web搜索引擎框架研究[J];計算機研究與發(fā)展;2000年03期
4 管惠維;基于Transputer的邏輯程序解釋器的設計與實現(xiàn)[J];計算機研究與發(fā)展;1995年02期
5 丁承,邵志清;集中式搜索引擎的設計與開發(fā)[J];計算機工程;2002年02期
6 肖詩源,葉俊,劉賢德;一種基于Agent的分布式搜索引擎[J];計算機工程;2002年07期
7 徐俊萍,翟玉慶;基于Agent的個性化信息服務技術的研究[J];計算機工程與科學;2002年03期
8 張汛淶;搜索引擎的設計剖析[J];計算機工程與科學;2002年04期
9 陳志忠,陳肇雄,高慶獅;通用的自然語言詞法分析機制[J];計算機學報;1991年02期
10 張廷華;Web元搜索引擎的改進[J];計算機應用;2002年02期
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 苗茹;沈夏炯;;概念格經(jīng)典算法對比[J];福建電腦;2007年03期
2 蔣平;任勝兵;林鵑;;形式概念分析在軟件工程中的應用[J];計算機技術與發(fā)展;2008年04期
3 鄭珂;李涵;;基于形式概念分析的本體構建方法研究[J];福建電腦;2011年02期
4 苗茹;沈夏炯;;概念格中的規(guī)則提取[J];光盤技術;2006年01期
5 柴玉梅;楊冉;王黎明;;基于快速形式概念集構造的分類規(guī)則挖掘算法[J];煙臺大學學報(自然科學與工程版);2009年03期
6 曲開社;閻俊霞;翟巖慧;;GM偏序圖的構建和基于GM偏序圖的規(guī)則提取[J];計算機工程與應用;2007年36期
7 苗茹;沈夏炯;胡小華;;概念格上無冗余關聯(lián)規(guī)則的提取算法NARG[J];計算機工程;2009年22期
8 王u&菁;陳震;;一種基于概念格的關聯(lián)規(guī)則挖掘算法[J];計算機工程與應用;2007年28期
9 高峰;何偉;;基于形式概念分析和本體的搜索引擎設計思考[J];中央民族大學學報(自然科學版);2009年S1期
10 馬駿;沈夏炯;劉宗田;;基于三維空間的概念格自動布局[J];計算機科學;2006年05期
中國重要會議論文全文數(shù)據(jù)庫 前10條
1 唐國瑜;夏云慶;張民;鄭方;;基于跨語言廣義向量空間模型的跨語言文檔聚類方法[A];中國計算語言學研究前沿進展(2009-2011)[C];2011年
2 趙傳申;楊明;孫志揮;;基于概念格的分布多庫規(guī)則發(fā)現(xiàn)[A];第二十一屆中國數(shù)據(jù)庫學術會議論文集(研究報告篇)[C];2004年
3 湯志鋼;胡學鋼;簡宋全;;量化概念格研究[A];全國第十四屆計算機科學及其在儀器儀表中的應用學術交流會論文集[C];2001年
4 何超;程學旗;郭嘉豐;;基于層次概念格的分面導航[A];第六屆全國信息檢索學術會議論文集[C];2010年
5 周水庚;孫敬宇;胡運發(fā);;一種文檔聚類新方法[A];第十六屆全國數(shù)據(jù)庫學術會議論文集[C];1999年
6 伍賽;楊冬青;韓近強;張銘;王文清;馮英;;WCM:一種基于單詞相關度的文檔聚類新方法[A];第二十一屆中國數(shù)據(jù)庫學術會議論文集(技術報告篇)[C];2004年
7 趙奕;施鵬飛;;一種快速的概念格構造方法[A];中國體視學學會圖像分析專業(yè)、中國體視學學會仿真與虛擬現(xiàn)實專業(yè)、中國航空學會信號與信息處理專業(yè)第一屆聯(lián)合學術會議論文集[C];2000年
8 李勃;姚青;;一種基于概念格挖掘規(guī)則產(chǎn)生集的算法[A];第二十二屆中國數(shù)據(jù)庫學術會議論文集(技術報告篇)[C];2005年
9 覃海生;韋海蘭;李新華;;基于概念格的Web測試在廉租住房系統(tǒng)中的應用研究[A];廣西計算機學會2010年學術年會論文集[C];2010年
10 朱秋云;張琪;姬朝陽;陳亮;魏苑琦;朱紹文;;一種基于概念格的關聯(lián)規(guī)則對半查找算法設計[A];2005年中國智能自動化會議論文集[C];2005年
中國重要報紙全文數(shù)據(jù)庫 前1條
1 張德政;信息挖掘商業(yè)智能之“芯”[N];中國計算機報;2002年
中國博士學位論文全文數(shù)據(jù)庫 前10條
1 劉銘;大規(guī)模文檔聚類中若干關鍵問題的研究[D];哈爾濱工業(yè)大學;2010年
2 師智斌;高性能數(shù)據(jù)立方體及其語義研究[D];北京交通大學;2010年
3 王瑋;基于概念格的關聯(lián)規(guī)則挖掘及變化模式研究[D];山東大學;2012年
4 秦昆;基于形式概念分析的圖像數(shù)據(jù)挖掘研究[D];武漢大學;2004年
5 楊瑞龍;基于短語特征的Web文檔聚類方法研究[D];重慶大學;2010年
6 陳湘;基于基集和概念格的數(shù)據(jù)挖掘方法研究[D];電子科技大學;2011年
7 金陽;基于概念格模型的序列模式挖掘算法研究[D];吉林大學;2007年
8 杜亞軍;搜索引擎智能行為的研究及實現(xiàn)[D];西南交通大學;2005年
9 王德興;基于概念格模型關聯(lián)規(guī)則挖掘的關鍵問題研究[D];合肥工業(yè)大學;2007年
10 余遠;基于形式概念分析分類規(guī)則挖掘的關鍵問題研究[D];中國礦業(yè)大學(北京);2009年
中國碩士學位論文全文數(shù)據(jù)庫 前10條
1 趙虹;基于概念格的關聯(lián)規(guī)則挖掘研究[D];大連海事大學;2007年
2 劉樹鵬;基于概念格的本體合并方法與技術的研究[D];大連海事大學;2010年
3 王培培;基于區(qū)別度概念格的關聯(lián)規(guī)則挖掘算法設計[D];河南大學;2010年
4 趙文兵;基于概念格及其擴展模型的數(shù)據(jù)挖掘研究[D];合肥工業(yè)大學;2002年
5 臧國輕;一種基于深度優(yōu)先的概念格并行構造模型[D];河南大學;2008年
6 王德興;基于量化概念格的關聯(lián)規(guī)則挖掘模型研究[D];合肥工業(yè)大學;2003年
7 張玉紅;基于概念格擴展模型的分類問題研究[D];合肥工業(yè)大學;2004年
8 孟凡宇;軟件再工程中的類層次重構與簡化[D];吉林大學;2005年
9 李新春;基于WordNet的概念格語義匹配算法及其在搜索引擎上的應用[D];西華大學;2008年
10 安廣偉;形式背景核的有限性研究與算法實現(xiàn)[D];河南大學;2006年
,本文編號:753308
本文鏈接:http://www.sikaile.net/kejilunwen/sousuoyinqinglunwen/753308.html