天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 搜索引擎論文 >

基于詞間語(yǔ)義相關(guān)度的搜索結(jié)果聚類算法

發(fā)布時(shí)間:2018-02-19 18:10

  本文關(guān)鍵詞: 搜索結(jié)果聚類 詞間語(yǔ)義相關(guān)度 文檔相似度 出處:《鄭州大學(xué)學(xué)報(bào)(理學(xué)版)》2009年01期  論文類型:期刊論文


【摘要】:將查詢結(jié)果根據(jù)內(nèi)容進(jìn)行聚類是提高搜索引擎服務(wù)質(zhì)量的關(guān)鍵技術(shù)之一.搜索結(jié)果聚類時(shí)只能從文檔標(biāo)題和文檔片段中抽取有限信息,傳統(tǒng)聚類方法難以準(zhǔn)確計(jì)算其相似度.提出了一種基于詞間語(yǔ)義相關(guān)度的搜索結(jié)果聚類算法,該算法以詞為聚類的核心,詞所出現(xiàn)的文檔為詞的屬性,根據(jù)詞在搜索結(jié)果文檔中共現(xiàn)的情況來劃分類別.該方法可以充分利用詞間的語(yǔ)義相關(guān)性,類別劃分后即可確定類名.實(shí)驗(yàn)結(jié)果表明,對(duì)搜索結(jié)果聚類時(shí)與K-Means和STC算法相比,質(zhì)量上有所提高.
[Abstract]:The query results according to the content of the clustering is one of the key technologies to improve the quality of search engines. Search results clustering only from the title of the document and document fragments from limited information, the traditional clustering methods are difficult to accurately compute the similarity. We propose a new clustering word semantic correlation algorithm based on search results, the algorithm based on word as the core of the word clustering, document word attributes, according to the words in the search results to the present situation of document classification. This method can make full use of semantic relation between words, classification can be determined after class. The experimental results show that the search results clustering when compared with K-Means and STC algorithm. The quality should be improved.

【作者單位】: 北京石油化工學(xué)院計(jì)算機(jī)科學(xué)與工程系;
【基金】:北京市教育委員會(huì)項(xiàng)目,編號(hào)KM200610017007
【分類號(hào)】:TP391.1;TP18

【參考文獻(xiàn)】

相關(guān)期刊論文 前2條

1 劉輝林;郭來德;劉蘭哲;王光興;;中文農(nóng)業(yè)主題搜索引擎的設(shè)計(jì)與實(shí)現(xiàn)[J];鄭州大學(xué)學(xué)報(bào)(理學(xué)版);2007年02期

2 錢麗萍;汪立東;;基于中心短語(yǔ)及權(quán)值的相似度計(jì)算[J];鄭州大學(xué)學(xué)報(bào)(理學(xué)版);2007年02期

【共引文獻(xiàn)】

相關(guān)期刊論文 前9條

1 蘭富軍;李春霆;高海忠;;農(nóng)業(yè)主題垂直搜索引擎過濾技術(shù)研究[J];安徽農(nóng)業(yè)科學(xué);2010年09期

2 張戩慧;;專業(yè)智能搜索系統(tǒng)在動(dòng)物醫(yī)學(xué)領(lǐng)域中的應(yīng)用[J];東北農(nóng)業(yè)大學(xué)學(xué)報(bào);2009年09期

3 王倩;劉奕群;馬少平;茹立云;;面向搜索引擎競(jìng)價(jià)排名的關(guān)鍵詞商業(yè)價(jià)值分析[J];廣西師范大學(xué)學(xué)報(bào)(自然科學(xué)版);2010年03期

4 張戩慧;王洪斌;;獸藥類科技文獻(xiàn)信息搜索系統(tǒng)的構(gòu)建研究[J];情報(bào)探索;2009年09期

5 阮進(jìn);袁景瑞;梁循;;互聯(lián)網(wǎng)金融新聞搜索的文本消重方法研究[J];西華大學(xué)學(xué)報(bào)(自然科學(xué)版);2008年02期

6 熊金輝;楊勇;羅海燕;王淑彥;劉怡良;;基于擴(kuò)展SKOS模型的簡(jiǎn)單農(nóng)業(yè)本體系統(tǒng)建設(shè)方法[J];沈陽(yáng)農(nóng)業(yè)大學(xué)學(xué)報(bào);2010年04期

7 鄭凱斌;黃益栓;;基于網(wǎng)頁(yè)的醫(yī)學(xué)信息搜索系統(tǒng)的分析與設(shè)計(jì)[J];醫(yī)學(xué)信息;2009年03期

8 魯?shù)潞?郟東耀;;一種改進(jìn)的概念相似度計(jì)算方法[J];鄭州大學(xué)學(xué)報(bào)(理學(xué)版);2010年01期

9 張琳;胡杰;;FAQ問答系統(tǒng)句子相似度計(jì)算[J];鄭州大學(xué)學(xué)報(bào)(理學(xué)版);2010年01期

相關(guān)會(huì)議論文 前1條

1 吳晨生;劉彥君;張魯冀;董曉晴;;科普搜索的研究與實(shí)現(xiàn)[A];數(shù)字博物館研究與實(shí)踐(2009)[C];2010年

相關(guān)碩士學(xué)位論文 前5條

1 范先爽;基于個(gè)性化服務(wù)的汽車信息搜索引擎的研究[D];武漢理工大學(xué);2011年

2 張祖蓮;網(wǎng)絡(luò)點(diǎn)擊欺詐及預(yù)防策略的研究[D];新疆大學(xué);2011年

3 周鵬;農(nóng)業(yè)搜索引擎系統(tǒng)的關(guān)鍵技術(shù)研究[D];首都師范大學(xué);2009年

4 張冰;基于領(lǐng)域的信息分類和搜索技術(shù)的研究[D];濟(jì)南大學(xué);2009年

5 劉蘭哲;企業(yè)搜索引擎中網(wǎng)頁(yè)分類技術(shù)的研究與實(shí)現(xiàn)[D];東北大學(xué);2008年

【二級(jí)參考文獻(xiàn)】

相關(guān)期刊論文 前1條

1 王天江,葉衛(wèi)國(guó),盧正鼎,李永平;基于Hyperlink和相關(guān)度發(fā)現(xiàn)Web相關(guān)文檔的研究[J];小型微型計(jì)算機(jī)系統(tǒng);2004年05期

相關(guān)會(huì)議論文 前1條

1 車萬(wàn)翔;劉挺;秦兵;李生;;面向雙語(yǔ)句對(duì)檢索的漢語(yǔ)句子相似度計(jì)算[A];語(yǔ)言計(jì)算與基于內(nèi)容的文本處理——全國(guó)第七屆計(jì)算語(yǔ)言學(xué)聯(lián)合學(xué)術(shù)會(huì)議論文集[C];2003年

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 胡詩(shī)未;李曉峰;徐偉;;基于主題詞匹配頻數(shù)的搜索引擎結(jié)果聚類算法[J];計(jì)算機(jī)工程與科學(xué);2011年06期

2 陳永超;劉貴全;;一種基于命名實(shí)體的搜索結(jié)果聚類算法[J];計(jì)算機(jī)工程;2009年07期

3 李興森;;后文檔管理時(shí)代的增值策略[J];軟件世界;2007年02期

4 沙蕓;張國(guó)英;孟凡亮;;基于關(guān)鍵詞提取的娛樂新聞文檔去重算法[J];廣西師范大學(xué)學(xué)報(bào)(自然科學(xué)版);2007年02期

5 林小俊;張猛;暴筱;李軍;吳璽宏;;基于概念網(wǎng)絡(luò)的短文本分類方法[J];計(jì)算機(jī)工程;2010年21期

6 劉德山;;一種改進(jìn)的基于后綴樹模型搜索結(jié)果聚類算法[J];計(jì)算機(jī)科學(xué);2011年11期

7 張?jiān)?馮博琴;;利用標(biāo)簽的層次化搜索結(jié)果聚類方法[J];西安交通大學(xué)學(xué)報(bào);2009年04期

8 章成志;;一種基于組合策略的聚類描述方法及其應(yīng)用[J];情報(bào)科學(xué);2009年07期

9 麻雪云;肖詩(shī)斌;王弘蔚;施水才;;基于關(guān)鍵名詞短語(yǔ)聚類的中文搜索結(jié)果聚類[J];計(jì)算機(jī)工程與應(yīng)用;2009年31期

10 黃微;高俊峰;;基于概念格的Web學(xué)術(shù)信息搜索結(jié)果的二次組織[J];現(xiàn)代圖書情報(bào)技術(shù);2010年05期

相關(guān)會(huì)議論文 前9條

1 雷慶;吳揚(yáng)揚(yáng);;一種基于語(yǔ)義信息計(jì)算XML文檔相似度的新方法[A];第二十一屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2004年

2 王洪俊;施水才;俞士汶;肖詩(shī)斌;;跨語(yǔ)言文檔對(duì)齊[A];NCIRCS2004第一屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2004年

3 秦鵬;李恒訓(xùn);張華平;劉金剛;;基于關(guān)鍵詞提取的搜索結(jié)果聚類研究[A];第五屆全國(guó)信息檢索學(xué)術(shù)會(huì)議論文集[C];2009年

4 李斌;盧俊之;章成志;陳小荷;;基于聚類引擎的話題褒貶度計(jì)算[A];內(nèi)容計(jì)算的研究與應(yīng)用前沿——第九屆全國(guó)計(jì)算語(yǔ)言學(xué)學(xué)術(shù)會(huì)議論文集[C];2007年

5 徐斌;顧宏斌;;一種基于模糊分類的多分類文檔查找方法[A];第三屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2007年

6 廉鑫;林偉堅(jiān);張海威;袁曉潔;;基于雙向路徑約束模型的XML文檔結(jié)構(gòu)相似性度量[A];NDBC2010第27屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(B輯)[C];2010年

7 汪洋;張磊;章毅;;基于短語(yǔ)匹配的中文Web文檔聚類算法[A];第二屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議(NCIRCS-2005)論文集[C];2005年

8 楊建武;陳曉鷗;;XML文檔集的聚類研究[A];第十八屆全國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2001年

9 唐國(guó)瑜;夏云慶;張民;鄭方;;基于跨語(yǔ)言廣義向量空間模型的跨語(yǔ)言文檔聚類方法[A];中國(guó)計(jì)算語(yǔ)言學(xué)研究前沿進(jìn)展(2009-2011)[C];2011年

相關(guān)博士學(xué)位論文 前7條

1 劉宏哲;文本語(yǔ)義相似度計(jì)算方法研究[D];北京交通大學(xué);2012年

2 林古立;互聯(lián)網(wǎng)信息檢索中的多樣化排序研究及應(yīng)用[D];華南理工大學(xué);2011年

3 宋玲;語(yǔ)義相似度計(jì)算及其應(yīng)用研究[D];山東大學(xué);2009年

4 魏建香;學(xué)科交叉知識(shí)發(fā)現(xiàn)及其可視化研究[D];南京大學(xué);2010年

5 楊瑞龍;基于短語(yǔ)特征的Web文檔聚類方法研究[D];重慶大學(xué);2010年

6 仲兆滿;事件本體及其在查詢擴(kuò)展中的應(yīng)用[D];上海大學(xué);2011年

7 武威;異質(zhì)數(shù)據(jù)相似度學(xué)習(xí)及其在網(wǎng)絡(luò)搜索中的應(yīng)用[D];北京大學(xué);2012年

相關(guān)碩士學(xué)位論文 前10條

1 黃黎;基于形式概念分析的搜索結(jié)果聚類研究[D];華中科技大學(xué);2005年

2 趙嫣;信息檢索中結(jié)構(gòu)化文檔相關(guān)度計(jì)算方法的研究[D];山東大學(xué);2007年

3 仇紹剛;基于元搜索的知識(shí)獲取方法與系統(tǒng)集成研究[D];大連理工大學(xué);2009年

4 武娜;視頻搜索結(jié)果分析及其可視化方法研究與應(yīng)用[D];東華大學(xué);2010年

5 滕海明;基于語(yǔ)義標(biāo)記樹的XML文檔聚類研究[D];浙江大學(xué);2011年

6 秦新國(guó);電子作業(yè)管理和作業(yè)抄襲檢測(cè)技術(shù)研究[D];南京師范大學(xué);2007年

7 葉忠杰;基于課程知識(shí)本體的智能答疑系統(tǒng)的研究與開發(fā)[D];浙江工業(yè)大學(xué);2007年

8 趙穎;基于Ontology的Web文本聚類研究[D];西華大學(xué);2011年

9 周云慶;基于維基百科的搜索結(jié)果挖掘[D];上海交通大學(xué);2011年

10 程佳;熱點(diǎn)新聞間關(guān)系的研究[D];上海交通大學(xué);2011年



本文編號(hào):1517782

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/sousuoyinqinglunwen/1517782.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶cb65f***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com