天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 搜索引擎論文 >

基于OPTICS可達(dá)圖的自動(dòng)識(shí)別簇方法

發(fā)布時(shí)間:2019-03-05 07:56
【摘要】:針對(duì)主題特征不明顯的搜索結(jié)果聚類的問題,提出了基于OPTICS(Ordering Points To Identify theClustering Structure)可達(dá)圖的自動(dòng)識(shí)別簇的Smooth方法。首先利用OPTICS算法得到搜索結(jié)果的可達(dá)圖,然后采用移動(dòng)平均法平滑掉可達(dá)圖曲線中的毛刺,最后識(shí)別其中的峰值以劃分各個(gè)凹陷區(qū)域,即得到聚類結(jié)果。在搜索結(jié)果數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果表明,Smooth方法的準(zhǔn)確率較已有的方法平均提高了100%左右。Smooth方法能夠與OPTICS算法結(jié)合應(yīng)用于搜索引擎中,對(duì)搜索結(jié)果進(jìn)行聚類處理,有效地提高其可瀏覽性。
[Abstract]:In order to solve the problem of clustering search results whose subject features are not obvious, a Smooth method for automatic cluster recognition based on OPTICS (Ordering Points To Identify theClustering Structure)-Datuk is proposed. Firstly, the OPTICS algorithm is used to get the Datuk of the search result, then the moving average method is used to smooth out the burr in the Datuk curve. Finally, the peak value of the burr is recognized to divide each depression region, that is, the clustering result is obtained. The experimental results on the data set of the search results show that the accuracy of the Smooth method is 100% higher than that of the existing methods on average. The Smooth method can be combined with the OPTICS algorithm and can be used in the search engine to cluster the search results. Effectively improve its navigability.
【作者單位】: 北京郵電大學(xué)信息與通信工程學(xué)院;
【基金】:國家863計(jì)劃項(xiàng)目(2011AA01A205)
【分類號(hào)】:TP391.3

【參考文獻(xiàn)】

相關(guān)期刊論文 前1條

1 孫學(xué)剛,陳群秀,馬亮;基于主題的Web文檔聚類研究[J];中文信息學(xué)報(bào);2003年03期

【共引文獻(xiàn)】

相關(guān)期刊論文 前4條

1 李渝勤,孫麗華;基于規(guī)則的自動(dòng)分類在文本分類中的應(yīng)用[J];中文信息學(xué)報(bào);2004年04期

2 劉遠(yuǎn)超;王曉龍;徐志明;關(guān)毅;;文檔聚類綜述[J];中文信息學(xué)報(bào);2006年03期

3 黃永光;劉挺;車萬翔;胡曉光;;面向變異短文本的快速聚類算法[J];中文信息學(xué)報(bào);2007年02期

4 王楠;基于聚類的全文檢索系統(tǒng)后處理[J];情報(bào)雜志;2005年01期

相關(guān)會(huì)議論文 前1條

1 孫麗華;肖詩斌;施水才;;基于向量空間模型的規(guī)則分類技術(shù)[A];全國第八屆計(jì)算語言學(xué)聯(lián)合學(xué)術(shù)會(huì)議(JSCL-2005)論文集[C];2005年

相關(guān)博士學(xué)位論文 前2條

1 高偉;工藝設(shè)計(jì)信息系統(tǒng)中的知識(shí)發(fā)現(xiàn)技術(shù)研究[D];四川大學(xué);2005年

2 許增福;DL環(huán)境下的信息資源管理及知識(shí)發(fā)現(xiàn)研究[D];哈爾濱工程大學(xué);2005年

相關(guān)碩士學(xué)位論文 前10條

1 楊才峰;基于自動(dòng)分類的元搜索引擎的研究與應(yīng)用[D];華北電力大學(xué)(河北);2005年

2 李揚(yáng)繼;垃圾郵件特征的判別模型研究[D];四川大學(xué);2005年

3 魏常麗;搜索引擎結(jié)果的再檢索[D];內(nèi)蒙古大學(xué);2005年

4 顧雪峰;基于動(dòng)態(tài)粒度思想的實(shí)體關(guān)系識(shí)別方法研究[D];山西大學(xué);2006年

5 朱志寧;基于Web的企業(yè)競(jìng)爭(zhēng)情報(bào)智能搜集平臺(tái)中頁面分析存儲(chǔ)的研究[D];昆明理工大學(xué);2006年

6 黃永光;基于網(wǎng)頁挖掘的搜索引擎若干技術(shù)的研究[D];哈爾濱工業(yè)大學(xué);2006年

7 周昭濤;文本聚類分析效果評(píng)價(jià)及文本表示研究[D];中國科學(xué)院研究生院(計(jì)算技術(shù)研究所);2005年

8 鄭軍;網(wǎng)絡(luò)輿情監(jiān)控的熱點(diǎn)發(fā)現(xiàn)算法研究[D];哈爾濱工程大學(xué);2007年

9 朱小娟;基于支持向量機(jī)的中文分詞系統(tǒng)的研究[D];中南大學(xué);2007年

10 胡卓穎;專題型網(wǎng)頁搜集器關(guān)鍵算法的研究及實(shí)現(xiàn)[D];江西師范大學(xué);2005年

【二級(jí)參考文獻(xiàn)】

相關(guān)期刊論文 前4條

1 張莉,周偉達(dá),焦李成;核聚類算法[J];計(jì)算機(jī)學(xué)報(bào);2002年06期

2 韓客松,王永成,陳桂林;無詞典高頻字串快速提取和統(tǒng)計(jì)算法研究[J];中文信息學(xué)報(bào);2001年02期

3 劉遠(yuǎn)超;王曉龍;徐志明;關(guān)毅;;文檔聚類綜述[J];中文信息學(xué)報(bào);2006年03期

4 陳燕,耿國華,鄭建國;一種改進(jìn)的基于密度的聚類算法[J];微機(jī)發(fā)展;2005年03期

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 劉志成,文全剛;“K-中心點(diǎn)”聚類算法分析及其實(shí)現(xiàn)[J];電腦知識(shí)與技術(shù);2005年06期

2 夏詠梅;基于文本挖掘的分類與聚類技術(shù)[J];情報(bào)探索;2005年03期

3 陳琦;劉蓉;周茉;羅強(qiáng);;一種改進(jìn)的關(guān)聯(lián)規(guī)則挖掘算法[J];計(jì)算機(jī)與數(shù)字工程;2006年08期

4 陳金山,韋崗;遺傳+模糊C-均值混合聚類算法[J];電子與信息學(xué)報(bào);2002年02期

5 牟廉明;數(shù)據(jù)挖掘中聚類方法比較研究[J];內(nèi)江師范學(xué)院學(xué)報(bào);2003年02期

6 李丙春,耿國華,周明全,朱曉冬;基于自組織特征映射聚類算法的研究與應(yīng)用[J];新疆大學(xué)學(xué)報(bào)(自然科學(xué)版);2003年04期

7 丁學(xué)鈞,楊炎,楊克儉,溫秀梅;基于屬性的聚類算法在醫(yī)生醫(yī)療質(zhì)量評(píng)價(jià)系統(tǒng)中的應(yīng)用研究[J];計(jì)算機(jī)應(yīng)用研究;2005年03期

8 徐章艷,尹云飛;一種區(qū)間值聚類的數(shù)據(jù)挖掘方法[J];系統(tǒng)工程與電子技術(shù);2005年03期

9 趙正利;王國宇;籍芳;;一種基于相關(guān)反饋的圖像內(nèi)在語義模型[J];微計(jì)算機(jī)信息;2007年24期

10 王善俠;王振華;王吉永;;基于決策樹和聚類理論的XML文檔數(shù)據(jù)挖掘的研究[J];科技信息(科學(xué)教研);2007年34期

相關(guān)會(huì)議論文 前10條

1 武森;金海燕;高學(xué)東;;數(shù)據(jù)挖掘中CABOSFV聚類算法的實(shí)現(xiàn)與應(yīng)用[A];全國第八屆工業(yè)工程與企業(yè)信息化學(xué)術(shù)會(huì)議論文集[C];2004年

2 楊廣林;趙云峰;王書理;;Gabor濾波器及其在圖像特征提取方面的優(yōu)化算法[A];2005年中國智能自動(dòng)化會(huì)議論文集[C];2005年

3 張剛;劉悅;;基于查詢空間的分布式文檔集合劃分算法[A];第三屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2007年

4 文健;李舟軍;;基于聚類語言模型的生物文獻(xiàn)檢索技術(shù)研究[A];第三屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2007年

5 劉哲;唐雁;陳強(qiáng);;三維模型有意義分割技術(shù)現(xiàn)狀及應(yīng)用[A];2008年計(jì)算機(jī)應(yīng)用技術(shù)交流會(huì)論文集[C];2008年

6 劉海波;鄭德權(quán);趙鐵軍;;基于相似度線性加權(quán)方法的檢索結(jié)果聚類研究[A];中國計(jì)算語言學(xué)研究前沿進(jìn)展(2009-2011)[C];2011年

7 孫俊;曹海龍;趙鐵軍;;面向句法分析的樣本選擇[A];第三屆學(xué)生計(jì)算語言學(xué)研討會(huì)論文集[C];2006年

8 丁海波;肖桐;朱靖波;;基于多階段的中文人名消歧聚類技術(shù)的研究[A];第六屆全國信息檢索學(xué)術(shù)會(huì)議論文集[C];2010年

9 朱輝;李在銘;;視頻圖像中文本檢測(cè)與分割技術(shù)研究[A];第十屆全國信號(hào)處理學(xué)術(shù)年會(huì)(CCSP-2001)論文集[C];2001年

10 菅小艷;鄭家恒;;一種改進(jìn)的句子相似度計(jì)算方法[A];第二屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議(NCIRCS-2005)論文集[C];2005年

相關(guān)重要報(bào)紙文章 前10條

1 武德鋒 李國輝 林洪文 姚作梁;圖像世界任我行[N];計(jì)算機(jī)世界;2002年

2 創(chuàng)智集團(tuán)副總裁 胡樂群博士;數(shù)據(jù)挖掘在CRM中的應(yīng)用[N];中國計(jì)算機(jī)報(bào);2002年

3 ;視頻數(shù)據(jù)中挖“寶”[N];計(jì)算機(jī)世界;2002年

4 中國人民大學(xué)數(shù)據(jù)倉庫與商務(wù)智能工程研究中心 $$  中國人民大學(xué)數(shù)據(jù)與知識(shí)工程研究所王珊、謝佳明、陳紅、劉中蔚、邵琦洪、張寧;創(chuàng)建數(shù)據(jù)倉庫:要面向三條路線[N];中國計(jì)算機(jī)報(bào);2002年

5 王培森;從Web挖到競(jìng)爭(zhēng)情報(bào)[N];中國計(jì)算機(jī)報(bào);2003年

6 王瑋 蔡蓮紅;數(shù)據(jù)挖掘走入語音處理[N];計(jì)算機(jī)世界;2001年

7 ;撥開“客戶細(xì)分”迷霧[N];網(wǎng)絡(luò)世界;2006年

8 劉紅巖、何軍;利用數(shù)據(jù)挖掘技術(shù)獲得商業(yè)智能[N];中國計(jì)算機(jī)報(bào);2003年

9 趙紀(jì)元;數(shù)據(jù)挖掘在CRM中的應(yīng)用[N];人民郵電;2001年

10 ;中聯(lián)集團(tuán)非結(jié)構(gòu)化內(nèi)容管理系統(tǒng)[N];電腦商報(bào);2005年

相關(guān)博士學(xué)位論文 前10條

1 陳毅恒;文本檢索結(jié)果聚類及類別標(biāo)簽抽取技術(shù)研究[D];哈爾濱工業(yè)大學(xué);2010年

2 馬賡宇;基于HMM的時(shí)間序列聚類與識(shí)別[D];清華大學(xué);2004年

3 蔡維玲;基于聚類的圖像分割和分類器設(shè)計(jì)的研究[D];南京航空航天大學(xué);2008年

4 王明春;基于粗糙集的數(shù)據(jù)及文本挖掘方法研究[D];天津大學(xué);2005年

5 賈俊杰;空間數(shù)據(jù)挖掘中若干關(guān)鍵技術(shù)研究[D];長(zhǎng)安大學(xué);2009年

6 鐘敏娟;基于檢索結(jié)果聚類的XML偽反饋技術(shù)研究[D];江西財(cái)經(jīng)大學(xué);2012年

7 石陸魁;非線性維數(shù)約減算法中若干關(guān)鍵問題的研究[D];天津大學(xué);2005年

8 平源;基于支持向量機(jī)的聚類及文本分類研究[D];北京郵電大學(xué);2012年

9 朱旭東;基于語義主題模型的人體異常行為識(shí)別研究[D];西安電子科技大學(xué);2011年

10 陳海霞;面向數(shù)據(jù)挖掘的分類器集成研究[D];吉林大學(xué);2006年

相關(guān)碩士學(xué)位論文 前10條

1 王斌;雙層數(shù)據(jù)流聚類框架的設(shè)計(jì)與實(shí)現(xiàn)[D];吉林大學(xué);2004年

2 蔡博文;高維數(shù)據(jù)集中離群數(shù)據(jù)挖掘方法的研究[D];合肥工業(yè)大學(xué);2006年

3 于世東;多維數(shù)據(jù)可視化技術(shù)的研究及應(yīng)用[D];沈陽工業(yè)大學(xué);2006年

4 戴金;改進(jìn)K-MEANS算法及在Ⅰ型糖尿病血糖值的聚類應(yīng)用[D];北京交通大學(xué);2011年

5 孫會(huì)嶺;移動(dòng)環(huán)境中基于聚類的個(gè)性化推薦算法研究[D];燕山大學(xué);2011年

6 王清江;基于力學(xué)的聚類算法[D];大連理工大學(xué);2006年

7 張帆;基于不確定性數(shù)據(jù)的聚類分析研究[D];西南農(nóng)業(yè)大學(xué);2005年

8 倪泉;基于數(shù)據(jù)挖掘技術(shù)的保險(xiǎn)續(xù)期催交方法研究[D];華東師范大學(xué);2006年

9 孫守義;基于聚類的教育資源個(gè)性化信息服務(wù)[D];南京師范大學(xué);2008年

10 黃河;一種移動(dòng)對(duì)象索引的研究與實(shí)現(xiàn)技術(shù)[D];華中科技大學(xué);2007年

,

本文編號(hào):2434686

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/sousuoyinqinglunwen/2434686.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶18e49***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com