天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 搜索引擎論文 >

一種基于詞典的搜索引擎系統(tǒng)動態(tài)更新模型

發(fā)布時間:2018-08-29 18:37
【摘要】:基于詞匯標注的特征項提取方法是中文信息處理的有效方法 ,但詞匯的析取是基于詞典的 ,詞典的涵蓋程度決定了詞匯切分的準確率 .因而不斷地學習新詞匯、動態(tài)地維護詞典 ,使整個中文信息處理系統(tǒng)具有自適應性和動態(tài)性就成了一個關鍵問題 .以搜索引擎系統(tǒng)為例 ,提出了一種基于詞典動態(tài)變化的搜索引擎系統(tǒng)更新理論模型和實現(xiàn)模型 .相關實驗表明 ,該模型對縮短搜索引擎信息庫的更新時間、提高查詢準確率等方面十分有效
[Abstract]:Feature extraction based on lexical tagging is an effective method for Chinese information processing, but lexical extraction is based on dictionaries. The accuracy of lexical segmentation is determined by the extent of lexical coverage. So it is a key problem to learn new words and maintain dictionaries dynamically so that the whole Chinese information processing system is adaptive and dynamic. Taking search engine system as an example, this paper presents a theoretical model and implementation model of search engine system updating based on dictionary dynamic change. Relevant experiments show that the model is very effective in shortening the update time of search engine information base and improving the query accuracy.
【作者單位】: 北京大學計算機科學技術系!北京100871 北京大學計算機科學技術系!北京100871 北京大學計算機科學技術系!北京100871 北京大學計算機科學技術系!北京100871
【基金】:國家“九五”重點科技攻關項目基金資助!(項目編號 96 -743 -0 1-0 5 -0 1)
【分類號】:TP391.3

【共引文獻】

相關期刊論文 前5條

1 周水庚,關佶紅,胡運發(fā),周傲英;一個無需詞典支持和切詞處理的中文文檔分類系統(tǒng)[J];計算機研究與發(fā)展;2001年07期

2 馮是聰,張志剛,李曉明;一種中文網(wǎng)頁自動分類方法的實現(xiàn)及應用[J];計算機工程;2004年05期

3 吳光遠,何丕廉,曹桂宏,聶頌;基于向量空間模型的詞共現(xiàn)研究及其在文本分類中的應用[J];計算機應用;2003年S1期

4 周水庚,關佶紅,俞紅奇,胡運發(fā);基于Ngram信息的中文文檔分類研究[J];中文信息學報;2001年01期

5 鄭小慎 ,何丕廉 ,陳治綱 ,任大同 ,吳克敏;基于凝聚點的文本動態(tài)聚類分析[J];微型機與應用;2004年08期

相關博士學位論文 前2條

1 劉濤;現(xiàn)代信息檢索中的文本分類及圖像恢復研究[D];北京郵電大學;2006年

2 賈自艷;Web信息智能獲取若干關鍵問題研究[D];中國科學院研究生院(計算技術研究所);2004年

相關碩士學位論文 前5條

1 賈自艷;中文智能搜索引擎關鍵技術研究[D];北京工業(yè)大學;2001年

2 楊斌;中文文本數(shù)據(jù)挖掘研究[D];湘潭大學;2002年

3 鄒加棋;中文網(wǎng)頁自動分類關鍵技術研究[D];福州大學;2006年

4 付裕;文本分類方案選擇方法及原型系統(tǒng)開發(fā)[D];大連理工大學;2006年

5 陳海波;基于自動分詞的企業(yè)文檔搜索引擎設計與實現(xiàn)[D];西北工業(yè)大學;2007年

【相似文獻】

相關期刊論文 前10條

1 王偉;趙東巖;趙偉;;中文新聞關鍵事件的主題句識別[J];北京大學學報(自然科學版);2011年05期

2 楊皓東;江凌;李國俊;;國內(nèi)自然語言處理研究熱點分析——基于共詞分析[J];圖書情報工作;2011年10期

3 劉一寧;;學術定義抽取研究綜述[J];情報探索;2011年08期

4 史曉東;盧亞軍;;央金藏文分詞系統(tǒng)[J];中文信息學報;2011年04期

5 楊撼岳;陳笑蓉;鄭高山;;水族文字筆形編碼方法研究[J];計算機工程;2011年14期

6 彭成;季培培;;基于確定性退火的中文術語語義層次關聯(lián)研究[J];計算機應用研究;2011年09期

7 王利鑫;耿煥同;孫凱;張茜;;基于自然語言處理的文本泄密自動檢測技術[J];計算機工程與設計;2011年08期

8 安見才讓;;藏語句子相似度算法的研究[J];中文信息學報;2011年04期

9 劉興林;鄭啟倫;馬千里;;中文合成詞識別及分詞修正[J];計算機應用研究;2011年08期

10 張野;楊建林;;基于KNN和SVM的中文文本自動分類研究[J];情報科學;2011年09期

相關會議論文 前10條

1 孫玉芳;;中文信息處理與國家信息化建設[A];面向21世紀的科技進步與社會經(jīng)濟發(fā)展(上冊)[C];1999年

2 劉群;張浩;白碩;;中文信息處理開放平臺的設計[A];第一屆學生計算語言學研討會論文集[C];2002年

3 由麗萍;劉燾;劉開瑛;;信息處理用中文框架語義知識描述方法研究[A];民族語言文字信息技術研究——第十一屆全國民族語言文字信息學術研討會論文集[C];2007年

4 汪華峰;陳峪;;漢語自然語言理解中詞切分中新詞問題初探[A];第一屆全國語言識別學術報告與展示會論文集[C];1990年

5 馮志偉;;自然語言處理中的理性主義和經(jīng)驗主義[A];民族語言文字信息技術研究——第十一屆全國民族語言文字信息學術研討會論文集[C];2007年

6 白剛;張錚;丁宗堯;朱毅;;中文文本聚類在互聯(lián)網(wǎng)搜索的研究與應用[A];第三屆全國信息檢索與內(nèi)容安全學術會議論文集[C];2007年

7 支流;朱學鋒;段慧明;俞士汶;;中文縮略語還原技術初探[A];全國第八屆計算語言學聯(lián)合學術會議(JSCL-2005)論文集[C];2005年

8 鄭家恒;譚紅葉;王興義;;基于模式匹配的中文專有名詞識別[A];民族語言文字信息技術研究——第十一屆全國民族語言文字信息學術研討會論文集[C];2007年

9 葛詩利;陳瀟瀟;;中國EFL學習者自動作文評分探索[A];第三屆學生計算語言學研討會論文集[C];2006年

10 宋柔;;自然語言處理中語言知識的基礎性地位[A];民族語言文字信息技術研究——第十一屆全國民族語言文字信息學術研討會論文集[C];2007年

相關重要報紙文章 前10條

1 姚雙云 華中師范大學語言與語言教育研究中心;虛詞知識庫:中文信息處理的基石[N];中國社會科學報;2011年

2 記者 梁捷;我國中文信息處理技術從實驗室走向全面應用[N];光明日報;2009年

3 張波 龍雨;中文信息處理國際學術會議在武漢大學召開[N];中國社會科學院院報;2007年

4 記者 韓曉玲邋通訊員 張波 龍雨;海內(nèi)外專家聚焦中文信息處理[N];湖北日報;2007年

5 胡唯元;文字編碼新標準:不再為“名”所累[N];科技日報;2006年

6 許偉;金友兵 破局國外辦公套件壟斷[N];中國企業(yè)報;2008年

7 鄭昊;數(shù)據(jù)挖掘加工海量數(shù)據(jù)[N];中國計算機報;2007年

8 ;浙江天宇信息技術有限公司[N];中國計算機報;2009年

9 ;開天辟地第一回[N];計算機世界;2002年

10 劉潔;SAS分析產(chǎn)品鏈增添“新成員”[N];科技日報;2008年

相關博士學位論文 前10條

1 盧延鑫;基于自然語言處理技術的循證醫(yī)學信息提取研究[D];復旦大學;2011年

2 計峰;自然語言處理中序列標注模型的研究[D];復旦大學;2012年

3 李良炎;基于詞聯(lián)接的自然語言處理技術及其應用研究[D];重慶大學;2004年

4 李莎莎;面向搜索引擎的自然語言處理關鍵技術研究[D];國防科學技術大學;2011年

5 周雅倩;最大熵方法及其在自然語言處理中的應用[D];復旦大學;2005年

6 易勇;計算機輔助詩詞創(chuàng)作中的風格辨析及聯(lián)語應對研究[D];重慶大學;2005年

7 方寧;基于認知的文本語境生成和度量研究[D];上海大學;2009年

8 鄭逢斌;關于計算機理解自然查詢語言的研究[D];西南交通大學;2004年

9 杜永萍;基于模式知識庫的問題回答關鍵技術研究[D];復旦大學;2005年

10 王q,

本文編號:2212064


資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/sousuoyinqinglunwen/2212064.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶f5067***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com