天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 社科論文 > 圖書檔案論文 >

智能搜索引擎中的同義詞識(shí)別算法研究

發(fā)布時(shí)間:2020-10-17 14:43
   本文概述了對(duì)搜索引擎特別是中文搜索引擎的相關(guān)研究,分析了下一代 智能搜索引擎的功能特點(diǎn),并嘗試?yán)孟嗨贫人惴▽?shí)現(xiàn)智能搜索引擎中的概 念的識(shí)別。 關(guān)鍵詞檢索是大多數(shù)搜索引擎的主要檢索手段,然而多數(shù)搜索引擎對(duì)此 不加控制。從情報(bào)語言學(xué)研究的成果以及網(wǎng)絡(luò)信息檢索的現(xiàn)狀來看,自然語 言不加以控制,檢索效率與效果是不能盡如人意的。應(yīng)該說,要克服關(guān)鍵詞 檢索系統(tǒng)的弊病,必須對(duì)關(guān)鍵詞進(jìn)行有效的控制,變字面檢索為概念檢索。 本文在對(duì)字面相似度識(shí)別算法的深入分析基礎(chǔ)上,提出了基于詞素的語 義識(shí)別算法。該算法首先將復(fù)合詞切分為詞素,并在此基礎(chǔ)上對(duì)詞素進(jìn)行語 義分解和標(biāo)注來進(jìn)行同義判別。其主要依據(jù)是,對(duì)標(biāo)引關(guān)鍵詞的切分統(tǒng)計(jì)表 明,專業(yè)領(lǐng)域中的大多數(shù)復(fù)合詞可由數(shù)量有限的詞素組配而成,通過建立一 個(gè)專業(yè)性的詞素語義信息詞典,可以將復(fù)合詞切分為詞素,再轉(zhuǎn)換為事先設(shè) 計(jì)好的語義范疇代碼,在相似度計(jì)算時(shí)以語義代碼的比較代替字面的比較, 突破了以往字面相似度算法的一些局限。 通過與字面相似度算法進(jìn)行對(duì)比測試,證明該算法具有相對(duì)較高的識(shí)別 率,對(duì)搜索引擎的概念檢索有一定的應(yīng)用價(jià)值。
【學(xué)位單位】:南京農(nóng)業(yè)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位年份】:2001
【中圖分類】:G354
【文章目錄】:
引 言
第一章 搜索引擎現(xiàn)狀分析與研究概況
    第一節(jié) 搜索引擎概述
    第二節(jié) 中文搜索引擎的相關(guān)研究
    第三節(jié) 漢語同義詞識(shí)別研究概況
第二章 智能搜索引擎的功能分析
    第一節(jié) 目前中文搜索引擎的不足與思考
    第二節(jié) 搜索引擎的發(fā)展方向
    第三節(jié) 智能搜索引擎的基本特征
    第四節(jié) 智能搜索引擎的語義網(wǎng)絡(luò)結(jié)構(gòu)
第三章 同義詞識(shí)別算法研究
    第一節(jié) 字面相似度算法分析
    第二節(jié) 同義詞算法改進(jìn)
    第三節(jié) 同義詞識(shí)別的改進(jìn)
第四章 詞素切分技術(shù)研究
    第一節(jié) 分詞技術(shù)研究現(xiàn)狀
    第二節(jié) 詞素切分技術(shù)
第五章 詞素語義信息詞典的設(shè)計(jì)
    第一節(jié) 詞素詞典的建立
    第二節(jié) 語義體系的設(shè)計(jì)
第六章 同義詞識(shí)別實(shí)驗(yàn)系統(tǒng)與效果測評(píng)
    第一節(jié) 系統(tǒng)功能
    第二節(jié) 系統(tǒng)同義詞識(shí)別效果評(píng)測
附件1 語義分類體系
附件2 詞素信息詞典樣例
附件3 相似度識(shí)別結(jié)果
參考文獻(xiàn)

【引證文獻(xiàn)】

相關(guān)期刊論文 前10條

1 章成志;一種基于語義體系的同義詞識(shí)別研究[J];淮陰工學(xué)院學(xué)報(bào);2004年01期

2 常娥;侯漢清;曹玲;;古籍自動(dòng)?钡难芯亢蛯(shí)現(xiàn)[J];中文信息學(xué)報(bào);2007年02期

3 張書娟;董喜雙;關(guān)毅;;基于電子商務(wù)用戶行為的同義詞識(shí)別[J];中文信息學(xué)報(bào);2012年03期

4 陸勇,侯漢清;用于信息檢索的同義詞自動(dòng)識(shí)別及其進(jìn)展[J];南京農(nóng)業(yè)大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版);2004年03期

5 查貴庭,侯漢清;基于多詞表的自動(dòng)標(biāo)引技術(shù)研究——新華社新聞稿自動(dòng)標(biāo)引的實(shí)驗(yàn)[J];情報(bào)學(xué)報(bào);2002年03期

6 傅魁;聶規(guī)劃;;面向文本的本體學(xué)習(xí)方法綜述[J];情報(bào)雜志;2008年09期

7 宋樂平;;文獻(xiàn)數(shù)據(jù)庫中詞匯控制研究綜述[J];圖書館;2012年05期

8 楊賀;楊奕虹;喬曉東;李寧;朱禮軍;;用于計(jì)算機(jī)輔助文獻(xiàn)標(biāo)引加工系統(tǒng)的自然語言詞表構(gòu)建[J];現(xiàn)代圖書情報(bào)技術(shù);2010年06期

9 劉友華;黃芳;張克狀;李寅;;基于鏈接結(jié)構(gòu)和共現(xiàn)分析識(shí)別同義詞的改進(jìn)方法[J];信息系統(tǒng)學(xué)報(bào);2009年02期

10 孫海霞;吳英杰;李軍蓮;李丹亞;;中文關(guān)鍵詞-主題詞自動(dòng)映射方法研究綜述[J];醫(yī)學(xué)信息學(xué)雜志;2012年03期


相關(guān)博士學(xué)位論文 前2條

1 常娥;古籍智能處理技術(shù)研究[D];南京農(nóng)業(yè)大學(xué);2007年

2 傅魁;基于Web的本體學(xué)習(xí)研究[D];武漢理工大學(xué);2007年


相關(guān)碩士學(xué)位論文 前10條

1 吳波;改進(jìn)的編輯距離算法的研究及其在電子政務(wù)中的應(yīng)用[D];電子科技大學(xué);2011年

2 張書娟;基于電子商務(wù)用戶行為的同義詞識(shí)別[D];哈爾濱工業(yè)大學(xué);2011年

3 寧可為;基于分布式技術(shù)的遠(yuǎn)程教育自動(dòng)答疑系統(tǒng)的設(shè)計(jì)與開發(fā)[D];新疆師范大學(xué);2011年

4 劉浩一;基于中文自然語言查詢的多媒體數(shù)據(jù)庫檢索系統(tǒng)[D];山東師范大學(xué);2006年

5 張玉娟;基于《知網(wǎng)》的句子相似度計(jì)算的研究[D];中國地質(zhì)大學(xué)(北京);2006年

6 杜慧平;自然語言敘詞表自動(dòng)構(gòu)建研究[D];南京農(nóng)業(yè)大學(xué);2007年

7 徐芳;利用概念檢索實(shí)現(xiàn)專業(yè)搜索引擎的智能化[D];北京化工大學(xué);2008年

8 仲云云;電子政務(wù)主題詞表的構(gòu)建及應(yīng)用研究[D];南京農(nóng)業(yè)大學(xué);2007年

9 陳靖;垂直育兒搜索引擎研究[D];西南大學(xué);2010年

10 李旭鋒;中文問答系統(tǒng)中問句理解和相似度計(jì)算的研究與實(shí)現(xiàn)[D];華南理工大學(xué);2010年



本文編號(hào):2844926

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/tushudanganlunwen/2844926.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶6e81e***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com