天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 社科論文 > 圖書檔案論文 >

基于知網(wǎng)的多關(guān)鍵字檢索研究

發(fā)布時間:2020-04-14 01:10
【摘要】: 隨著因特網(wǎng)信息的飛速膨脹,網(wǎng)絡成為人們獲取信息的主要渠道,而信息檢索也成為人們上網(wǎng)的主要目的之一。但是,如何從這樣一個龐大的信息資源庫中獲取需要的準確信息,已成為人們面臨的一個重要問題,F(xiàn)有的搜索引擎往往采用機械式的字符串匹配的搜索技術(shù),在處理單一關(guān)鍵詞時,基本可以滿足用戶要求,但在處理多關(guān)鍵詞時,問題就出現(xiàn)了。首先,由于只是基于字符串匹配,使得位置靠后的關(guān)鍵詞很可能被忽略掉。再者,即使多個關(guān)鍵詞都匹配到,但沒有注重關(guān)鍵詞的各自的重要度,從而導致檢索結(jié)果與用戶意圖不符,降低查詢的準確度。 在處理多關(guān)鍵詞時,需要一個強大的知識庫的支持!吨W(wǎng)》是一個以漢語和英語的詞語所代表的概念為描述對象,以揭示概念與概念之間以及概念所具有的屬性之間的關(guān)系為基本內(nèi)容的常識知識庫。它為自然語言信息處理的研發(fā)提供了豐富的知識資源。因此,本文選定《知網(wǎng)》來實現(xiàn)多關(guān)鍵詞的處理,使得檢索不再是簡單的基于關(guān)鍵詞的機械式匹配,而是注重關(guān)鍵詞間的語義關(guān)系,用以解決當前搜索引擎查準率低的問題。 本文認真研究《知網(wǎng)》后提出了基于知網(wǎng)的多關(guān)鍵詞知曉模型,模型主要包括三大模塊的實現(xiàn):詞義消歧模塊、語義關(guān)系知曉模塊、復合詞處理模塊。詞義消歧模塊:一詞多義是制約語義關(guān)系知曉的重要因素。因此,本文提出了影響相關(guān)度的五種因素,并通過計算多關(guān)鍵詞的語義相關(guān)度進行詞義消歧。語義關(guān)系知曉模塊:根據(jù)漢語的特點,本文提出了八種多關(guān)鍵詞語義關(guān)系、核心關(guān)鍵詞與分級權(quán)重,并根據(jù)不同的語義關(guān)系設(shè)置不同的分級權(quán)重,以提高查詢的準確度。復合詞處理模塊:對于《知網(wǎng)》中未出現(xiàn)的詞語,即復合詞,本文基于語義關(guān)系知曉提出了概念組合法,以確定復合詞義原表示項,并解決了復合詞無法參與語義關(guān)系判斷的難題。 為了驗證模型的合理性,本文分別對三個模塊進行了實驗,并結(jié)合多關(guān)鍵詞的知曉技術(shù)設(shè)計了一個元搜索引擎檢索模型。從實驗結(jié)果來看,基于知網(wǎng)的多關(guān)鍵詞知曉模型在搜索引擎中的應用是可行的,提高了搜索引擎的查準率。
【圖文】:

知識架構(gòu),知網(wǎng)


圖 3.1 知網(wǎng)的知識架構(gòu)Fig.3.1 Knowledge frame of HowNet知網(wǎng)中有兩個主要的概念:“概念”與“義原”!案拍睢笔菍υ~匯語義的一種描述。每一個詞可以表達為幾個概念!案拍睢笔怯靡环N“知識表示語言”來描述的,這種“知識表示語言”所用的“詞匯”叫做“義原”。什么是義原,跟什么是詞一樣難以定義。但是也跟詞一樣并不因為它難于定義人們就無法把握和利用它們。大體上說,義原是最基本的、不易于再分割的意義的最小單位。例如:“人”雖然是一個非常復雜的概念,它可以是多種屬性的集合體,但也可以把它看作為一個義原?梢赃@樣設(shè)想,所有的概念都可以分解成各種各樣的義原,同時也應該有一個有限的義原集合,其中的義原組合成一個無限的概念集合。如果能夠把握這一有限的義原集合,并利用它來描述概念之間的關(guān)系以及屬性與屬性之間的關(guān)系,就有可能建立知識系統(tǒng)。利用中文來尋求這個有限的集合,應該說是個捷徑。中文中的字(包括單純詞)是有限的,并且它可以被用來表達各種各樣的單純的或復雜的概念,以及表達概念與概念之間、概念

知識網(wǎng)絡,體系,知網(wǎng)


為過去、現(xiàn)在和未來。沒有一種事物只能是部件,,而不能是整體;也沒有一種事物只能是整體,而不會是部件。一個事物被視為是整體還是部件,可以因系統(tǒng)的不同,而不同對待。關(guān)于對屬性的認識是:任何一個事物都一定包含著多種屬性事物之間的異或同是由屬性決定的,沒有了屬性就沒有了事物。知網(wǎng)中含有豐富的詞匯語義知識和世界知識,為自然語言處理和機器翻譯等方面的研究提供了寶貴的資源。計算機化是知網(wǎng)的重要特色。知網(wǎng)是面向計算機的,是借助于計算機建立的,將來可能是計算機的智能構(gòu)件。知網(wǎng)是一個網(wǎng)而不是樹。它所著力要反映的是概念的共性和個性,例如:對于“醫(yī)生”和“患者”,“人”是它們的共性。知網(wǎng)在主要特性文件中描述了“人”所具有的共性,那么“醫(yī)生”的個性是他是“醫(yī)治”的施事,而“患者”的個性是他是“患病的經(jīng)驗者。對于“富翁”和“窮人”,“美女”和“丑八怪”而言,“人”是它們的共性。而它們的個性,即:“貧”、“富”與“美”、“丑”等不同的屬性值,則是它們的個性。同時知網(wǎng)還著力要反映概念之間和概念的屬性之間的各種關(guān)系。知網(wǎng)把下面的一種知識網(wǎng)絡體系明確的教給了計算機進而使知識對計算機而言是可操作的。
【學位授予單位】:重慶大學
【學位級別】:碩士
【學位授予年份】:2008
【分類號】:G250.74;G354

【參考文獻】

相關(guān)期刊論文 前10條

1 許云,樊孝忠,張鋒;基于知網(wǎng)的語義相關(guān)度計算[J];北京理工大學學報;2005年05期

2 金博,史彥軍,滕弘飛;基于語義理解的文本相似度算法[J];大連理工大學學報;2005年02期

3 孫繼明;李舟軍;文健;;基于《知網(wǎng)》的漢語詞語詞義消歧方法[J];計算機與信息技術(shù);2007年03期

4 張曉剛,李明樹;智能搜索引擎技術(shù)的研究與發(fā)展[J];計算機工程與應用;2001年24期

5 李素建;基于語義計算的語句相關(guān)度研究[J];計算機工程與應用;2002年07期

6 陳偉雄,馬少平,步建華;基于元搜索引擎的多關(guān)鍵詞檢索技術(shù)[J];計算機工程與應用;2004年24期

7 夏天;;漢語詞語語義相似度計算研究[J];計算機工程;2007年06期

8 龔永恩;袁春風;武港山;;基于語義的詞義消歧算法初探[J];計算機應用研究;2006年03期

9 楊曉峰,李堂秋,洪青陽;基于實例的漢語句法結(jié)構(gòu)分析歧義消解[J];中文信息學報;2001年03期

10 李峰;李芳;;中文詞語語義相似度計算——基于《知網(wǎng)》2000[J];中文信息學報;2007年03期

相關(guān)碩士學位論文 前2條

1 王廣正;基于知網(wǎng)語義相關(guān)度計算的漢語自動分詞方法的研究[D];云南師范大學;2006年

2 李佳;基于知網(wǎng)的中文本體映射研究[D];北京郵電大學;2007年



本文編號:2626675

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/tushudanganlunwen/2626675.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶049fc***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com