天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 軟件論文 >

泰語句子相似度計算研究

發(fā)布時間:2018-05-21 17:51

  本文選題:向量模型 + 句子語義; 參考:《昆明理工大學》2017年碩士論文


【摘要】:泰語句子相似度計算是信息處理領域的問題之一,隨著國家“一帶一路”戰(zhàn)略的實施,我國與東南亞國家經(jīng)濟交往越來越密切,而泰國是東南亞地區(qū)重要國家之一,因此基于泰語的自然語言處理研究非常重要。泰語句子相似度計算在多個領域有廣泛的應用,特別是泰語機器翻譯以及專家系統(tǒng)領域,相似度計算是不可或缺的部分。在泰語句子相似度計算方法的研究過程中,本文從泰語句子的關鍵詞、知網(wǎng)的語義、WordNet語料庫的語義三個方面的特征進行了研究,針對以上的三個方面,本文提出了一種融合多特征的泰語句子相似度計算方法。最后,我們設計和實現(xiàn)了一個泰語句子相似度計算的應用系統(tǒng),本文完成的主要工作有以下幾個方面:1.深入分析了泰語句子相似度計算以及向量空間模型,設計了泰語分詞的方法,并且利用此方法實現(xiàn)了泰語句子相似度計算的系統(tǒng)。2.研究了泰語詞匯語義相似度及其計算方法。句子由詞匯結合特定的語法規(guī)則構成,因此詞語的相似度計算技術是研究句子相似度計算的基礎,因此研究詞語的相似度計算具有非常重要的意義。3.對現(xiàn)有的文本相似度計算技術進行了研究和分析,其中重點研究WordNet為語義知識庫著重計算機對泰文句子的語義分析技術。4.設計實現(xiàn)了一個基于泰語句子相似度計算的系統(tǒng),并用該系統(tǒng)設計實驗驗證了本文提出的泰語句子相似度計算方法的效率。
[Abstract]:The calculation of Thai sentence similarity is one of the problems in the field of information processing. With the implementation of the national "Belt and Road" strategy, the economic exchanges between China and Southeast Asian countries are getting closer and closer, and Thailand is one of the important countries in Southeast Asia. Therefore, the study of natural language processing based on Thai is very important. The calculation of Thai sentence similarity is widely used in many fields, especially in the field of Thai machine translation and expert system. In the course of studying the method of calculating the similarity of Thai sentences, this paper studies the features of the key words of Thai sentences and the semantic features of WordNet corpus, aiming at the above three aspects. In this paper, a method for calculating the similarity of Thai sentences with multiple features is proposed. Finally, we design and implement a Thai sentence similarity calculation application system. The main work of this paper is as follows: 1. This paper deeply analyzes Thai sentence similarity calculation and vector space model, designs the method of Thai word segmentation, and realizes the system of calculating Thai sentence similarity by using this method. The semantic similarity of Thai vocabulary and its calculation method are studied. Sentences are composed of words combined with specific grammatical rules, so the technology of word similarity calculation is the basis of sentence similarity calculation, so the study of word similarity calculation is of great significance. The existing text similarity computing techniques are studied and analyzed, in which WordNet is the semantic knowledge base and the computer semantic analysis technology for Thai sentences. A system based on Thai sentence similarity calculation is designed and implemented, and the efficiency of the proposed method is verified by the design of the system.
【學位授予單位】:昆明理工大學
【學位級別】:碩士
【學位授予年份】:2017
【分類號】:TP391.1

【參考文獻】

相關期刊論文 前10條

1 邊振興;;WordNet中概念語義相似度IC參數(shù)模型研究[J];計算機工程與應用;2011年19期

2 陳沈焰;吳軍華;;基于本體的概念語義相似度計算及其應用[J];微電子學與計算機;2008年12期

3 顏端武;成曉;甘利人;;基于領域本體和概念向量的中文文本相似性測度研究[J];中國圖書館學報;2007年06期

4 楊憲澤;張上游;李建陽;;信息檢索的基本方法與發(fā)展研究[J];西南民族大學學報(自然科學版);2007年03期

5 李鵬;陶蘭;王弼佐;;一種改進的本體語義相似度計算及其應用[J];計算機工程與設計;2007年01期

6 劉斌;陳樺;;向量空間模型信息檢索技術討論[J];情報雜志;2006年07期

7 張劍;李春平;;基于WordNet概念向量空間模型的文本分類[J];計算機工程與應用;2006年04期

8 金博,史彥軍,滕弘飛;基于語義理解的文本相似度算法[J];大連理工大學學報;2005年02期

9 劉曉義,王培東,周洪玉;基于知識處理重型切削數(shù)據(jù)庫的設計與實現(xiàn)[J];哈爾濱理工大學學報;2004年01期

10 呂學強,任飛亮,黃志丹,姚天順;句子相似模型和最相似句子查找算法[J];東北大學學報;2003年06期

相關碩士學位論文 前1條

1 蔡剛山;中文自動問答系統(tǒng)研究[D];華中科技大學;2007年



本文編號:1920178

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/1920178.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶4ebc9***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com