蒙漢雙語樹庫建設
本文選題:樹庫 切入點:蒙古語句子 出處:《內蒙古大學》2017年碩士論文 論文類型:學位論文
【摘要】:目前,樹庫建設已經成為自然語言處理不可缺少的組成部分。樹庫的發(fā)展趨勢是作為重要的語言資源,為自然語言處理提供各種知識支持,F有的樹庫大多為單語樹庫。雙語樹庫則以不同的應用目的而建設。本文選擇內蒙古大學現代蒙古語短語結構樹庫詞語標記集及句法標記集和東北大學自然語言處理實驗室中文句法語義系統的詞語標記集及句法標記集為標注體系,從漢蒙政府翻譯文獻中抽取蒙漢句對,進行詞性標注和句法結構標注,并校對,對蒙漢雙語樹庫建設方面進行探索研究。在此基礎上,對蒙古語和漢語短語結構進行了對比研究。論文由導論、第一章、第二章、第三章、結論等五個部分組成。導論部分,闡述了選題意義,研究理論方法及步驟。論述語料庫和樹庫建設與加工相關的研究概況。第一章,在蒙漢雙語樹庫語料來源及所用標注集和語料加工步驟的前提下探討了蒙漢雙語樹庫研制中遇到的問題。第二章,介紹了蒙漢雙語樹庫及其管理軟件的主要功能和實現算法。第三章,利用研制的蒙漢雙語樹庫,對蒙古語和漢語短語結構問題進行了對比研究。結論部分,總結了全文內容。
[Abstract]:At present, the construction of tree bank has become an indispensable part of natural language processing. The development trend of tree bank is as an important language resource. All kinds of knowledge support are provided for natural language processing. Most of the existing treebanks are monolingual. Bilingual treebanks are constructed for different purposes. This paper chooses the tagging of modern Mongolian phrase structure treebanks in Inner Mongolia University. The set of syntactic markers and the set of lexical markers and syntactic markers of the Chinese syntactic and semantic system in the Natural language processing Laboratory of Northeastern University are the tagging systems. This paper extracts Mongolian and Chinese sentence pairs from the translation documents of Han and Mongolian governments, carries out part of speech tagging and syntactic structure tagging, and proofreads them to explore the construction of Mongolian and Chinese bilingual tree banks. The thesis is composed of five parts: introduction, chapter one, chapter two, chapter three, conclusion. Research methods and steps. Review the research of corpus and treebank construction related to processing. Chapter 1, This paper discusses the problems encountered in the development of the Mongolian and Chinese bilingual tree bank on the premise of the source of the Mongolian and Chinese bilingual tree data, the tagging set used and the processing steps of the corpus. Chapter two, This paper introduces the main functions and implementation algorithms of Mongolian and Chinese bilingual tree base and its management software. Chapter three makes a comparative study of Mongolian and Chinese phrase structure using the developed Mongolian and Chinese bilingual tree library. The conclusion part summarizes the content of this paper.
【學位授予單位】:內蒙古大學
【學位級別】:碩士
【學位授予年份】:2017
【分類號】:H212
【參考文獻】
相關期刊論文 前10條
1 吳玲;;句法學視角下漢語形容詞詞性問題研究[J];鄭州大學學報(哲學社會科學版);2016年03期
2 李發(fā)杰;余正濤;郭劍毅;李英;周蘭江;;借助漢-越雙語詞對齊語料構建越南語依存樹庫[J];中文信息學報;2015年06期
3 劉磊;;語言學研究中的樹庫建設及其應用[J];燕山大學學報(哲學社會科學版);2014年01期
4 曹井香;黃德根;王偉;王帥軍;;中英平行短語依存樹庫構建[J];大連理工大學學報;2014年01期
5 施春宏;張瑞朋;;論中介語語料庫的平衡性問題[J];語言文字應用;2013年02期
6 曹賢文;;留學生漢語中介語縱向語料庫建設的若干問題[J];語言文字應用;2013年02期
7 黃立波;朱志瑜;;國內英漢雙語平行語料庫建構與研究現狀及展望[J];當代外語研究;2013年01期
8 王克非;黃立波;;國外雙語庫研制與應用評析[J];外語電化教學;2012年06期
9 王慧蘭;;漢語句類依存樹庫的構建研究[J];北京大學學報(自然科學版);2013年01期
10 陳愛兵;;雙語語料庫在翻譯實踐中的應用初探[J];南昌高專學報;2011年01期
相關會議論文 前1條
1 德·薩日娜;那順烏日圖;;《蒙古語語義信息詞典》的初步構建[A];中國計算機語言學研究前沿進展(2007-2009)[C];2009年
相關重要報紙文章 前1條
1 吳義誠;;從靜到動:動態(tài)句法學的語言觀[N];中國社會科學報;2012年
相關博士學位論文 前3條
1 曹井香;中英平行短語依存樹庫的構建與應用研究[D];大連理工大學;2013年
2 張建梅;基于語料庫的現代蒙古語簡單陳述句句型分析研究[D];內蒙古大學;2010年
3 詹衛(wèi)東;面向中文信息處理的現代漢語短語結構規(guī)則研究[D];北京大學;1999年
相關碩士學位論文 前2條
1 李華棟;基于規(guī)則的漢語兼類詞標注方法研究[D];西南交通大學;2014年
2 牟小峰;面向英漢機器翻譯的樹庫建設[D];北京語言大學;2007年
,本文編號:1615830
本文鏈接:http://www.sikaile.net/shoufeilunwen/zaizhiboshi/1615830.html