天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 文藝論文 > 漢語言論文 >

藏語虛詞知識庫構(gòu)建研究

發(fā)布時(shí)間:2017-03-24 07:07

  本文關(guān)鍵詞:藏語虛詞知識庫構(gòu)建研究,,由筆耕文化傳播整理發(fā)布。


【摘要】:隨著計(jì)算機(jī)的廣泛使用和互聯(lián)網(wǎng)的迅猛發(fā)展,人類已經(jīng)邁向了信息化的社會。利用計(jì)算機(jī)進(jìn)行信息處理已經(jīng)成為這個(gè)時(shí)代的主旋律。藏文信息處理的研究經(jīng)過“字”處理邁向“語”處理,在理論探索、基礎(chǔ)知識庫和語料庫等方面的建設(shè)取得了較大的成績,但相對快速膨脹的實(shí)際需求而言,藏文信息處理技術(shù)依然滯后于實(shí)際需求,其中主要的原因是我們?yōu)橛?jì)算機(jī)儲備的語言知識不夠。語言知識庫是自然語言處理系統(tǒng)的重要組成部分,其規(guī)模與質(zhì)量是自然語言處理系統(tǒng)成敗的關(guān)鍵。對于藏語來說,尤其重視語言知識庫的建設(shè)。目前藏文信息處理領(lǐng)域的知識庫,主要是實(shí)詞的語法信息字典和各種語料庫,此外還沒有建立系統(tǒng)的藏語虛詞知識庫。因此,藏語虛詞知識庫的構(gòu)建是目前藏文信息處理領(lǐng)域里的薄弱環(huán)節(jié),要想藏文信息處理推向一個(gè)新的高度,虛詞知識庫的構(gòu)建是一個(gè)無法回避的基礎(chǔ)性工程。 本文共分八章。 第一章“引言”主要介紹了藏語虛詞知識庫構(gòu)建研究的背景及意義、研究現(xiàn)狀、研究目的。同時(shí)也介紹了藏文信息處理的發(fā)展與成就。信息時(shí)代,我們要突破傳統(tǒng)的語言研究方法從另一個(gè)新的形式化框架模式下對藏語語法的研究對象、研究目的、研究方法的轉(zhuǎn)換為切入點(diǎn),為面向藏語信息處理提供有效的語言資源。 第二章“藏語虛詞知識庫的構(gòu)建”主要介紹了藏語虛詞的概貌及其作用、藏語虛詞知識庫的重要性、藏語虛詞知識庫的構(gòu)建方法和內(nèi)容。虛詞知識在藏文信息處理的詞法分析、句法分析和機(jī)器翻譯等方面都有很重要的作用。構(gòu)建方法借鑒了劉云的“三位一體”的思路,即構(gòu)建藏語虛詞機(jī)器字典、構(gòu)建藏語語料庫和構(gòu)建藏語虛詞規(guī)則庫。按照信息處理需求,把藏語虛詞分為了三個(gè)部分,即格助詞、自由和不自由虛詞。 第三章、第四章和第五章是本文的重點(diǎn)。本章對藏語“格助詞”、“自由虛詞”和“不自由虛詞”知識庫構(gòu)建內(nèi)容、方法的綜合應(yīng)用。主要闡述了19個(gè)藏語格助詞、20個(gè)不自由虛詞和47個(gè)自由虛詞共計(jì)對86個(gè)藏語虛詞,通過語法分類、字段設(shè)立之后分別建立了機(jī)器字典。并利用已建立的4000萬字次的語料統(tǒng)計(jì)出了頻率、頻次等相關(guān)數(shù)據(jù)。同時(shí)也對每個(gè)藏語虛詞分別制定了相應(yīng)的規(guī)則。 第六章“實(shí)驗(yàn)與結(jié)果”主要對格助詞制定的標(biāo)記集為對象,通過人工標(biāo)注了100萬詞的語料進(jìn)行了實(shí)驗(yàn)。結(jié)果表明效果顯著,達(dá)到預(yù)期的目的。 第七章“構(gòu)建藏語虛詞知識庫的難點(diǎn)”主要對藏語虛詞歸類問題、藏語虛詞兼類問題、藏語虛詞的半語法化問題和面向機(jī)器的藏語虛詞描述問題等方面存在的問題進(jìn)行了說明。 第八章是本文的結(jié)語,主要是對已有研究工作的總結(jié)和進(jìn)一步的研究計(jì)劃。
【關(guān)鍵詞】:藏語虛詞 藏語信息處理 知識庫 機(jī)器字典 規(guī)則庫
【學(xué)位授予單位】:西北民族大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2012
【分類號】:H214
【目錄】:
  • 摘要2-3
  • Abstract3-5
  • 藏文摘要5-16
  • 第一章 引言16-21
  • 1.1 研究背景及意義16-17
  • 1.2 研究現(xiàn)狀17-18
  • 1.2.1 國外研究現(xiàn)狀17
  • 1.2.2 國內(nèi)研究現(xiàn)狀17-18
  • 1.3 面向信息處理的語言問題18-19
  • 1.3.1 藏語信息處理的發(fā)展18-19
  • 1.3.2 藏語信息處理的成就19
  • 1.4 計(jì)算機(jī)背景下的藏語語法問題19-21
  • 1.4.1 研究對象的轉(zhuǎn)換19-20
  • 1.4.2 研究目的的轉(zhuǎn)換20
  • 1.4.3 研究方法的轉(zhuǎn)換20-21
  • 第二章 藏語虛詞知識庫的建設(shè)21-29
  • 2.1 藏語虛詞概念及作用21-22
  • 2.1.1 藏語虛詞概念21
  • 2.1.2 藏語虛詞作用21-22
  • 2.2 藏語虛詞知識庫的重要性22-25
  • 2.2.1 詞法分析中的重要性22-23
  • 2.2.2 句法分析中的重要性23-24
  • 2.2.3 具體應(yīng)用中的重要性24-25
  • 2.3 藏語虛詞知識庫的構(gòu)建方法25-28
  • 2.3.1 構(gòu)建藏語虛詞機(jī)器字典26
  • 2.3.2 構(gòu)建藏語語料庫26-27
  • 2.3.3 構(gòu)建藏語虛詞規(guī)則庫27-28
  • 2.4 藏語虛詞知識庫構(gòu)建的內(nèi)容28-29
  • 2.4.1 知識庫原理28
  • 2.4.2 藏語虛詞的分類28-29
  • 第三章 格助詞的知識庫29-65
  • 3.1 屬格助詞的知識庫31-39
  • 3.1.1 屬格助詞((?))31
  • 3.1.2 屬格助詞的機(jī)器字典31-37
  • 3.1.2.1 屬格助詞的語法分類31-35
  • 3.1.2.2 屬格助詞的字段設(shè)立35-36
  • 3.1.2.3 屬格助詞的字典摘錄36-37
  • 3.1.3 基于語料的屬格助詞37-38
  • 3.1.4 屬格助詞的規(guī)則庫38-39
  • 3.2 作格助詞的知識庫39-44
  • 3.2.1 作格助詞((?))39
  • 3.2.2 作格助詞的機(jī)器字典39-43
  • 3.2.2.1 作格助詞的語法分類39-42
  • 3.2.2.2 作格助詞的字段設(shè)立42
  • 3.2.2.3 作格助詞的字典摘錄42-43
  • 3.2.3 基于語料的作格助詞43
  • 3.2.4 作格助詞的規(guī)則庫43-44
  • 3.3 “La”格助詞的知識庫((?))44-58
  • 3.3.1 “La”格助詞添接法44-45
  • 3.3.2 “La”格助詞機(jī)器字典45-57
  • 3.3.2.1 業(yè)格助詞((?))45-47
  • 3.3.2.1.1 業(yè)格助詞的語法分類問題45-46
  • 3.3.2.1.2 業(yè)格助詞的字段設(shè)立46-47
  • 3.3.2.1.3 業(yè)格助詞的字典摘錄47
  • 3.3.2.2 為格助詞((?))47-49
  • 3.3.2.2.1 為格助詞的語法問題48-49
  • 3.3.2.2.2 為格助詞的字段設(shè)立49
  • 3.3.2.2.3 為格助詞的字典摘錄49
  • 3.3.2.3 依格助詞((?))49-51
  • 3.3.2.3.1 依格助詞的語法問題50-51
  • 3.3.2.3.2 依格助詞的字段設(shè)立51
  • 3.3.2.3.3 依格助詞的字典摘錄51
  • 3.3.2.4 同體格助詞((?))51-53
  • 3.3.2.4.1 同體格助詞的語法問題51-52
  • 3.3.2.4.3 同體格助詞的字段設(shè)立52
  • 3.3.2.4.4 同體格助詞的字典摘錄52-53
  • 3.3.2.5 時(shí)間格助詞((?))53-55
  • 3.3.2.5.1 時(shí)間格助詞的語法問題53-54
  • 3.3.2.5.2 時(shí)間格助詞的字段設(shè)立54
  • 3.3.2.5.3 時(shí)間格助詞的字典摘錄54-55
  • 3.3.2.6 “La”格助詞的其它用法55-57
  • 3.3.4 基于語料的“La”格助詞57
  • 3.3.5 “La”格助詞的規(guī)則庫57-58
  • 3.4 從格助詞的知識庫58-63
  • 3.4.1 從格助詞((?))58-59
  • 3.4.2 從格助詞的機(jī)器字典59-62
  • 3.4.2.1 從格助詞的語法分類59-61
  • 3.4.2.2 從格助詞的字段設(shè)立61
  • 3.4.2.3 從格助詞的字典摘錄61-62
  • 3.4.3 基于語料的從格助詞62
  • 3.4.4 從格助詞的規(guī)則庫62-63
  • 3.5 小結(jié)63-65
  • 第四章 自由虛詞的知識庫((?))65-87
  • 4.1 語氣助詞的知識庫65-68
  • 4.1.1 語氣助詞((?))65-66
  • 4.1.2 語氣詞助的機(jī)器字典66-68
  • 4.1.2.1 語氣助詞的分類問題66-67
  • 4.1.2.2 語氣助詞的字段設(shè)立67
  • 4.1.2.3 語氣助詞的字典摘錄67-68
  • 4.1.3 基于語料的語氣詞助68
  • 4.1.4 語氣詞助的規(guī)則庫68
  • 4.2 連詞的知識庫68-72
  • 4.2.1 連詞((?))68-69
  • 4.2.2 連詞的機(jī)器字典69-72
  • 4.2.2.1 連詞的語法分類問題69-71
  • 4.2.2.2 連詞的字段設(shè)立71
  • 4.2.2.3 連詞的字典摘錄71-72
  • 4.2.3 基于語料的連詞72
  • 4.2.4 連詞的規(guī)則庫72
  • 4.3 指示代詞的知識庫72-76
  • 4.3.1 指示代詞((?))72-73
  • 4.3.2 指示代詞的機(jī)器字典73-75
  • 4.3.2.1 指示代詞的分類問題73-74
  • 4.3.2.2 指示代詞的字段設(shè)立74-75
  • 4.3.2.3 指示代詞的字典摘錄75
  • 4.3.3 基于語料的指示代詞75
  • 4.3.4 指示代詞的規(guī)則庫75-76
  • 4.4 疑問代詞的知識庫76-80
  • 4.4.1 疑問代詞((?))76
  • 4.4.2 疑問代詞的機(jī)器字典76-79
  • 4.4.2.1 疑問代詞的分類問題76-78
  • 4.4.2.2 疑問代詞的字段設(shè)立78
  • 4.4.2.3 疑問代詞的字典摘錄78-79
  • 4.4.3 基于語料的疑問代詞79
  • 4.4.4 疑問代詞的規(guī)則庫79-80
  • 4.5 否定詞的知識庫80-83
  • 4.5.1 否定詞((?))80
  • 4.5.2 否定詞的機(jī)器字典80-82
  • 4.5.2.1 否定詞的分類問題80-82
  • 4.5.2.2 否定詞的字段設(shè)立82
  • 4.5.2.3 否定詞的字典摘錄82
  • 4.5.3 基于語料的否定詞82-83
  • 4.5.4 否定詞的規(guī)則庫83
  • 4.6 指人后綴的知識庫83-86
  • 4.6.1 指人后綴((?))83
  • 4.6.2 指人后綴的機(jī)器字典83-85
  • 4.6.2.1 指人后綴的語法分類問題83-84
  • 4.6.2.2 指人后綴的字段設(shè)立84
  • 4.6.2.3 指人后綴的字典摘錄84-85
  • 4.6.3 基于語料的指人后綴85
  • 4.6.4 指人后綴的規(guī)則庫85-86
  • 4.7 小結(jié)86-87
  • 第五章 不自由虛詞的知識庫((?))87-112
  • 5.1 飾集詞的知識庫((?))87-92
  • 5.1.1 飾集詞的機(jī)器字典87-91
  • 5.1.1.1 飾集詞的分類問題87-90
  • 5.1.1.2. 飾集詞的字段設(shè)立90
  • 5.1.1.3 飾集詞的字典摘錄90-91
  • 5.1.2 基于語料的飾集詞91
  • 5.1.3 飾集詞的規(guī)則庫91-92
  • 5.2 待述詞的知識庫((?))92-96
  • 5.2.1 待述詞的機(jī)器字典92-95
  • 5.2.1.1 待述詞的分類問題92-94
  • 5.2.1.2 待述詞的字段設(shè)立94
  • 5.2.1.3 待述詞的字典摘錄94-95
  • 5.2.2 基于語料的待述詞95
  • 5.2.3 待述詞的規(guī)則庫95-96
  • 5.3 離合詞的知識庫((?))96-100
  • 5.3.1 離合詞的機(jī)器字典96-99
  • 5.3.2.1 離合詞的分類問題96-98
  • 5.3.2.2 離合詞的字段設(shè)立98
  • 5.3.2.3 離合詞的字典摘錄98-99
  • 5.3.2 基于語料的離合詞99
  • 5.3.3 離合詞的規(guī)則庫99-100
  • 5.4 終結(jié)詞的知識庫((?))100-104
  • 5.4.1 終結(jié)詞的機(jī)器字典100-102
  • 5.4.1.1 終結(jié)詞的分類問題100-102
  • 5.4.1.2 終結(jié)詞的字段設(shè)立102
  • 5.4.1.3 終結(jié)詞的字典摘錄102
  • 5.4.2 基于語料的終結(jié)詞102-103
  • 5.4.3 終結(jié)詞的規(guī)則庫103-104
  • 5.5 虛詞((?))等的知識庫104-109
  • 5.5.1 虛詞((?))等((?))104-105
  • 5.5.2 虛詞((?))等的機(jī)器字典105-107
  • 5.5.2.1 虛詞((?))等的分類問題105-106
  • 5.5.2.2 虛詞((?))等的字段設(shè)立106-107
  • 5.5.2.3 虛詞((?))等的機(jī)器字典摘錄107
  • 5.5.3 基于語料的虛詞((?))等107-108
  • 5.5.4 虛詞((?))等的規(guī)則庫108-109
  • 5.6 虛詞((?))等的知識庫109-111
  • 5.6.1 虛詞((?))等((?))109
  • 5.6.2 虛詞((?))等的機(jī)器字典109-110
  • 5.6.2.1 虛詞((?))等的分類問題109
  • 5.6.2.2 虛詞((?))等的字段設(shè)立109-110
  • 5.6.2.3 虛詞((?))等的字典摘錄110
  • 5.6.3 基于語料的虛詞((?))等110
  • 5.6.4 虛詞((?))等的規(guī)則庫110-111
  • 5.7 小結(jié)111-112
  • 第六章 虛詞知識庫在語料中的實(shí)驗(yàn)與結(jié)果112-115
  • 6.1 實(shí)驗(yàn)環(huán)境112-113
  • 6.2 實(shí)驗(yàn)結(jié)果113-115
  • 第七章 構(gòu)建藏語虛詞知識庫的難點(diǎn)115-117
  • 7.1 藏語虛詞歸類問題115
  • 7.2 藏語虛詞兼類問題115-117
  • 第八章 結(jié)束語117-119
  • 8.1 研究工作的回眸117-118
  • 8.2 研究工作的展望方面118-119
  • 參考文獻(xiàn)119-120
  • 在校期間研究成果120-121
  • 附錄121-128
  • 致謝128

【參考文獻(xiàn)】

中國期刊全文數(shù)據(jù)庫 前7條

1 陳玉忠,俞士汶;藏文信息處理技術(shù)的研究現(xiàn)狀與展望[J];中國藏學(xué);2003年04期

2 才讓三智;多拉;;信息處理中藏語虛詞“na”和“l(fā)a”的標(biāo)注研究[J];電腦知識與技術(shù);2011年10期

3 昝紅英;張坤麗;柴玉梅;俞士汶;;現(xiàn)代漢語虛詞知識庫的研究[J];中文信息學(xué)報(bào);2007年05期

4 扎西加;頓珠次仁;;自然語言處理用藏語格助詞的語法信息研究[J];中文信息學(xué)報(bào);2010年05期

5 彭爽;俞士汶;;現(xiàn)代漢語介詞知識庫的建設(shè)[J];社會科學(xué)戰(zhàn)線;2009年08期

6 高定國;關(guān)白;;回顧藏文信息處理技術(shù)的發(fā)展[J];西藏大學(xué)學(xué)報(bào)(社會科學(xué)版);2009年03期

7 劉云,俞士汶,朱學(xué)鋒,段慧明;現(xiàn)代漢語虛詞知識庫的建設(shè)[J];語言文字應(yīng)用;2005年01期


  本文關(guān)鍵詞:藏語虛詞知識庫構(gòu)建研究,由筆耕文化傳播整理發(fā)布。



本文編號:265239

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/wenyilunwen/hanyulw/265239.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶f3c0c***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com