天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 文藝論文 > 語言學論文 >

基于《說不完的故事》語料庫的藏文短語分析研究

發(fā)布時間:2017-10-07 12:36

  本文關鍵詞:基于《說不完的故事》語料庫的藏文短語分析研究


  更多相關文章: 藏文短語 信息庫 說不完的故事 藏文信息處理


【摘要】:要讓計算機來識別藏文短語,則首要的條件是人類先要找出藏文短語的語法規(guī)則。憑借著這些規(guī)則從真實語料當中找到并提取和分析藏文短語,這樣才能計算機識別藏文短語。藏族經(jīng)典民間文學《說不完的故事》中的序言及十一篇短片故事集作為本文的語料,采用多拉教授的藏文詞性標記集為標注依據(jù),以藏語語法對短語的理論前提選定藏文句子并應用直接成分法對語料中的藏文短語進行人工括號標注。這些序言及其十一篇短片故事集中共有7777個藏文短語分為九個類型,分別為名詞短語、動詞短語、形容詞短語、數(shù)量短語、副詞性短語、時間性短語、特殊短語、諺語和習語。這些藏文短語,從計量、模型、內部結構、外部結構、句法成分,語義角色等六個方面進行分析,最終建立了藏文短語的信息庫。本信息庫中的1657個名詞短語,按結構模型分為六種結構模型;按內部結構分為主格結構、主虛結構、賓格結構、同位結構、并列結構、中定結構和復指結構;按外部結構分為名詞性短語和準名詞性短語,在句子里充當主語和賓語。其中包含的4270個動詞短語按結構模型分為五種結構模型;按內部結構分為狀中結構、賓動結構、主謂結構、并列結構和中補結構;按外部結構分為動詞性短語和準動詞性短語,在句子里充當謂語。包含的347個形容詞短語按結構模型分為八種結構模型;按內部結構分為狀中結構、賓動結構、主謂結構、并列結構、中補結構和中定結構;按外部結構分為動詞性短語、形容詞性短語和名詞性短語在句子可以充當主語、謂語和賓語。包含的656個數(shù)量短語按結構模型分為六種結構模型;按內部結構分為并列結構和中定結構;按外部結構分為數(shù)量性短語和名詞性短語。包含的287個副詞性短語按結構模型分為八種結構模型;按內部結構分為狀格結構和并列結構,在句子里充當狀語。包含的316個時間性短語按結構模型分為十種結構模型;按內部結構分為復指結構、定中結構和中定結構,在句子里充當時間狀語。包含的201個特殊短語,按結構模型分為四種結構模型,其余包含了16個諺語和27個習語。
【關鍵詞】:藏文短語 信息庫 說不完的故事 藏文信息處理
【學位授予單位】:西北民族大學
【學位級別】:碩士
【學位授予年份】:2015
【分類號】:H214
【目錄】:
  • 中文摘要3-4
  • Abstract4-5
  • 摘要5-8
  • 序言8-12
  • 1.1 國內研究現(xiàn)狀8-9
  • 1.2 選題目的及意義9-10
  • 1.3 研究方法10
  • 1.4 本文結構安排10-12
  • 第一章 藏文短語的定義、特點、及其類型12-18
  • 1.1 短語的重要性12-13
  • 1.2 藏文短語的界定13-15
  • 1.3 藏文短語的特點15-17
  • 1.4 藏文短語的類型17-18
  • 第二章 藏語短語表記集的確定18-28
  • 2.1 短語標記集的意義18
  • 2.2 短語標記集的確定原則18
  • 2.3 短語的基本標記集18-19
  • 2.4 《說不完的故事》及其標注語料庫19-28
  • 第三章 《說不完的故事》中的短語的計量分析28-50
  • 3.1 短語總量統(tǒng)計28-29
  • 3.2 短語結構模型頻率統(tǒng)計29-46
  • 3.2.1 名詞短語結構模型頻率統(tǒng)計29-31
  • 3.2.2 動詞短語結構模型頻率統(tǒng)計31-33
  • 3.2.3 形容詞短語結構模型頻率統(tǒng)計33-36
  • 3.2.4 數(shù)量短語結構模型頻率統(tǒng)計36-38
  • 3.2.5 時間性短語結構模型頻率統(tǒng)計38-42
  • 3.2.6 副詞性短語結構模型頻率統(tǒng)計42-44
  • 3.2.7 特殊短語結構模型頻率統(tǒng)計44-46
  • 3.3 短語頻率排序46-50
  • 3.3.1 名詞短語的頻率排序47
  • 3.3.2 動詞短語的頻率排序47-48
  • 3.3.3 形容短語的頻率排序48
  • 3.3.4 數(shù)量短語的頻率排序48
  • 3.3.5 時間性短語的頻率排序48-49
  • 3.3.6 副詞性短語的頻率排序49
  • 3.3.7 特殊短語的頻率排序49-50
  • 第四章 《說不完的故事》語料中的短語語法分析50-61
  • 4.1 短語的結構分析50-55
  • 4.1.1 名詞短語的結構分析50-52
  • 4.1.2 動詞短語結構分析52-53
  • 4.1.3 形容詞短語結構分析53-54
  • 4.1.4 副詞性短語結構分析54
  • 4.1.5 時間性短語結構分析54-55
  • 4.1.6 數(shù)量短語結構分析55
  • 4.2 語法功能分析55-61
  • 4.2.1 名詞短語的功能分析56-57
  • 4.2.2 動詞短語的結構57-58
  • 4.2.3 形容詞短語的功能分析58-59
  • 4.2.4 副詞性短語59
  • 4.2.5 時間性短語59-60
  • 4.2.6 數(shù)量短語功能分析60-61
  • 第五章 《說不完的故事》語料中的短語語義角色分析61-68
  • 5.1 短語結構句法成分分析61-64
  • 5.2 短語語義角色分析64-68
  • 第六章 《說不完的故事》的藏文短語信息庫68-82
  • 6.1 名詞短語信息庫68-70
  • 6.2 動詞短語信息庫70-73
  • 6.3 形容詞短語信息庫73-75
  • 6.4 副詞性短語信息庫75-77
  • 6.5 數(shù)量短語信息庫77-78
  • 6.6 時間性短語信息庫78-79
  • 6.7 特殊短語信息庫79-80
  • 6.8 諺語信息庫80
  • 6.9 習語信息庫80-82
  • 結束語82-83
  • 致謝83-84
  • 參考文獻84-85

【相似文獻】

中國期刊全文數(shù)據(jù)庫 前10條

1 仇永鋼;比況短語初探[J];南通航運職業(yè)技術學院學報;2003年04期

2 王姝;;關于漢語短語系統(tǒng)[J];佳木斯大學社會科學學報;2008年04期

3 宋世平;;短語類型劃分分析[J];荊州師專學報;1989年03期

4 周強;漢語短語的自動劃分和標注[J];中文信息學報;1997年01期

5 陳德三;聯(lián)合短語三題[J];漳州師院學報(哲學社會科學版);1998年02期

6 徐仲華;;談談《提要》中的短語[J];語文學習;1984年10期

7 孟慶財;一些表示數(shù)量的習慣短語結構[J];大學英語;1995年05期

8 姚智清;《阿Q正傳》中“X而且Y”式短語結構小析[J];天中學刊;2000年03期

9 張發(fā)揚;短語功能類型質疑[J];職大學報;2002年01期

10 王紅俠;;組合式偏正短語的語義分析[J];常州工學院學報(社科版);2006年02期

中國重要會議論文全文數(shù)據(jù)庫 前8條

1 趙章界;白碩;;短語結構制導的范疇表達式演算[A];NCIRCS2004第一屆全國信息檢索與內容安全學術會議論文集[C];2004年

2 吳云芳;常寶寶;詹衛(wèi)東;;漢英雙語短語信息數(shù)據(jù)庫的構建[A];第一屆學生計算語言學研討會論文集[C];2002年

3 玉素甫.艾白都拉;阿不都熱依木.沙力;木沙江;;面向現(xiàn)代維吾爾語處理的短語信息庫構造方法[A];民族語言文字信息技術研究——第十一屆全國民族語言文字信息學術研討會論文集[C];2007年

4 張大鯤;張瑋;董靜;;基于非連續(xù)短語的統(tǒng)計翻譯模型[A];第三屆學生計算語言學研討會論文集[C];2006年

5 孟雷;丁效;秦兵;劉挺;;基于依存句法和短語結構句法結合的金融領域事件元素抽取[A];中國計算語言學研究前沿進展(2009-2011)[C];2011年

6 方芳;李斌;;基于語料庫的數(shù)量名短語識別[A];第三屆學生計算語言學研討會論文集[C];2006年

7 華沙寶;達胡白乙拉;;蒙古語賓述短語的自動獲取研究[A];全國第八屆計算語言學聯(lián)合學術會議(JSCL-2005)論文集[C];2005年

8 胡日勒;宗成慶;徐波;;基于短語結構抽取和對齊的機器翻譯模板自動獲取方法[A];第二屆全國學生計算語言學研討會論文集[C];2004年

中國重要報紙全文數(shù)據(jù)庫 前1條

1 陳麗萍;從多義短語入手講授短語的結構類型和層次分析[N];語言文字周報;2010年

中國博士學位論文全文數(shù)據(jù)庫 前4條

1 曹井香;中英平行短語依存樹庫的構建與應用研究[D];大連理工大學;2013年

2 趙章界;短語結構制導的范疇表達式演算[D];中國科學院研究生院(計算技術研究所);2006年

3 秦穎;漢語詞和短語的歧義消解研究[D];北京郵電大學;2008年

4 劉水;融入頭—修飾詞調序模型的短語統(tǒng)計機器翻譯方法研究[D];哈爾濱工業(yè)大學;2011年

中國碩士學位論文全文數(shù)據(jù)庫 前10條

1 白玉;20世紀80年代以來的漢語聯(lián)合短語研究[D];吉林大學;2013年

2 竇金霞;面向信息處理的“并”類短語研究[D];上海師范大學;2007年

3 李福民;基于語料庫的短語結構分析研究[D];山西大學;2012年

4 楊坡;漢語聯(lián)合短語結構分析與識別[D];湘潭大學;2011年

5 霍亞格;漢語短語識別方法研究[D];河南科技大學;2011年

6 楊國基;漢語中基于短語結構的語義提取[D];天津大學;2007年

7 佘靈琳;留學生習得“的”字短語的偏誤分析[D];湖南師范大學;2014年

8 陳珊;漢語網(wǎng)絡偏正短語的搭配研究[D];湖南師范大學;2013年

9 俄拉扎提·巴合達吾列提;哈薩克語短語庫構建及管理系統(tǒng)的研究與實現(xiàn)[D];新疆大學;2014年

10 旦正才讓;基于《說不完的故事》語料庫的藏文短語分析研究[D];西北民族大學;2015年

,

本文編號:987899

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/wenyilunwen/yuyanxuelw/987899.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶73199***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com