基于俄漢雙語語料庫的同位語的分類與自動提取
發(fā)布時間:2017-04-10 18:27
本文關鍵詞:基于俄漢雙語語料庫的同位語的分類與自動提取,由筆耕文化傳播整理發(fā)布。
【摘要】: 本文從自然語言處理的角度,研究俄漢對譯句子對語料庫中同位語的模式及自動識別和抽取信息等問題。內容包括俄漢語同位語模式化的語言學基礎、俄漢對譯句子對同位語語義類型及模型、確定同位語結構類型和抽取蘊含信息的算法以及個案舉例。在理論研究層面上,揭示了俄漢對譯句子對同位語的基本語義類型,并從信息抽取的角度對其進行了分類,較系統(tǒng)地把握了這種結構構成的復雜性和多樣性;在操作層面上,本文運用自然語言和圖表兩種方法分別描寫算法,并結合個案舉例詳細介紹了運用確定性分析法判定俄漢對譯句子對中同位結構類型及提取同位結構蘊含信息的過程,為計算機程序員實現(xiàn)自然語言處理提供了較詳細的流程圖。
【關鍵詞】:同位語 語義分類 模式化 自動識別
【學位授予單位】:黑龍江大學
【學位級別】:碩士
【學位授予年份】:2007
【分類號】:H35
【目錄】:
- 中文摘要2-3
- 俄文摘要3-6
- 緒論6-12
- 1.本文研究的目的、內容及方法6-7
- 2.相關術語和概念7-10
- 3.理論意義與應用價值10-12
- 第1章 同位現(xiàn)象研究及相關理論12-27
- 1.1 俄語理論語法對同位語的研究12-17
- 1.1.1 有關同位語的概念12-13
- 1.1.2 俄語同位語類型13-17
- 1.2 漢語對同位現(xiàn)象的研究17-22
- 1.2.1 有關“同位”的理論研究17-18
- 1.2.2 同位結構與同位組構18-19
- 1.2.3 同位組構的類型19-22
- 1.3 俄語同位語與漢語同位結構的比較與分析22-27
- 1.3.1 共性23-24
- 1.3.2 差異24-27
- 第2章 面向自動識別和信息挖掘的俄漢同位語模式化分析27-48
- 2.1 帶有連字符“-”的同位語類型28-41
- 2.1.1 普通名詞-普通名詞28-39
- 2.1.2 專有名詞-普通名詞39-41
- 2.2 帶引號“《 》”的同位語類型41-44
- 2.3 不帶連接符號的同位語類型44-48
- 第3章 同位語的自動識別48-69
- 3.1 確定性句法分析法48-50
- 3.1.1 確定性分析系統(tǒng)設計思想的三個特征48
- 3.1.2 確定性分析系統(tǒng)的基本結構48-50
- 3.2 基于該算法的同位語模式自動提取50-53
- 3.2.1 與馬庫斯的確定性句法分析的異同50-51
- 3.2.2 提取帶連字符“-”的同位語及其蘊含信息的算法51-52
- 3.2.3 提取帶引號“《 》”的同位語及其蘊含信息的算法52
- 3.2.4 提取不帶連接符號的同位語及其蘊含信息的算法52-53
- 3.3 算法流程53-56
- 3.3.1 提取帶連字符“-”的同位語及其蘊含信息的算法流程53-54
- 3.3.2 提取帶引號“《 》”的同位語及其蘊含信息的算法流程54-55
- 3.3.3 提取不帶連接符號的同位語及其蘊含信息的算法流程55-56
- 3.4 個案舉例56-69
- 3.4.1 提取帶連字符“-”的同位語及其蘊含信息個案舉例56-62
- 3.4.2 提取帶引號“《 》”的同位語及其蘊含信息個案舉例62-64
- 3.4.3 提取不帶連接符號的同位語及其蘊含信息個案舉例64-69
- 結論69-70
- 參考文獻70-75
- 致謝75-76
【參考文獻】
中國期刊全文數(shù)據(jù)庫 前4條
1 藍慶元,任海波;計算語言學概說[J];桂林師范高等?茖W校學報(綜合版);2001年04期
2 汪成慧;俄漢語差異的幾個特點[J];樂山師范學院學報;2004年07期
3 張麗艷;俄漢標點符號之比較[J];忻州師范學院學報;2005年02期
4 孫漢軍;談談同位語現(xiàn)象[J];中國俄語教學;1991年03期
本文關鍵詞:基于俄漢雙語語料庫的同位語的分類與自動提取,由筆耕文化傳播整理發(fā)布。
,本文編號:297316
本文鏈接:http://www.sikaile.net/waiyulunwen/eyulunwen/297316.html