基于事件鏈的語篇連貫研究
本文選題:篇章連貫 切入點:詞匯鏈 出處:《武漢大學》2013年博士論文 論文類型:學位論文
【摘要】:語篇連貫無論在語言教學還是信息處理中都有著非常重要的作用。語篇連貫一直以來也是篇章語言學的研究熱點之一。有關篇章連貫的理論也層出不窮,異彩紛呈。其中比較有代表性的理論有韓禮德和哈桑提出的銜接加語域理論,VanDijk的宏觀結構理論,Mann和Thompson的修辭結構理論,Danes和Fries提出的主位推進理論,以及Grosz et al的中心理論。從計算機可操作性的角度審視這些理論,可以發(fā)現(xiàn)這些理論所揭示的篇章連貫的模型可以歸結為三類:基于關系的表示模型,基于邏輯的表示模型和基于實體的表示模型。這些模型在計算可操作性方面存在一些問題:要么現(xiàn)有的計算機技術無法滿足模型的實現(xiàn),要么模型本身的語言學假設過于松弛;诖,我們提出基于事件鏈的語篇連貫理論及模型,以增強基于實體的語篇連貫模型的語言學假設,同時利用現(xiàn)有較成熟的句子和事件分析技術,為語篇連貫的判定和應用提供一條新的途徑。連貫的篇章中存在指向中心話題的事件,這些事件按照一定的關系相互關聯(lián)構成事件鏈。事件鏈建立在詞匯鏈的基礎上,在一定程度上保證了其計算的可操作性。 全文分為八章,主要內容和觀點如下: 第一章:研究引論。引論分為六個小節(jié),具體內容包括語篇連貫研究背景、語篇連貫國內外研究現(xiàn)狀及分析、語篇連貫研究存在的問題、本文研究內容和研究對象、研究方法、本文結構。 第二章:語篇連貫理論。本章簡要介紹語篇連貫的主導性理論以及分析這些理論的計算機可操作性。 第三章:事件理論。本章主要從理論層面討論事件和事件鏈用于分析和判斷語篇連貫的可行性。事件在不同領域有不同的定義。我們采用哲學和語言學對事件的定義,即事件是動詞表達的概念。事件按照其動詞所具有的時間結構而產生了相應的事件結構。傳統(tǒng)的事件研究只是局限在句法的基礎上,沒有上升到篇章的層面。在此基礎上,我們認為動詞的語義輻射不僅僅局限于句子內部,它可以超越名子層面而進入語段和語篇層面。這種超越句子而進入語段和語篇層面的事件結構分析我們稱之為事件鏈,事件鏈的存在影響著語篇的連貫程度。同時,事件的良構性使得事件能夠廣泛應用于自然語言處理的各個領域,這為事件鏈用于分析篇章連貫提供了技術保障。篇章語義結構呈現(xiàn)一個層級結構:處于最上層的是宏觀語義結構,第二層是篇章的微觀語義結構,第三層是實體關系層,最底層是詞匯語義層。宏觀語義結構通過微觀語義單元一事件和事件之間的關系來表示。事件和事件關系的體現(xiàn)是建立在實體關系和詞匯語義的基礎上。事件類型按照動詞的功能分為六類:動作型事件、關系型事件、感知型事件、生理型事件、陳述型事件和存在型事件。每類事件的語義角色探討,事件與句子之間的關系,事件關系類型。本文提出的事件關系類型包括十一種關系類型:并列、順承、解說、選擇、遞進、轉折、條件、假設、因果、目的、共指。 第四章:事件鏈模型。本章主要從計算模型的角度討論事件鏈模型如何構建篇章連貫。結合漢語篇章實例,提出事件和事件鏈的描寫機制。對于事件的描寫,我們采用通常的謂詞論元結構;對于事件鏈的描寫,則主要赴描寫事件間的相互關系。 第五章:事件鏈構建。篇章中事件鏈的構建從詞匯鏈開始。構建詞匯鏈后,根據臨近原則,查找詞匯鏈上的謂詞及詡詞攜帶的論元,形成篇章基本構成單元一事件。這些事件按照一定的關系構成事件鏈。具體包括以下內容:第一節(jié)探討漢語篇章的詞匯鏈構建。第二節(jié)探討事件鏈構建,分為事件識別和事件關系識別。第三節(jié)討論事件鏈計算方法。第四節(jié)討論事件鏈評估策略。第五節(jié)總結本章內容。 第六章:事件鏈資源建設。本章分為四個小節(jié),主要討論如何從事件和事件鏈的角度來構建語篇連貫資源。具體內容為,第一節(jié)闡述建靠語篇連貫資源的目的和意義,概述了目前存在的中英文語篇連貫相關資源的特點。其中,英文語篇連貫資源包括賓州語篇樹庫(Penn Discourse Treebank)、修辭結構樹庫(Rhetorical Structure Treebank)、語篇連貫圖庫(Discourse GraphBank),中文語篇連貫資源包括中文命題庫(Chinese PropBank),中文語篇樹庫(Chinese Discourse Treebank),漢語財經評論的修辭結構標注語料庫等。這些資源建設選取篇章連貫的角度不同,其標注方法也各有千秋,為后續(xù)基于事件和事件鏈的漢語語篇連貫資源建設奠定了基礎。第二節(jié)闡述如何從事件和事件鏈的角度構建漢語語篇連貫資源,具體內容包括語料的選擇、標注標準的確定、標注質量控制、標注效率和標注平臺的搭建。我們選取賓州中文樹庫的新聞語料作為標注的對象,制定了詳細的詞匯鏈、事件、事件鏈和事件關系標注標準,并根據事件和事件鏈標注的特點搭建起標注平臺。第三節(jié)標注前期成果展示。第四節(jié)就構建基于事件和事件鏈的漢語篇章連貫資源過程中出現(xiàn)的問題進行討論。第五節(jié)歸納總結基于事件鏈的漢語篇章連貫資源建設并提出展望。 第七章:事件鏈應用。本章主要就事件鏈的應用展開討論。事件鏈可以應用在對外漢語教學和語言信息處理兩個方面。具體到章節(jié)的分配上,第一節(jié)選取漢語教學中的寫作環(huán)節(jié)來討論事件鏈的應用;第二節(jié)選取自然語言處理中的自動摘要生成來討論事件鏈的應用;第三節(jié)總結事件鏈的應用及其意義。 第八章:結論。 本文主要創(chuàng)新點在于以下四個方面: 第一,從理論研究層面來看,把語篇連貫這個傳統(tǒng)語言學中的復雜問題形式化為一個可計算的分析問題,并將之用在作文評判和句子排序中。 第二,從表示機制來看,提出基于事件鏈的表示模型,將事件鏈作為語篇連貫的必要條件,既一定程度模擬語篇的語義內容,又可確?捎嬎阈浴 第三,從分析模型看,基于事件鏈的分析模型為大規(guī)模處理漢語篇章級深層理解和信息奠定計算基礎。 第四,從資源建造來看,建設大規(guī)模的事件鏈標注資源,可用于訓練和測試,也可用于更一般的篇章語義分析任務。
[Abstract]:......
【學位授予單位】:武漢大學
【學位級別】:博士
【學位授予年份】:2013
【分類號】:H15
【參考文獻】
相關期刊論文 前10條
1 M.A.K.韓禮德;姜望琪;付毓玲;;篇章、語篇、信息——系統(tǒng)功能語言學視角[J];北京大學學報(哲學社會科學版);2011年01期
2 許余龍;;向心理論的參數(shù)化研究[J];當代語言學;2008年03期
3 黃昌寧;大規(guī)模真實文本處理的理論與方法——記第五屆國際極大規(guī)模語料庫研討會(WVLC-5)[J];當代語言學;1998年01期
4 姜吉發(fā);一種跨語句漢語事件信息抽取方法[J];計算機工程;2005年02期
5 姚雙云;胡金柱;舒江波;沈威;;篇章連貫語義關系的自動標注方法[J];計算機工程;2012年07期
6 劉德喜;姬東鴻;;基于基本要素的文摘內容連貫性評測模型[J];計算機學報;2008年04期
7 袁毓林;信息抽取的語義知識資源研究[J];中文信息學報;2002年05期
8 吳平博,陳群秀,馬亮;基于事件框架的事件相關文檔的智能檢索研究[J];中文信息學報;2003年06期
9 索紅光;劉玉樹;曹淑英;;一種基于詞匯鏈的關鍵詞抽取方法[J];中文信息學報;2006年06期
10 張鈸;;自然語言處理的計算模型[J];中文信息學報;2007年03期
相關博士學位論文 前4條
1 孫肇春;漢語事體結構[D];廣東外語外貿大學;2007年
2 樂明;漢語財經評論的修辭結構標注及篇章研究[D];中國傳媒大學;2006年
3 樊友新;從事件結構到句子結構[D];華東師范大學;2010年
4 付劍鋒;面向事件的知識處理研究[D];上海大學;2010年
相關碩士學位論文 前2條
1 丁效;句子級中文事件抽取關鍵技術研究[D];哈爾濱工業(yè)大學;2011年
2 王靜;漢語V-R動結式的事件結構理論研究[D];湖南大學;2008年
,本文編號:1597388
本文鏈接:http://www.sikaile.net/jiaoyulunwen/duiwaihanyulunwen/1597388.html