漢語文本蘊涵識別研究
發(fā)布時間:2019-08-24 07:30
【摘要】:文本蘊涵研究的主要任務是文本蘊涵識別,在自然語言處理中有很多應用。但現(xiàn)有文本蘊涵識別效果離大規(guī)模應用還有一定距離。一個重要原因是文本蘊涵及其識別涉及的語言理據(jù)和方法還有待進一步深挖或改進,這正是本文要做的主要工作。 研究內(nèi)容方面,現(xiàn)有漢語文本蘊涵理據(jù)的研究主要集中在詞語關系、句法轉換等。本研究嘗試利用語義-文本理論(Meaning-text theory)的詞匯函數(shù)完善對詞語關系的表達和分析,特別是將意象圖式作為文本蘊涵的理據(jù),用來表示文本蘊涵識別所需的語言知識信息。 文本蘊涵的識別方法方面,現(xiàn)有的句法依存分析不足以揭示文本蘊涵所需的語言信息。本研究采用概念依存分析來完善句法依存分析。但概念依存分析也無法挖掘文本蘊涵背后的所有語言理據(jù),如元語言功能、抽象概念與具體言語表達間的對應關系。詞匯函數(shù)可用來描述這些理據(jù)。 意象圖式之所以能成為文本蘊涵的理據(jù),是因為其具有理想性、規(guī)約性、可預測性。對常識加以規(guī)約化,可以提高文本蘊涵識別中語料的覆蓋率。詞匯函數(shù)和意象圖式都有規(guī)約化常識的功能,兩者在規(guī)約化常識方面具有互補性。文本蘊涵識別作為文本推理、理解的主要過程,涉及各種認知機制,如概念整合、隱喻、轉喻等。針對這些問題,不是單一分析方法就能明確所有的理據(jù),也不是單一理論就能夠解釋所有的現(xiàn)象。為此,本文采取了綜合的方法和多角度的解釋。比如,利用詞匯函數(shù)來填補基于圖式映射的概念依存分析的許多空白,除了概念整合理論外,還利用其它一些理論如默認理論、關聯(lián)理論、順應理論等來解釋漢語文本蘊涵識別中涉及的有關問題和現(xiàn)象。 全文分九章,主要內(nèi)容或觀點如下: 第一章是緒論,說明文本蘊涵的概念、選題緣由、研究現(xiàn)狀、內(nèi)容、目的和意義,并介紹本研究主要理論背景、方法和資源。 第二章對文本蘊涵的類型加以劃分和界定,并討論文本語義蘊涵識別方法及其識別過程中涉及的理據(jù)。本章主要利用框架依存分析和詞匯函數(shù)對語義蘊涵進行分析。分析結果顯示,概念依存分析可以有效識別文本語義蘊涵;概念依存分析與詞匯函數(shù)在文本蘊涵識別中具有互補性;轉喻不一定都基于意象圖式。 第三章研究文本語義預設的識別和涉及的理據(jù)。分析表明,意象圖式在文本語義預設識別中有重要作用,概念依存分析的根本理念或操作是從概念結構到具體語句間的圖式投射,而不是體現(xiàn)在對具體文本內(nèi)部語義關系的分析。 第四章研究文本規(guī)約會話含義的識別和理據(jù)并探討文本蘊涵識別中常識的規(guī)約化問題。分析表明:(1)文本規(guī)約會話含義最能體現(xiàn)各類意象圖式和概念依存分析的作用,特別是框架和框架依存分析的作用;(2)以意象圖式為理據(jù)的文本蘊涵識別過程中,基于意象圖式的壓縮有效地擴展了概念整合理論有關關鍵關系壓縮的范圍;(3)概念依存分析與概念整合間有著密切的聯(lián)系;(4)抽象、元語言性概念與具體、體驗性表達間的對應蘊涵關系的識別是對基于概念依存分析、詞語關系、句法轉換等文本蘊涵識別方法的補充。如何做好元語言性概念與體驗性表達之間的銜接是完善文本蘊涵識別的重要任務之一。 第五章討論文本結果蘊涵的識別和語言理據(jù)。分析表明,腳本在文本結果蘊涵的識別中扮演重要的角色;句法和詞語關系也能體現(xiàn)因果關系,也能成為文本結果蘊涵的理據(jù)。 第六章基于前面的研究和對語料的梳理,初步討論面向自然語言處理的漢語文本蘊涵識別有關資源建設問題。不同資源的構建必須考慮語言作為一個整體系統(tǒng)的特點。所有資源的構建,其目標是一致的:為自然語言處理領域的漢語文本蘊涵識別服務。這就要求不同資源的構建,對語料的覆蓋上既要做到全面,又要避免過多交叉,達到合適的離散性。另外,不同資料間盡量避免沖突,如果無法避免沖突,也需提供解決沖突的機制。由于構建的資源是面向自然語言處理的,因而所有意象圖式庫必須是機器可讀的,這就需要計算機專家和人才的參與。 第七章是本研究應用舉例。漢語文本蘊涵識別研究的應用,既有比前面文本蘊涵識別研究簡單的地方,也有復雜的地方。本章絕大部分的例子都取白漢語水平考試試題,同時體現(xiàn)了本研究在白然語言處理領域漢語文本蘊涵識別和漢語作為外語教學中潛在的應用價值。 第八章討論本研究中遇到一些重要問題。包括:文本蘊涵識別的難度、概率、文本語義預設的可取消性和投射性、文本蘊涵識別涉及的隱喻和轉喻等。 第九章是結論,對本研究加以總結并指出下一步可能要進行的工作。
【學位授予單位】:武漢大學
【學位級別】:博士
【學位授予年份】:2013
【分類號】:H136;H15
本文編號:2528798
【學位授予單位】:武漢大學
【學位級別】:博士
【學位授予年份】:2013
【分類號】:H136;H15
【參考文獻】
相關期刊論文 前10條
1 宣恒大;;論漢語的具象性[J];合肥師范學院學報;2008年04期
2 李雯婧;;預設研究綜述[J];安徽文學(下半月);2008年03期
3 張利明;;關于預設和蘊涵[J];安徽文學(下半月);2008年03期
4 蕭國政;姬東鴻;肖珊;;Ontology的類型及漢語詞網(wǎng)的Ontology結構[J];長江學術;2011年02期
5 蘇蘭姣;;預設研究綜述[J];重慶工學院學報(社會科學版);2008年09期
6 邱廣君,張俐,王寶庫,朱靖波,邱波;漢語信息處理中的語義關系類型分析[J];東北大學學報;1998年01期
7 陶明忠;馬玉蕾;;框架語義學——格語法的第三階段[J];當代語言學;2008年01期
8 朱德熙;;自指和轉指——漢語名詞化標記“的、者、所、之”的語法功能和語義功能[J];方言;1983年01期
9 李繼先;;形容詞性短語在廣義因果關系句中之特殊語用規(guī)則[J];甘肅社會科學;2009年05期
10 姜望琪;;關于會話含義的再思考——兼答王曉軍先生[J];外國語言文學;2012年02期
相關博士學位論文 前1條
1 馮文賀;漢語連詞及其相關結構的依存分析[D];武漢大學;2011年
,本文編號:2528798
本文鏈接:http://www.sikaile.net/wenyilunwen/yuyanxuelw/2528798.html