天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 軟件論文 >

漢語篇章微觀話題結構建模與語料庫構建

發(fā)布時間:2018-02-16 20:46

  本文關鍵詞: 篇章話題結構 主位-述位理論 主位推進 話題鏈 語料庫構建 出處:《計算機研究與發(fā)展》2017年08期  論文類型:期刊論文


【摘要】:篇章話題結構分析是自然語言理解的前沿基礎,而大規(guī)模高質量的適用于漢語篇章分析的語料資源缺乏,嚴重制約了相關篇章話題計算模型的研究.針對上述問題,首先研究了漢語篇章話題結構的理論表示體系.分析了主述位理論、英語修辭結構理論和賓州篇章樹庫體系的優(yōu)勢,結合漢語復句句群理論以及漢語自身特點,提出了一種基于主述位理論的漢語篇章微觀話題結構表示方式,并借助微觀話題鏈構建了漢語篇章話題結構表示體系.隨后,在此基礎上,采用自頂向下、后向搜索的標注策略和人機結合的語料庫標注方式,構建了基于篇章微觀話題表示體系的漢語篇章話題結構語料庫(Chinese discourse topic corpus,CDTC).CDTC共包含500個文檔,對其進行了詳細統計分析并展示了語料庫的標注情況.與賓州篇章樹庫體系、廣義話題結構理論的對比表明,所提篇章微觀話題結構表示體系在理論上具有一定的優(yōu)越性,并且符合漢語特點;一致性檢驗表明CDTC能夠充分體現漢語篇章話題分析問題本身的難度,并能夠為相關研究提供語料資源支持.
[Abstract]:Discourse topic structure analysis is the front line of natural language understanding. However, the lack of large scale and high quality corpus resources for Chinese text analysis seriously restricts the research of relevant discourse topic computing models. Firstly, this paper studies the theoretical representation system of Chinese discourse topic structure, analyzes the advantages of subject and rheme theory, English rhetoric structure theory and Pennsylvania text tree library system, and combines the theory of sentence group of Chinese complex sentences and the characteristics of Chinese itself. In this paper, we propose a topic structure representation method of Chinese text based on thematic and rheme theory, and construct a Chinese discourse topic structure representation system with the help of micro topic chain. Then, on this basis, we adopt the top-down approach. The tagging strategy of backward search and the corpora tagging method of human-computer combination are used to construct a corpus of Chinese discourse topic Corpus CDTCf.CDTC containing 500 documents, which is based on the text micro-topic representation system. Compared with the Pennsylvania text tree system and the generalized topic structure theory, the proposed text micro-topic structure representation system has some advantages in theory. The consistency test shows that CDTC can fully reflect the difficulty of the topic analysis of Chinese text, and can provide corpus-based support for related research.
【作者單位】: 蘇州大學計算機科學與技術學院;蘇州科技大學計算機科學與工程系;蘇州市虛擬現實智能交互及應用技術重點實驗室;
【基金】:國家自然科學基金項目(61331011,61673290,61472264)~~
【分類號】:TP391.1

【參考文獻】

相關期刊論文 前8條

1 宋洋;王厚峰;;基于馬爾可夫邏輯的中文零指代消解[J];計算機研究與發(fā)展;2015年09期

2 尚英;宋柔;盧達威;;廣義話題結構理論視角下話題自足句成句性研究[J];中文信息學報;2014年06期

3 周強;周驍聰;;基于話題鏈的漢語語篇連貫性描述體系[J];中文信息學報;2014年05期

4 張牧宇;宋原;秦兵;劉挺;;中文篇章級句間語義關系識別[J];中文信息學報;2013年06期

5 宋柔;;漢語篇章廣義話題結構的流水模型[J];中國語文;2013年06期

6 蔣玉茹;宋柔;;基于廣義話題理論的話題句識別[J];中文信息學報;2012年05期

7 張牧宇;黎耀炳;秦兵;劉挺;;基于中心語匹配的共指消解[J];中文信息學報;2011年03期

8 樂明;;漢語篇章修辭結構的標注研究[J];中文信息學報;2008年04期

相關博士學位論文 前1條

1 李艷翠;漢語篇章結構表示體系及資源構建研究[D];蘇州大學;2015年

【共引文獻】

相關期刊論文 前10條

1 奚雪峰;褚曉敏;孫慶英;周國棟;;漢語篇章微觀話題結構建模與語料庫構建[J];計算機研究與發(fā)展;2017年08期

2 馮文賀;李艷翠;任函;周國棟;;漢英篇章結構平行語料庫的對齊標注評估[J];中文信息學報;2017年03期

3 樂耀;;互動語言學研究的重要課題——會話交際的基本單位[J];當代語言學;2017年02期

4 宋柔;葛詩利;尚英;盧達威;;面向文本信息處理的漢語句子和小句[J];中文信息學報;2017年02期

5 唐文武;過弋;徐永斌;方旭;;基于條件隨機場的評價對象缺省項識別[J];中文信息學報;2016年06期

6 馬文津;施春宏;;基于整句—零句表達系統的漢語中介語篇章現象考察——以日語母語者漢語語篇為例[J];世界漢語教學;2016年04期

7 褚曉敏;朱巧明;周國棟;;自然語言處理中的篇章主次關系研究[J];計算機學報;2017年04期

8 谷晶晶;周國棟;;漢語冒號標注與自動識別方法研究[J];中文信息學報;2016年03期

9 李元瑞;;現代漢語零形主語小句研究綜述[J];現代語文(語言研究版);2016年02期

10 穆從軍;;修辭結構理論視角下英漢學術論文摘要的修辭關系對比研究[J];現代外語;2016年01期

【二級參考文獻】

相關期刊論文 前10條

1 張牧宇;秦兵;劉挺;;中文篇章級句間語義關系體系及標注[J];中文信息學報;2014年02期

2 尚英;宋柔;;基于廣義話題結構語料庫的語體對比研究——以報告體與小說體為例[J];計算機工程與應用;2014年11期

3 宋柔;;漢語篇章廣義話題結構的流水模型[J];中國語文;2013年06期

4 孫坤;;話題鏈視角下的漢英篇章組織模式對比研究[J];解放軍外國語學院學報;2013年03期

5 蔣玉茹;宋柔;;基于廣義話題理論的話題句識別[J];中文信息學報;2012年05期

6 沈家煊;;“零句”和“流水句”——為趙元任先生誕辰120周年而作[J];中國語文;2012年05期

7 黃嫻;張克亮;;漢語零形回指研究綜述[J];中文信息學報;2009年04期

8 郎君;忻舟;秦兵;劉挺;李生;;集成多種背景語義知識的共指消解[J];中文信息學報;2009年03期

9 樂明;;漢語篇章修辭結構的標注研究[J];中文信息學報;2008年04期

10 方梅;;由背景化觸發(fā)的兩種句法結構——主語零形反指和描寫性關系從句[J];中國語文;2008年04期

相關博士學位論文 前4條

1 徐凡;英文篇章結構分析關鍵問題研究[D];蘇州大學;2013年

2 陳莉萍;英漢語篇結構標注理論與實踐[D];上海外國語大學;2007年

3 樂明;漢語財經評論的修辭結構標注及篇章研究[D];中國傳媒大學;2006年

4 姚雙云;復句關系標記的搭配研究與相關解釋[D];華中師范大學;2006年

【相似文獻】

相關期刊論文 前5條

1 崔耀,,陳永明;一個實驗性的漢語篇章理解系統[J];中文信息學報;1994年03期

2 徐凡;朱巧明;周國棟;王明文;;銜接性驅動的篇章一致性建模研究[J];中文信息學報;2014年03期

3 王建波,唐正偉,杜春玲,王開鑄;篇章物理結構與意義結構的一種形式化表達方法[J];情報學報;1996年04期

4 周小佩;洪宇;車婷婷;姚建民;朱巧明;;基于平行論元的隱式篇章關系推理研究[J];計算機應用與軟件;2012年09期

5 ;[J];;年期

相關博士學位論文 前1條

1 張水云;語篇理解中核心概念的建構與整合及教學應用研究[D];西北師范大學;2009年

相關碩士學位論文 前10條

1 楊雪蓉;面向事件關系檢測的特征分析與場景推理方法研究[D];蘇州大學;2015年

2 嚴為絨;基于框架語義的隱式篇章關系推理方法研究[D];蘇州大學;2015年

3 陳夢婷;編碼與提取對二語篇章理解的影響研究[D];江南大學;2016年

4 逯紅梅;篇章理解的認知研究[D];吉林大學;2007年

5 楊寧;中德報刊評論的篇章理解對比研究[D];大連外國語學院;2012年

6 張美榮;英語篇章理解的認知研究[D];長春理工大學;2009年

7 康秀麗;中國德語教學中的篇章理解[D];上海外國語大學;2010年

8 張知博;認知框架下的篇章連貫[D];黑龍江大學;2006年

9 朱鑫;輸入模態(tài)、頻次對二語篇章理解的影響[D];江南大學;2013年

10 車婷婷;基于論元概念與焦點的隱式篇章關系檢測方法研究[D];蘇州大學;2014年



本文編號:1516401

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/1516401.html


Copyright(c)文論論文網All Rights Reserved | 網站地圖 |

版權申明:資料由用戶3fb24***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com