天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 文藝論文 > 漢語言論文 >

漢語文本中突發(fā)事件因果關(guān)系抽取方法研究

發(fā)布時間:2018-03-22 22:34

  本文選題:因果關(guān)系 切入點:突發(fā)事件 出處:《大連理工大學》2012年博士論文 論文類型:學位論文


【摘要】:突發(fā)事件作為一個復雜系統(tǒng),對其定性建模首先要分析內(nèi)部各要素之間的因果關(guān)系,這是建立其他突發(fā)事件預測和仿真模型的基礎。然而,基于專家知識的方法中因果關(guān)系的獲取采用向領域?qū)<野l(fā)放問卷和訪談的方法,存在耗時、耗力和操作性差等局限性。而基于數(shù)據(jù)的方法需要依賴于一定規(guī)模的和完備的數(shù)據(jù)樣本,而應急領域許多突發(fā)事件的數(shù)據(jù)往往存在沒有系統(tǒng)積累、缺乏完整性和連續(xù)性等問題。 但伴隨著我國各級政府應急管理機制建設和學術(shù)研究的不斷深入,形成了海量的有關(guān)突發(fā)事件的文本資源。這些文本資源中蘊含了大量有關(guān)突發(fā)事件演化規(guī)律的定性知識,特別是能反映各類突發(fā)事件系統(tǒng)中要素間的因果關(guān)系,這就是本文所指突發(fā)事件因果關(guān)系。這些文本可代替專家和數(shù)據(jù)成為突發(fā)事件因果關(guān)系的來源。因此,如何從應急領域文本中抽取突發(fā)事件內(nèi)部要素間的因果關(guān)系,并建立突發(fā)事件因果關(guān)系模型是需要亟待解決的科學問題。針對漢語文本中因果關(guān)系抽取方法在國內(nèi)外未進行系統(tǒng)研究和缺乏有效的抽取于文本的因果關(guān)系的集成方法的問題。本文利用突發(fā)事件應急管理中積累的文本知識源,圍繞應急領域漢語文本中突發(fā)事件因果關(guān)系抽取方法這一核心科學問題探索基于多文本因果關(guān)系抽取的突發(fā)事件因果關(guān)系集成方法。本文針對上述問題進行下列研究工作: (1)突發(fā)事件因果關(guān)系模型研究。首先通過對突發(fā)事件系統(tǒng)共性要素的分析,明確了突發(fā)事件共性特征。然后,采用系統(tǒng)工程方法構(gòu)建了突發(fā)事件的因果關(guān)系模型,進而對其因果關(guān)系進行了分析。以突發(fā)事件的輸入、狀態(tài)和輸出要素集為基礎,建立了可擴展的突發(fā)事件因果關(guān)系模型,明確了突發(fā)事件內(nèi)部要素間的因果結(jié)構(gòu),為從文本中抽取的突發(fā)事件因果關(guān)系提供表示模型。 (2)漢語文本中因果句法模式的歸納與顯式因果關(guān)系抽取方法研究。應急領域文本中顯式因果關(guān)系是突發(fā)事件因果關(guān)系的重要來源,針對漢語文本中因果關(guān)系抽取方法在國內(nèi)外未進行系統(tǒng)研究的問題。首先,將漢語文本中的顯式因果句區(qū)分為明確因果句和模糊因果句,基于漢語語法對漢語中的顯式因果句歸納出的五種因果句法模式,進而提出因果句抽取匹配規(guī)則和因果句法模式匹配方法。然后,研究了基于樸素貝葉斯方法的模糊因果句分類模型。最后,針對分類后的因果句提出因果關(guān)系抽取方法,通過實驗取得了較好的效果。其創(chuàng)新點在于歸納出漢語文本中的五種顯式因果句法模式,系統(tǒng)揭示了漢語文本中因果句的基本表達方式,對計算機輔助漢語文本中因果關(guān)系抽取理論的進一步完善。提出的區(qū)分模糊因果句和明確因果句的基于因果句法模式的顯式因果關(guān)系抽取方法,解決了當前文本中因果關(guān)系抽方法中不區(qū)分模糊因果句的局限性。 (3)漢語文本中的隱式因果關(guān)系抽取方法研究。漢語文本中的隱式因果關(guān)系也是應急領域文本中突發(fā)事件因果關(guān)系的重要來源之一。通過對應急領域漢語文本的隱式因果關(guān)系特征分析的基礎上,基于概念實體研究文本中隱式因果關(guān)系的抽取方法。首先,對預處理后的句子中的概念生成其頻繁概念集,進而對概念頻繁集進行因果性分析,最后對因果成分進行判別。其創(chuàng)新點在于將哲學和概率統(tǒng)計學中的因果理論與語言學結(jié)合的方法,基于Hume和Suppes等的因果關(guān)系理論對關(guān)聯(lián)分析方法中的置信度計算方法進行了改進,從時間優(yōu)先、因果性概率和因果性依賴等方面綜合考慮設計了因果性評價函數(shù)和因果成分的判別方法,解決了關(guān)聯(lián)分析方法不能完全適用于文本因果關(guān)系的挖掘的問題,為文本中隱式因果關(guān)系的抽取提供了一種基于因果關(guān)系理論的新方法。 (4)多文本中冗余、沖突和稀疏的突發(fā)事件因果關(guān)系的集成方法研究。針對從應急領域文本抽取的因果關(guān)系具有冗余、沖突和稀疏的特點,以及獨立因果關(guān)系無法形成對突發(fā)事件整體認知的問題。研究多個文本在個體層面的因果認知融合為反映突發(fā)事件全局因果認知的集成方法。首先研究基于向量空間模型的領域文本篩選方法,然后基于D—S證據(jù)理論并兼顧文本的領域特點對來自多文本的因果關(guān)系的集成方法進行了研究。其創(chuàng)新點在于提出了基于D—S證據(jù)理論和兼顧領域文本質(zhì)量的多文本因果關(guān)系集成方法,消解了多文本因果關(guān)系中的稀疏、冗余和沖突問題,克服單文本對突發(fā)事件的描述存在偏差與不足,使基于文本中抽取的因果關(guān)系建立的突發(fā)事件因果關(guān)系模型能真實全面的反映突發(fā)事件的內(nèi)部要素間的因果關(guān)系。為突發(fā)事件貝葉斯網(wǎng)絡結(jié)構(gòu)的生成提供了一種基于文本挖掘的新方法。一方面通過消解沖突和冗余信息達成突發(fā)事件中因果關(guān)系認識的一致,另一方面通過利用互補信息實現(xiàn)突發(fā)事件因果關(guān)系的完整認識。
[Abstract]:紿佸彂浜嬩歡浣滀負涓,

本文編號:1650740

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/wenyilunwen/hanyulw/1650740.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶17879***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com