因果關(guān)系知識庫的研究與構(gòu)建
本文關(guān)鍵詞:因果關(guān)系知識庫的研究與構(gòu)建,,由筆耕文化傳播整理發(fā)布。
【摘要】:互聯(lián)網(wǎng)技術(shù)突飛猛進的發(fā)展,不斷地推動著人類思維方式的變革;數(shù)據(jù)的爆炸式增長,不斷地改變著二進制世界的格局,F(xiàn)今數(shù)據(jù)信息的如此高速膨脹,已使我們進入了大數(shù)據(jù)時代,數(shù)據(jù)信息已成為各行各業(yè)掌握行業(yè)命脈的要點,因此由數(shù)據(jù)驅(qū)動的信息技術(shù)革命正以前所未有的方式顛覆著人類的生活。數(shù)據(jù)和信息之間是相互聯(lián)系的,數(shù)據(jù)經(jīng)過挖掘、加工處理之后,就能成為人們所需要的信息。大數(shù)據(jù)時代,數(shù)據(jù)中蘊藏著巨大的價值,從海量數(shù)據(jù)中提取有用信息,識別其中蘊藏的模式、規(guī)律和相關(guān)關(guān)系,是人類認識世界的新方式。社會化媒體上人們?nèi)粘P袨楹颓楦械年愂鲋刑N藏著大量的生活經(jīng)驗總結(jié),其中包括大量的常識性因果關(guān)系。大數(shù)據(jù)背景下,根據(jù)已有經(jīng)驗知識從文本數(shù)據(jù)中識別事物間的因果聯(lián)系,歸納出事物間固有的因果關(guān)系,構(gòu)建成因果關(guān)系知識庫(因果關(guān)系網(wǎng))。將人們生活中依靠常識性思維判斷的知識被計算機系統(tǒng)的預(yù)測功能所取代,甚至推理出由人類思維所無法達到的深層因果關(guān)系,使人們進一步明確事物間的引起與被引起作用,有利把控事物間的不利影響。本文提出了句內(nèi)因果關(guān)系的提取方法,在漢語言文學(xué)知識的基礎(chǔ)上,利用因果關(guān)系提示詞識別含有顯示因果關(guān)系的因果句;根據(jù)漢語語法結(jié)構(gòu)和句法依存關(guān)系歸納出相應(yīng)的句法模式匹配規(guī)則,進行因果關(guān)系實體對的識別;同時根據(jù)句內(nèi)包含的程度副詞、情感詞、否定詞和句法模式規(guī)則確定實體間的因果強度;根據(jù)詞語語義相似性,對因果關(guān)系實體對進行語義相似性融合,形成因果關(guān)系實體集合對;同時計算因果實體對的共現(xiàn)頻率得到因果關(guān)系支持度;形成事物間因果關(guān)系的知識庫。針對文本中因果關(guān)系的提取,本論文提出如下創(chuàng)新:(1)提取句中的情感詞、級性詞、否定詞,分析何種程度的原因部分對結(jié)果部分造成多大的影響,即計算因果關(guān)系強度;(2)通過計算因果關(guān)系實體對在數(shù)據(jù)源中的共現(xiàn)頻率,計算因果關(guān)系支持度;(3)將因果關(guān)系實體對基于語義相似性進行聚類操作,將因果關(guān)系數(shù)據(jù)轉(zhuǎn)化為因果知識。
【關(guān)鍵詞】:因果關(guān)系 因果強度 數(shù)據(jù)挖掘 樸素貝葉斯 知識庫
【學(xué)位授予單位】:吉林大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:TP391.1
【目錄】:
- 摘要4-6
- Abstract6-11
- 第1章 緒論11-16
- 1.1 研究背景與意義11-12
- 1.2 相關(guān)研究現(xiàn)狀12-13
- 1.3 主要研究內(nèi)容13-14
- 1.4 論文結(jié)構(gòu)14-15
- 1.5 本章小結(jié)15-16
- 第2章 相關(guān)技術(shù)概述16-25
- 2.1 關(guān)聯(lián)和相關(guān)性分析16-18
- 2.1.1 關(guān)聯(lián)規(guī)則16-17
- 2.1.2 挖掘頻繁項集17
- 2.1.3 關(guān)聯(lián)規(guī)則模式評估方法17-18
- 2.2 詞語相似度18-24
- 2.2.1 基于語義的詞語相似性計算19-21
- 2.2.2 基于統(tǒng)計的詞語相似性計算21-24
- 2.3 本章小結(jié)24-25
- 第3章 因果關(guān)系識別25-36
- 3.1 顯式因果關(guān)系25-28
- 3.1.1 因果關(guān)系表示形式25-26
- 3.1.2 漢語中的因果關(guān)系詞26-27
- 3.1.3 因果關(guān)系表達結(jié)構(gòu)分析27-28
- 3.2 文本中因果關(guān)系模式歸納28-34
- 3.2.1 連詞對應(yīng)的句法模式28-30
- 3.2.2 動詞對應(yīng)的句法模式30-32
- 3.2.3 介詞對應(yīng)的句法模式32
- 3.2.4 副詞對應(yīng)的句法模式32-33
- 3.2.5 明確因果與模糊因果分類33-34
- 3.3 隱式因果關(guān)系34-35
- 3.4 本章小結(jié)35-36
- 第4章 因果關(guān)系知識庫的構(gòu)建36-50
- 4.1 因果關(guān)系分類36-37
- 4.2 顯式因果關(guān)系抽取37-46
- 4.2.1 因果關(guān)系抽取框架37
- 4.2.2 文本數(shù)據(jù)預(yù)處理37-40
- 4.2.3 因果關(guān)系實體對抽取40-44
- 4.2.4 因果關(guān)系支持度研究44-46
- 4.3 因果關(guān)系知識庫構(gòu)建46-49
- 4.4 本章小結(jié)49-50
- 第5章 實驗與總結(jié)50-55
- 5.1 實驗50-53
- 5.1.1 實驗背景50-51
- 5.1.2 因果句法模式實驗分析51
- 5.1.3 因果關(guān)系提取實驗分析51-52
- 5.1.4 因果關(guān)系知識庫分析52-53
- 5.2 總結(jié)與展望53-55
- 5.2.1 深層因果關(guān)系的識別53
- 5.2.2 模糊因果關(guān)系的判定及隱式因果關(guān)系的識別53
- 5.2.3 因果關(guān)系實體對的識別53-54
- 5.2.4 因果關(guān)系評價策略54-55
- 參考文獻55-57
- 致謝57
【參考文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 趙森棟;劉挺;;因果關(guān)系及其在社會媒體上的應(yīng)用研究綜述[J];軟件學(xué)報;2014年12期
2 詹志建;梁麗娜;楊小平;;基于百度百科的詞語相似度計算[J];計算機科學(xué);2013年06期
3 田久樂;趙蔚;;基于同義詞詞林的詞語相似度計算方法[J];吉林大學(xué)學(xué)報(信息科學(xué)版);2010年06期
4 崔陽;楊炳儒;;知識發(fā)現(xiàn)中的因果關(guān)聯(lián)規(guī)則挖掘研究[J];計算機工程與應(yīng)用;2009年31期
5 儲澤祥;陶伏平;;漢語因果復(fù)句的關(guān)聯(lián)標(biāo)記模式與“聯(lián)系項居中原則”[J];中國語文;2008年05期
6 許文勝;張柏然;;基于英漢名著語料庫的因果關(guān)系連詞對比研究[J];外語教學(xué)與研究;2006年04期
7 彭湃;現(xiàn)代漢語因果關(guān)系連接成分研究綜述[J];漢語學(xué)習(xí);2004年02期
8 王鏘,石純一;一種因果推理形式[J];軟件學(xué)報;1997年04期
9 張學(xué)成;論復(fù)句語義的三種關(guān)系[J];杭州師范學(xué)院學(xué)報;1992年04期
10 王維賢;;句法分析的三個平面與深層結(jié)構(gòu)[J];語文研究;1991年04期
中國博士學(xué)位論文全文數(shù)據(jù)庫 前1條
1 裘江南;漢語文本中突發(fā)事件因果關(guān)系抽取方法研究[D];大連理工大學(xué);2012年
本文關(guān)鍵詞:因果關(guān)系知識庫的研究與構(gòu)建,由筆耕文化傳播整理發(fā)布。
本文編號:298545
本文鏈接:http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/298545.html