面向新聞文本的基于深度學習的事件線抽取
發(fā)布時間:2021-03-17 08:15
隨著互聯(lián)網(wǎng)的快速發(fā)展,在線的新聞媒體站點源源不斷地產(chǎn)生和傳播每天發(fā)生的各種各樣的事件。面對如此龐大的信息量,不借助自動化工作,公眾很難有效地從中獲取自己想要的信息。事件線抽。⊿toryline Extraction),旨在從海量的新聞文本中自動地抽取和總結(jié)熱點事件,并以結(jié)構(gòu)化的方式跟蹤和揭示事件是如何隨著時間發(fā)展。很顯然,事件線的抽取將有助于讀者面對海量的新聞文本,清晰把握,了解當前發(fā)生的主要事件的發(fā)展脈絡。因此,具有十分重要的現(xiàn)實意義和應用價值。目前已有若干面向新聞文本的事件線抽取方法被提出,其中大多數(shù)方法基于貝葉斯概率圖模型,采用無監(jiān)督的方式。相比于有監(jiān)督方法,無監(jiān)督更貼近人類學習的方式,無需進行數(shù)據(jù)標注,更加穩(wěn)定與通用,因此廣受研究人員的關(guān)注。但是,概率圖模型一類的方法通常存在模型結(jié)構(gòu)復雜,運算耗時等問題。考慮到深度學習在自然語言處理領(lǐng)域的廣泛應用,相比較于傳統(tǒng)方法,深度學習能夠自動學到海量數(shù)據(jù)中隱含的語義信息并完成特征抽取,具備挖掘深層次特征的能力,因此已經(jīng)在多個自然語言處理的任務當中取得了顯著的表現(xiàn)。因此,本文針對面向新聞文本的基于深度學習的事件線抽取方法進行研究,結(jié)合深度...
【文章來源】:東南大學江蘇省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:69 頁
【學位級別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 研究背景與意義
1.2 相關(guān)工作研究現(xiàn)狀
1.2.1 主題檢測與跟蹤
1.2.2 事件線抽取的研究現(xiàn)狀
1.3 本文研究動機
1.3.1 現(xiàn)有方法的局限性
1.3.2 基于深度學習的事件線抽取面臨困難與挑戰(zhàn)
1.4 論文研究目標與內(nèi)容
1.5 本文組織架構(gòu)
第二章 理論知識及相關(guān)技術(shù)
2.1 問題定義
2.2 理論知識
2.2.1 多層感知機
2.2.2 激活函數(shù)
2.2.3 自編碼器
2.2.4 損失函數(shù)
2.2.5 詞嵌入向量
2.3 動態(tài)事件線抽取模型
第三章 基于NSEM模型的新聞文本事件線抽取
3.1 研究動機
3.2 NSEM模型
3.2.1 相似性假設(shè)
3.2.2 模型結(jié)構(gòu)
3.2.3 事件線構(gòu)造
3.2.4 訓練
3.2.5 后處理
3.3 實驗結(jié)果
3.3.1 實驗設(shè)置
3.3.2 結(jié)果分析
3.3.3 事件線數(shù)目S的影響
3.3.4 時間復雜度
3.3.5 結(jié)構(gòu)化展示
3.3.6 事件線分布的可視化
3.4 本章小結(jié)
第四章 基于DESEM模型的新聞文本事件線抽取
4.1 研究動機
4.2 DESEM模型
4.2.1 隱事件映射
4.2.2 事件線分布學習
4.2.3 事件線構(gòu)造
4.2.4 訓練
4.2.5 優(yōu)化
4.3 實驗結(jié)果
4.3.1 實驗設(shè)置
4.3.2 評估準則
4.3.3 實驗結(jié)果
4.3.4 消融研究
4.3.5 事件表示的可視化
4.4 本章小結(jié)
第五章 結(jié)束語
5.1 工作總結(jié)
5.2 未來展望
致謝
參考文獻
作者簡介
【參考文獻】:
期刊論文
[1]開放式文本信息抽取[J]. 趙軍,劉康,周光有,蔡黎. 中文信息學報. 2011(06)
碩士論文
[1]基于新聞文本的事件線抽取[D]. 徐海洋.東南大學 2017
本文編號:3086843
【文章來源】:東南大學江蘇省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:69 頁
【學位級別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 研究背景與意義
1.2 相關(guān)工作研究現(xiàn)狀
1.2.1 主題檢測與跟蹤
1.2.2 事件線抽取的研究現(xiàn)狀
1.3 本文研究動機
1.3.1 現(xiàn)有方法的局限性
1.3.2 基于深度學習的事件線抽取面臨困難與挑戰(zhàn)
1.4 論文研究目標與內(nèi)容
1.5 本文組織架構(gòu)
第二章 理論知識及相關(guān)技術(shù)
2.1 問題定義
2.2 理論知識
2.2.1 多層感知機
2.2.2 激活函數(shù)
2.2.3 自編碼器
2.2.4 損失函數(shù)
2.2.5 詞嵌入向量
2.3 動態(tài)事件線抽取模型
第三章 基于NSEM模型的新聞文本事件線抽取
3.1 研究動機
3.2 NSEM模型
3.2.1 相似性假設(shè)
3.2.2 模型結(jié)構(gòu)
3.2.3 事件線構(gòu)造
3.2.4 訓練
3.2.5 后處理
3.3 實驗結(jié)果
3.3.1 實驗設(shè)置
3.3.2 結(jié)果分析
3.3.3 事件線數(shù)目S的影響
3.3.4 時間復雜度
3.3.5 結(jié)構(gòu)化展示
3.3.6 事件線分布的可視化
3.4 本章小結(jié)
第四章 基于DESEM模型的新聞文本事件線抽取
4.1 研究動機
4.2 DESEM模型
4.2.1 隱事件映射
4.2.2 事件線分布學習
4.2.3 事件線構(gòu)造
4.2.4 訓練
4.2.5 優(yōu)化
4.3 實驗結(jié)果
4.3.1 實驗設(shè)置
4.3.2 評估準則
4.3.3 實驗結(jié)果
4.3.4 消融研究
4.3.5 事件表示的可視化
4.4 本章小結(jié)
第五章 結(jié)束語
5.1 工作總結(jié)
5.2 未來展望
致謝
參考文獻
作者簡介
【參考文獻】:
期刊論文
[1]開放式文本信息抽取[J]. 趙軍,劉康,周光有,蔡黎. 中文信息學報. 2011(06)
碩士論文
[1]基于新聞文本的事件線抽取[D]. 徐海洋.東南大學 2017
本文編號:3086843
本文鏈接:http://www.sikaile.net/kejilunwen/shengwushengchang/3086843.html
最近更新
教材專著