基于深度學習的語義推理技術
發(fā)布時間:2020-12-17 16:25
語義推理技術是自然語言處理中的一項基礎而重要的技術,能夠幫助我們更好地理解文章的內容及上下文的語義推理關系。語義推理一般分為論據和論點兩部分,論據是從文章內容中提取的支撐文章論點的材料,是用來證明論點的理由和根據;論點是對所論述的論據的正確理解,是對文章中所提出的某一個主要的思想觀點的概括。語義推理技術是判斷論點和論據之間的語義信息是否存在蘊含關系。提高語義推理的準確率有助于增強人工智能對自然語言的理解能力。在自然語言發(fā)展的初期,人們通常使用詞典、語法樹或邏輯表達式的方式獲取文本之間的淺在的語義推理關系。隨著神經網絡在自然語言處理上的應用以及注意力機制和遷移學習的快速發(fā)展,人們開始側重于挖掘文本之間更深層的語義推理關系。并且希望通過相似任務之間的知識共享,從而加快并優(yōu)化模型的學習效率。在此基礎上,本文主要從以下三個方面進行語義推理技術的研究:1.基于長短期記憶網絡的語義推理技術。主要使用長短期記憶網絡對論點和論據進行語義向量編碼,使用雙線性或者全連接計算論點和論據的語義推理關系。2.基于長短期網絡和注意力機制的語義推理技術。首先使用長短期記憶網絡對論點和論據進行語義向量編碼。之后使用注...
【文章來源】:哈爾濱工業(yè)大學黑龍江省 211工程院校 985工程院校
【文章頁數】:71 頁
【學位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第1章 緒論
1.1 課題研究的背景和意義
1.2 國內外研究現(xiàn)狀
1.2.1 基于特征工程的國內外研究現(xiàn)狀
1.2.2 基于深度學習的國內外研究現(xiàn)狀
1.2.3 基于遷移學習的國內外研究現(xiàn)狀
1.3 實驗數據簡介
1.3.2 數據集簡介
1.3.3 評價標準
1.3.4 系統(tǒng)基線選擇
1.4 本文的主要研究內容
1.4.1 問題定義
1.4.2 本文主要研究思路
1.5 本文的內容安排
第2章 基于長短期記憶網絡的語義推理技術
2.1 引言
2.2 語義向量表示模型
2.2.1 循環(huán)神經網絡
2.2.2 長短期記憶神經網絡
2.2.3 基于長短期記憶神經網絡的語義表示模型
2.3 語義推理關系模型
2.3.3 基于全連接的語義推理模型
2.3.4 基于雙線性的語義推理模型
2.4 實驗結果與分析
2.4.1 數據預處理
2.4.2 損失函數
2.4.3 模型優(yōu)化及參數設置
2.4.4 模型實驗結果與分析
2.5 本章小結
第3章 基于注意力機制的語義推理技術
3.1 引言
3.2 基于注意力機制的語義推理模型
3.2.1 注意力機制
3.2.2 基于序列注意力機制的語義推理模型
3.2.3 基于逐字注意力機制的語義推理模型
3.2.4 基于自身注意力機制的語義推理模型
3.3 實驗結果與分析
3.4 本章小結
第4章 基于遷移學習與模型融合的語義推理技術
4.1 引言
4.2 基于殘差的語義推理網絡
4.2.1 殘差網絡相關技術
4.2.2 融合殘差網絡語義推理模型
4.3 基于遷移學習的語義推理網絡
4.3.1 遷移學習相關技術
4.3.2 融合遷移學習的語義推理模型
4.4 基于集成的語義推理網絡
4.4.1 特征工程
4.4.3 集成的語義推理模型
4.5 實驗結果與分析
4.5.1 模型實驗結果與分析
4.5.2 遷移學習實驗分析
4.6 本章小結
結論
參考文獻
攻讀博士學位期間發(fā)表的論文及其它成果
致謝
本文編號:2922335
【文章來源】:哈爾濱工業(yè)大學黑龍江省 211工程院校 985工程院校
【文章頁數】:71 頁
【學位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第1章 緒論
1.1 課題研究的背景和意義
1.2 國內外研究現(xiàn)狀
1.2.1 基于特征工程的國內外研究現(xiàn)狀
1.2.2 基于深度學習的國內外研究現(xiàn)狀
1.2.3 基于遷移學習的國內外研究現(xiàn)狀
1.3 實驗數據簡介
1.3.2 數據集簡介
1.3.3 評價標準
1.3.4 系統(tǒng)基線選擇
1.4 本文的主要研究內容
1.4.1 問題定義
1.4.2 本文主要研究思路
1.5 本文的內容安排
第2章 基于長短期記憶網絡的語義推理技術
2.1 引言
2.2 語義向量表示模型
2.2.1 循環(huán)神經網絡
2.2.2 長短期記憶神經網絡
2.2.3 基于長短期記憶神經網絡的語義表示模型
2.3 語義推理關系模型
2.3.3 基于全連接的語義推理模型
2.3.4 基于雙線性的語義推理模型
2.4 實驗結果與分析
2.4.1 數據預處理
2.4.2 損失函數
2.4.3 模型優(yōu)化及參數設置
2.4.4 模型實驗結果與分析
2.5 本章小結
第3章 基于注意力機制的語義推理技術
3.1 引言
3.2 基于注意力機制的語義推理模型
3.2.1 注意力機制
3.2.2 基于序列注意力機制的語義推理模型
3.2.3 基于逐字注意力機制的語義推理模型
3.2.4 基于自身注意力機制的語義推理模型
3.3 實驗結果與分析
3.4 本章小結
第4章 基于遷移學習與模型融合的語義推理技術
4.1 引言
4.2 基于殘差的語義推理網絡
4.2.1 殘差網絡相關技術
4.2.2 融合殘差網絡語義推理模型
4.3 基于遷移學習的語義推理網絡
4.3.1 遷移學習相關技術
4.3.2 融合遷移學習的語義推理模型
4.4 基于集成的語義推理網絡
4.4.1 特征工程
4.4.3 集成的語義推理模型
4.5 實驗結果與分析
4.5.1 模型實驗結果與分析
4.5.2 遷移學習實驗分析
4.6 本章小結
結論
參考文獻
攻讀博士學位期間發(fā)表的論文及其它成果
致謝
本文編號:2922335
本文鏈接:http://www.sikaile.net/kejilunwen/zidonghuakongzhilunwen/2922335.html
最近更新
教材專著