基于深度學(xué)習(xí)的知識問答研究
發(fā)布時間:2023-05-03 22:08
知識問答的目的是根據(jù)用戶提出的自然語言問題,基于知識庫給出精確的答案。近些年數(shù)據(jù)挖掘、信息抽取技術(shù)的快速發(fā)展,推動了大規(guī)模且涵蓋領(lǐng)域豐富的知識庫的涌現(xiàn),為基于知識庫的問答研究提供了數(shù)據(jù)基礎(chǔ)。由于自然語言問題表達方式的多樣性,如何獲取問題中的主題實體,并精確的將自然語言問題和知識庫中的結(jié)構(gòu)化三元組進行匹配是本文研究的重點。本文將知識問答任務(wù)分為兩個階段:主題實體識別和候選三元組排序。在主題實體識別階段首先使用基于深度學(xué)習(xí)和遷移學(xué)習(xí)的實體識別模型得到問題的主題實體;在候選三元組排序階段分別計算問題和候選三元組的語義相似度和字符相似度,并通過融合進行排序。NLPCC-ICCPOL 2016 KBQA任務(wù)發(fā)布了大規(guī)模的中文知識庫和相關(guān)的問答數(shù)據(jù)集,本文在該數(shù)據(jù)集上進行實驗并取得了出色的成績。本文的主要貢獻如下:本文提出遷移深度實體識別模型,將遷移學(xué)習(xí)和深度學(xué)習(xí)結(jié)合起來用到命名實體識別中。通過將外部中文分詞工具的詞性標注結(jié)果融入到實體識別訓(xùn)練的輸入中,解決實體識別數(shù)據(jù)集過小的問題。并且在雙向長短時記憶網(wǎng)絡(luò)(Bi-LSTM)和條件隨機場(CRF)之間加入多頭注意力機制提取問題中任意兩個字符之間的語...
【文章頁數(shù)】:74 頁
【學(xué)位級別】:碩士
【文章目錄】:
致謝
摘要
abstract
1 緒論
1.1 研究背景與意義
1.2 國內(nèi)外研究現(xiàn)狀
1.3 本文研究內(nèi)容
1.4 論文的組織結(jié)構(gòu)
2 相關(guān)理論技術(shù)
2.1 知識庫和問答數(shù)據(jù)集
2.2 命名實體識別
2.3 語義匹配
2.4 實體鏈接
2.5 深度學(xué)習(xí)理論
3 基于遷移深度實體識別模型的主題實體識別
3.1 引言
3.2 數(shù)據(jù)集構(gòu)建
3.3 模型結(jié)構(gòu)
3.4 遷移深度實體識別模型
3.5 實體鏈接
3.6 實驗結(jié)果與分析
3.7 本章小結(jié)
4 基于雙向LSTM和卷積神經(jīng)網(wǎng)絡(luò)的雙層次語義匹配
4.1 引言
4.2 數(shù)據(jù)集構(gòu)建
4.3 模型結(jié)構(gòu)
4.4 雙層次語義匹配模型
4.5 實驗結(jié)果與分析
4.6 本章小結(jié)
5 總結(jié)和展望
5.1 論文總結(jié)
5.2 研究展望
參考文獻
作者簡歷
學(xué)位論文數(shù)據(jù)集
本文編號:3807374
【文章頁數(shù)】:74 頁
【學(xué)位級別】:碩士
【文章目錄】:
致謝
摘要
abstract
1 緒論
1.1 研究背景與意義
1.2 國內(nèi)外研究現(xiàn)狀
1.3 本文研究內(nèi)容
1.4 論文的組織結(jié)構(gòu)
2 相關(guān)理論技術(shù)
2.1 知識庫和問答數(shù)據(jù)集
2.2 命名實體識別
2.3 語義匹配
2.4 實體鏈接
2.5 深度學(xué)習(xí)理論
3 基于遷移深度實體識別模型的主題實體識別
3.1 引言
3.2 數(shù)據(jù)集構(gòu)建
3.3 模型結(jié)構(gòu)
3.4 遷移深度實體識別模型
3.5 實體鏈接
3.6 實驗結(jié)果與分析
3.7 本章小結(jié)
4 基于雙向LSTM和卷積神經(jīng)網(wǎng)絡(luò)的雙層次語義匹配
4.1 引言
4.2 數(shù)據(jù)集構(gòu)建
4.3 模型結(jié)構(gòu)
4.4 雙層次語義匹配模型
4.5 實驗結(jié)果與分析
4.6 本章小結(jié)
5 總結(jié)和展望
5.1 論文總結(jié)
5.2 研究展望
參考文獻
作者簡歷
學(xué)位論文數(shù)據(jù)集
本文編號:3807374
本文鏈接:http://www.sikaile.net/kejilunwen/zidonghuakongzhilunwen/3807374.html
最近更新
教材專著