面向艦船知識領(lǐng)域的知識圖譜構(gòu)建關(guān)鍵技術(shù)研究
發(fā)布時間:2022-05-08 08:04
與傳統(tǒng)的信息管理手段相比,知識圖譜以其強大的語義處理與開放互聯(lián)能力,可幫助人們迅速梳理目標知識之間的邏輯關(guān)系,對基于知識的智能推理實現(xiàn)有良好效果。與通用知識圖譜相比,特定領(lǐng)域知識圖譜以其知識的深度與完備性、數(shù)據(jù)模式的豐富和嚴格性以及描述的高準確性等優(yōu)點,通常用于各種復雜的輔助分析或決策支持。本文在調(diào)研和分析了已有知識圖譜構(gòu)建關(guān)鍵技術(shù)的基礎(chǔ)上,以構(gòu)造艦船知識領(lǐng)域知識圖譜為依托,對特定領(lǐng)域的知識圖譜構(gòu)建中命名實體識別、關(guān)系抽取以及知識融合等關(guān)鍵技術(shù)展開深入研究,本文的主要內(nèi)容包括:(1)針對艦船知識領(lǐng)域命名實體存在嵌套以及長度過長等問題,提出基于字向量層疊模型的命名實體識別算法,首先通過高低層網(wǎng)絡(luò)結(jié)構(gòu)完成序列標注以及序列更正工作,最后利用條件隨機場對上層輸出序列標簽進行校準并輸出命名實體識別結(jié)果。實驗表明本文所提出的基于字向量的層疊模型復雜命名實體識別取得了較好的效果,其F1值(F1值為加權(quán)調(diào)和平均值)達到了 87.93%。(2)針對艦船知識領(lǐng)域關(guān)系抽取中語料過少、深度神經(jīng)網(wǎng)絡(luò)無法學習高位數(shù)據(jù)特征等問題,根據(jù)該領(lǐng)域文本數(shù)據(jù)特點,本文提出了基于規(guī)則和觸發(fā)詞的混合關(guān)系抽取方法,對于半結(jié)構(gòu)化文本...
【文章頁數(shù)】:77 頁
【學位級別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 研究背景和意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 命名實體識別技術(shù)
1.2.2 關(guān)系抽取技術(shù)
1.2.3 知識圖譜技術(shù)
1.3 論文研究內(nèi)容及章節(jié)安排
1.3.1 本文的研究內(nèi)容
1.3.2 本文的組織結(jié)構(gòu)
第2章 知識圖譜構(gòu)建的相關(guān)背景算法研究
2.1 文本表示技術(shù)介紹
2.1.1 動態(tài)詞向量技術(shù)ELMo
2.1.2 文檔向量技術(shù)Doc2Vec
2.2 循環(huán)神經(jīng)網(wǎng)絡(luò)
2.2.1 遞歸神經(jīng)網(wǎng)絡(luò)
2.2.2 長短時記憶網(wǎng)絡(luò)
2.3 知識表示技術(shù)
2.4 本章小結(jié)
第3章 基于字向量的層疊模型復雜命名實體識別
3.1 基于字向量的層疊模型實現(xiàn)命名實體識別
3.2 基于字向量的預(yù)訓練語言模型
3.3 層疊模型原理與構(gòu)建
3.3.1 低層網(wǎng)絡(luò)構(gòu)建-雙向門控循環(huán)神經(jīng)網(wǎng)絡(luò)層
3.3.2 高層網(wǎng)絡(luò)構(gòu)建-融合注意力機制的雙向長短時記憶神經(jīng)網(wǎng)絡(luò)層
3.3.3 條件隨機場
3.4 實驗
3.4.1 實驗環(huán)境配置
3.4.2 實驗語料與標注
3.4.3 實驗評價指標
3.4.4 實驗結(jié)果對比分析
3.5 本章小結(jié)
第4章 基于規(guī)則和觸發(fā)詞混合模式的關(guān)系抽取
4.1 實體關(guān)系抽取問題描述
4.2 基于規(guī)則的關(guān)系抽取
4.3 基于觸發(fā)詞的抽取算法
4.4 本章小結(jié)
第5章 領(lǐng)域知識融合與存儲
5.1 領(lǐng)域知識融合
5.1.1 實體對齊
5.1.2 基于知識表示學習的實體對齊算法
5.2 領(lǐng)域知識存儲
5.2.1 Neo4j圖數(shù)據(jù)庫
5.2.2 自動抽取實體及關(guān)系存儲至Neo4j
5.3 圖譜簡單應(yīng)用-知識問答系統(tǒng)構(gòu)建
5.4 本章小結(jié)
第6章 結(jié)論與展望
6.1 論文工作總結(jié)
6.2 論文工作展望
參考文獻
致謝
作者簡歷及攻讀學位期間發(fā)表的學術(shù)論文與研究成果
本文編號:3651262
【文章頁數(shù)】:77 頁
【學位級別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 研究背景和意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 命名實體識別技術(shù)
1.2.2 關(guān)系抽取技術(shù)
1.2.3 知識圖譜技術(shù)
1.3 論文研究內(nèi)容及章節(jié)安排
1.3.1 本文的研究內(nèi)容
1.3.2 本文的組織結(jié)構(gòu)
第2章 知識圖譜構(gòu)建的相關(guān)背景算法研究
2.1 文本表示技術(shù)介紹
2.1.1 動態(tài)詞向量技術(shù)ELMo
2.1.2 文檔向量技術(shù)Doc2Vec
2.2 循環(huán)神經(jīng)網(wǎng)絡(luò)
2.2.1 遞歸神經(jīng)網(wǎng)絡(luò)
2.2.2 長短時記憶網(wǎng)絡(luò)
2.3 知識表示技術(shù)
2.4 本章小結(jié)
第3章 基于字向量的層疊模型復雜命名實體識別
3.1 基于字向量的層疊模型實現(xiàn)命名實體識別
3.2 基于字向量的預(yù)訓練語言模型
3.3 層疊模型原理與構(gòu)建
3.3.1 低層網(wǎng)絡(luò)構(gòu)建-雙向門控循環(huán)神經(jīng)網(wǎng)絡(luò)層
3.3.2 高層網(wǎng)絡(luò)構(gòu)建-融合注意力機制的雙向長短時記憶神經(jīng)網(wǎng)絡(luò)層
3.3.3 條件隨機場
3.4 實驗
3.4.1 實驗環(huán)境配置
3.4.2 實驗語料與標注
3.4.3 實驗評價指標
3.4.4 實驗結(jié)果對比分析
3.5 本章小結(jié)
第4章 基于規(guī)則和觸發(fā)詞混合模式的關(guān)系抽取
4.1 實體關(guān)系抽取問題描述
4.2 基于規(guī)則的關(guān)系抽取
4.3 基于觸發(fā)詞的抽取算法
4.4 本章小結(jié)
第5章 領(lǐng)域知識融合與存儲
5.1 領(lǐng)域知識融合
5.1.1 實體對齊
5.1.2 基于知識表示學習的實體對齊算法
5.2 領(lǐng)域知識存儲
5.2.1 Neo4j圖數(shù)據(jù)庫
5.2.2 自動抽取實體及關(guān)系存儲至Neo4j
5.3 圖譜簡單應(yīng)用-知識問答系統(tǒng)構(gòu)建
5.4 本章小結(jié)
第6章 結(jié)論與展望
6.1 論文工作總結(jié)
6.2 論文工作展望
參考文獻
致謝
作者簡歷及攻讀學位期間發(fā)表的學術(shù)論文與研究成果
本文編號:3651262
本文鏈接:http://www.sikaile.net/kejilunwen/shengwushengchang/3651262.html
最近更新
教材專著