基于知識圖譜的非結(jié)構(gòu)化關(guān)聯(lián)規(guī)則抽取研究及應(yīng)用
發(fā)布時間:2023-04-01 08:33
知識圖譜用一種結(jié)構(gòu)化的方式存儲現(xiàn)實世界存在的知識,由于其知識易于被計算機處理,因此在自然語言處理的許多任務(wù)中它都起著極其重要的作用。雖然從絕對數(shù)量上來看,現(xiàn)有知識圖譜已經(jīng)包含了海量的三元組事實,但是與真實世界中存在的知識相比它遠(yuǎn)遠(yuǎn)不夠,因此如何完善知識圖譜成為目前的研究熱點。本文提出了一種基于非結(jié)構(gòu)化文本增強關(guān)聯(lián)規(guī)則的知識推理方法(Natural Language Enhanced Association Rules Mining,NEARM)。使用該規(guī)則可以將自然文本中包含的三元組事實推理出來用以完善知識圖譜。本文的工作有:1.為了從非結(jié)構(gòu)化的文本中抽取三元組事實,本文使用密度峰值算法對關(guān)系文本聚類,其中涉及到的句子相似度計算使用改進的LSWMD算法。為了提高算法效率,本文還利用基于K-BoD的文本聚類算法對其進行改進。2.為了將類簇建模為一個統(tǒng)一的表達方式放入到非結(jié)構(gòu)化關(guān)聯(lián)規(guī)則中,本文提出了改進的BoD(BoD-GS,基于高斯分布的文本模式建模)和BoD-TDGS(基于二維高斯分布的文本模式建模)來建模關(guān)系文本。實驗結(jié)果表明,較于BoD-GS,BoD-TDGS更為準(zhǔn)確合理。3.研究...
【文章頁數(shù)】:55 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
abstract
第1章 緒論
1.1 研究的背景和意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 知識圖譜研究現(xiàn)狀
1.2.2 知識圖譜完善研究現(xiàn)狀
1.3 論文主要工作
1.4 論文組織結(jié)構(gòu)
第2章 相關(guān)技術(shù)介紹
2.1 句子聚類
2.2 文本模式建模
2.3 關(guān)系分類
2.4 本章小結(jié)
第3章 非結(jié)構(gòu)化關(guān)聯(lián)規(guī)則抽取
3.1 引言
3.2 問題定義
3.3 NEARM算法
3.3.1 關(guān)系文本聚類
3.3.2 文本模式建模
3.3.3 非結(jié)構(gòu)化文本增強的關(guān)聯(lián)規(guī)則挖掘
3.4 實驗
3.4.1 數(shù)據(jù)集描述及實驗設(shè)置
3.4.2 對比方法
3.4.3 評估方法
3.4.4 實驗結(jié)果分析
3.4.5 樣例分析
3.5 本章小結(jié)
第4章 基于K-BoD文本聚類的NEARM算法
4.1 引言
4.2 K-BoD文本聚類算法
4.3 基于二維高斯分布的文本模式建模
4.4 實驗和結(jié)果分析
4.4.1 對比方法
4.4.2 評估方法
4.4.3 實驗結(jié)果分析
4.4.4 樣例分析
4.5 仿真實驗驗證
4.5.1 仿真實驗?zāi)繕?biāo)
4.5.2 仿真實驗流程
4.5.3 仿真實驗結(jié)果展示
4.6 本章小結(jié)
第5章 總結(jié)與展望
5.1 主要工作與創(chuàng)新點
5.2 后續(xù)研究工作
參考文獻
致謝
攻讀碩士學(xué)位期間從事的科研工作及取得的成果
本文編號:3776814
【文章頁數(shù)】:55 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
abstract
第1章 緒論
1.1 研究的背景和意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 知識圖譜研究現(xiàn)狀
1.2.2 知識圖譜完善研究現(xiàn)狀
1.3 論文主要工作
1.4 論文組織結(jié)構(gòu)
第2章 相關(guān)技術(shù)介紹
2.1 句子聚類
2.2 文本模式建模
2.3 關(guān)系分類
2.4 本章小結(jié)
第3章 非結(jié)構(gòu)化關(guān)聯(lián)規(guī)則抽取
3.1 引言
3.2 問題定義
3.3 NEARM算法
3.3.1 關(guān)系文本聚類
3.3.2 文本模式建模
3.3.3 非結(jié)構(gòu)化文本增強的關(guān)聯(lián)規(guī)則挖掘
3.4 實驗
3.4.1 數(shù)據(jù)集描述及實驗設(shè)置
3.4.2 對比方法
3.4.3 評估方法
3.4.4 實驗結(jié)果分析
3.4.5 樣例分析
3.5 本章小結(jié)
第4章 基于K-BoD文本聚類的NEARM算法
4.1 引言
4.2 K-BoD文本聚類算法
4.3 基于二維高斯分布的文本模式建模
4.4 實驗和結(jié)果分析
4.4.1 對比方法
4.4.2 評估方法
4.4.3 實驗結(jié)果分析
4.4.4 樣例分析
4.5 仿真實驗驗證
4.5.1 仿真實驗?zāi)繕?biāo)
4.5.2 仿真實驗流程
4.5.3 仿真實驗結(jié)果展示
4.6 本章小結(jié)
第5章 總結(jié)與展望
5.1 主要工作與創(chuàng)新點
5.2 后續(xù)研究工作
參考文獻
致謝
攻讀碩士學(xué)位期間從事的科研工作及取得的成果
本文編號:3776814
本文鏈接:http://www.sikaile.net/kejilunwen/shengwushengchang/3776814.html
最近更新
教材專著