多源人物屬性融合方法研究
發(fā)布時(shí)間:2023-11-25 17:54
近年來(lái),人物知識(shí)圖譜在智能問(wèn)答、人物關(guān)系分析、搜索引擎等場(chǎng)景得到了極大的應(yīng)用,覆蓋了金融、互聯(lián)網(wǎng)、醫(yī)療、政務(wù)等領(lǐng)域。結(jié)構(gòu)化數(shù)據(jù)諸如維基百科、百度百科及其他行業(yè)數(shù)據(jù)庫(kù)是構(gòu)建人物知識(shí)圖譜的優(yōu)選數(shù)據(jù)源。然而與結(jié)構(gòu)化數(shù)據(jù)相比,互聯(lián)網(wǎng)還存儲(chǔ)了更多的非結(jié)構(gòu)數(shù)據(jù)源,同樣包含豐富的人物屬性信息。如何從非結(jié)構(gòu)化數(shù)據(jù)源中準(zhǔn)確提取人物信息用于構(gòu)建人物知識(shí)圖譜是當(dāng)前人物知識(shí)圖譜構(gòu)建領(lǐng)域的熱點(diǎn)研究問(wèn)題。為此本文在對(duì)現(xiàn)有的相關(guān)研究進(jìn)行深入分析的基礎(chǔ)上,提出了基于依存樹(shù)剪枝的圖卷積網(wǎng)絡(luò)人物屬性抽取模型、基于嵌入表達(dá)的知識(shí)圖譜實(shí)體對(duì)齊模型以及基于屬性類(lèi)型的屬性對(duì)齊模型,實(shí)現(xiàn)了從非結(jié)構(gòu)化數(shù)據(jù)源中準(zhǔn)確提取用戶(hù)屬性并構(gòu)建知識(shí)圖譜的過(guò)程。具體的研究如下:1)針對(duì)現(xiàn)有基于依存樹(shù)的關(guān)系抽取模型存在依存樹(shù)修剪過(guò)度導(dǎo)致關(guān)鍵信息被裁減的問(wèn)題,本文提出了基于依存樹(shù)剪枝的圖卷積網(wǎng)絡(luò)關(guān)系抽取模型。該模型先以實(shí)體和最短依存路徑為中心對(duì)依存樹(shù)剪枝后得到剪枝依存樹(shù)的鄰接矩陣,隨后將句子的詞向量和鄰接矩陣作為圖卷積網(wǎng)絡(luò)的輸入得到每個(gè)詞匯的隱式表達(dá),然后采用基于實(shí)體類(lèi)型嵌入和位置的注意力機(jī)制得到句子的表達(dá),最后進(jìn)行關(guān)系分類(lèi)。實(shí)驗(yàn)表明了該模型在Sem ...
【文章頁(yè)數(shù)】:82 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
abstract
第一章 緒論
1.1 研究背景及意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.3 論文的主要工作與貢獻(xiàn)
1.4 論文章節(jié)安排
第二章 相關(guān)理論基礎(chǔ)和技術(shù)
2.1 自然語(yǔ)言處理的相關(guān)概念
2.2 本文運(yùn)用的基本理論
2.2.1 文本的表示方法
2.2.2 依存樹(shù)以及常見(jiàn)剪枝方法
2.2.3 注意力機(jī)制
2.2.4 圖卷積網(wǎng)絡(luò)
2.2.5 圖注意力網(wǎng)絡(luò)
2.3 文本采集與處理工具
2.4 本章小結(jié)
第三章 基于依存樹(shù)剪枝的圖卷積網(wǎng)絡(luò)人物關(guān)系抽取方法研究
3.1 研究背景
3.2 基于依存樹(shù)剪枝的圖卷積網(wǎng)絡(luò)人物關(guān)系抽取模型
3.2.1 訓(xùn)練詞向量模型
3.2.2 依存樹(shù)剪枝方法
3.2.3 圖卷積神經(jīng)網(wǎng)絡(luò)
3.2.4 注意力機(jī)制
3.2.5 分類(lèi)輸出層
3.3 實(shí)驗(yàn)與分析
3.3.1 實(shí)驗(yàn)數(shù)據(jù)與評(píng)價(jià)指標(biāo)
3.3.2 實(shí)驗(yàn)參數(shù)設(shè)置
3.3.3 結(jié)果和分析
3.4 本章小結(jié)
第四章 基于嵌入表示的知識(shí)圖譜實(shí)體對(duì)齊方法研究
4.1 研究背景
4.2 基于嵌入表示的知識(shí)圖譜實(shí)體對(duì)齊模型
4.2.1 數(shù)據(jù)定義和預(yù)處理
4.2.2 結(jié)構(gòu)嵌入
4.2.3 屬性嵌入
4.2.4 實(shí)體對(duì)齊
4.3 實(shí)驗(yàn)與分析
4.3.1 實(shí)驗(yàn)數(shù)據(jù)與評(píng)估指標(biāo)
4.3.2 實(shí)驗(yàn)參數(shù)設(shè)置
4.3.3 結(jié)果和分析
4.4 本章小結(jié)
第五章 基于屬性類(lèi)型的屬性對(duì)齊方法研究
5.1 研究背景
5.2 基于屬性類(lèi)型的屬性對(duì)齊模型
5.2.1 屬性對(duì)齊模型的數(shù)據(jù)定義和算法流程
5.2.2 屬性名相似度計(jì)算方法
5.2.3 屬性值相似度計(jì)算方法
5.2.4 對(duì)齊屬性對(duì)的融合方法
5.3 實(shí)驗(yàn)與分析
5.3.1 實(shí)驗(yàn)數(shù)據(jù)與評(píng)估指標(biāo)
5.3.2 實(shí)驗(yàn)參數(shù)設(shè)置
5.3.3 實(shí)驗(yàn)分析
5.4 本章小結(jié)
第六章 總結(jié)和展望
6.1 工作總結(jié)
6.2 工作展望
致謝
參考文獻(xiàn)
攻讀碩士學(xué)位期間取得的研究成果
本文編號(hào):3867566
【文章頁(yè)數(shù)】:82 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
abstract
第一章 緒論
1.1 研究背景及意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.3 論文的主要工作與貢獻(xiàn)
1.4 論文章節(jié)安排
第二章 相關(guān)理論基礎(chǔ)和技術(shù)
2.1 自然語(yǔ)言處理的相關(guān)概念
2.2 本文運(yùn)用的基本理論
2.2.1 文本的表示方法
2.2.2 依存樹(shù)以及常見(jiàn)剪枝方法
2.2.3 注意力機(jī)制
2.2.4 圖卷積網(wǎng)絡(luò)
2.2.5 圖注意力網(wǎng)絡(luò)
2.3 文本采集與處理工具
2.4 本章小結(jié)
第三章 基于依存樹(shù)剪枝的圖卷積網(wǎng)絡(luò)人物關(guān)系抽取方法研究
3.1 研究背景
3.2 基于依存樹(shù)剪枝的圖卷積網(wǎng)絡(luò)人物關(guān)系抽取模型
3.2.1 訓(xùn)練詞向量模型
3.2.2 依存樹(shù)剪枝方法
3.2.3 圖卷積神經(jīng)網(wǎng)絡(luò)
3.2.4 注意力機(jī)制
3.2.5 分類(lèi)輸出層
3.3 實(shí)驗(yàn)與分析
3.3.1 實(shí)驗(yàn)數(shù)據(jù)與評(píng)價(jià)指標(biāo)
3.3.2 實(shí)驗(yàn)參數(shù)設(shè)置
3.3.3 結(jié)果和分析
3.4 本章小結(jié)
第四章 基于嵌入表示的知識(shí)圖譜實(shí)體對(duì)齊方法研究
4.1 研究背景
4.2 基于嵌入表示的知識(shí)圖譜實(shí)體對(duì)齊模型
4.2.1 數(shù)據(jù)定義和預(yù)處理
4.2.2 結(jié)構(gòu)嵌入
4.2.3 屬性嵌入
4.2.4 實(shí)體對(duì)齊
4.3 實(shí)驗(yàn)與分析
4.3.1 實(shí)驗(yàn)數(shù)據(jù)與評(píng)估指標(biāo)
4.3.2 實(shí)驗(yàn)參數(shù)設(shè)置
4.3.3 結(jié)果和分析
4.4 本章小結(jié)
第五章 基于屬性類(lèi)型的屬性對(duì)齊方法研究
5.1 研究背景
5.2 基于屬性類(lèi)型的屬性對(duì)齊模型
5.2.1 屬性對(duì)齊模型的數(shù)據(jù)定義和算法流程
5.2.2 屬性名相似度計(jì)算方法
5.2.3 屬性值相似度計(jì)算方法
5.2.4 對(duì)齊屬性對(duì)的融合方法
5.3 實(shí)驗(yàn)與分析
5.3.1 實(shí)驗(yàn)數(shù)據(jù)與評(píng)估指標(biāo)
5.3.2 實(shí)驗(yàn)參數(shù)設(shè)置
5.3.3 實(shí)驗(yàn)分析
5.4 本章小結(jié)
第六章 總結(jié)和展望
6.1 工作總結(jié)
6.2 工作展望
致謝
參考文獻(xiàn)
攻讀碩士學(xué)位期間取得的研究成果
本文編號(hào):3867566
本文鏈接:http://www.sikaile.net/kejilunwen/shengwushengchang/3867566.html
最近更新
教材專(zhuān)著