融合知識庫和文本信息的實體關系抽取研究
發(fā)布時間:2022-02-16 13:02
隨著互聯(lián)網(wǎng)的發(fā)展和大數(shù)據(jù)時代的到來,生物醫(yī)學文獻的數(shù)量快速增長,如何從這些非結構化的文本中挖掘和整理實體關系成為人們目前迫切的需求。在生物醫(yī)學領域,蛋白質(zhì)實體交互關系抽取任務要求從非結構化的文本中抽取出存在交互關系的蛋白質(zhì)實體對。該任務對于精準醫(yī)療、疾病發(fā)生機理、細胞穩(wěn)態(tài)控制等都具有重大的意義。此外,生物醫(yī)學知識庫中包含了大量實體關系三元組的結構化信息。這些先驗知識可以幫助我們識別復雜語義環(huán)境中蛋白質(zhì)實體對的交互關系。本文探索融合知識庫和文本信息方法,重點研究蛋白質(zhì)交互關系抽取任務,主要研究內(nèi)容如下:研究基于實體表示的蛋白質(zhì)交互關系抽取。采用知識表示學習模型對知識庫中的大量實體關系三元組進行學習,獲得實體表示和關系表示。再利用深度學習模型將實體表示和文本信息進行融合,構建融合實體表示和文本信息的蛋白質(zhì)交互關系抽取系統(tǒng)。實驗表明,實體表示可以有效提升模型捕獲與實體相關的上下文信息的能力,提升了關系抽取的精確率。研究基于關系表示的蛋白質(zhì)交互關系抽取。基于知識庫中一對蛋白質(zhì)實體對應的關系表示,利用注意力機制抽取與實體關系相關的上下文特征,構建融合關系表示和文本信息的蛋白質(zhì)交互關系抽取模型。實...
【文章來源】:大連理工大學遼寧省211工程院校985工程院校教育部直屬院校
【文章頁數(shù)】:76 頁
【學位級別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 研究內(nèi)容及意義
1.2 國內(nèi)外研究現(xiàn)狀
1.3 蛋白質(zhì)交互關系語料庫
1.4 知識庫
1.5 評測指標
1.6 本文主要工作
1.7 本文組織結構
2 關鍵技術概述
2.1 卷積神經(jīng)網(wǎng)絡
2.2 長短時記憶網(wǎng)絡
2.3 注意力機制
2.4 記憶網(wǎng)絡
2.5 知識表示學習
2.6 本章小結
3 基于實體表示的蛋白質(zhì)交互關系抽取
3.1 基于實體表示蛋白質(zhì)交互關系抽取系統(tǒng)
3.1.1 系統(tǒng)概況
3.1.2 語料預處理
3.1.3 構建候選樣例和詞向量序列
3.1.4 知識表示學習
3.1.5 基于CNN的蛋白質(zhì)交互關系抽取
3.1.6 基于LSTM的蛋白質(zhì)交互關系抽取
3.2 基于實體表示的蛋白質(zhì)交互關系抽取實驗
3.2.1 基于實體表示的蛋白質(zhì)交互關系抽取系統(tǒng)性能
3.2.2 知識庫中的蛋白質(zhì)實體統(tǒng)計數(shù)據(jù)
3.3 本章小結
4 基于關系表示的蛋白質(zhì)交互關系抽取
4.1 基于關系表示的蛋白質(zhì)交互關系抽取系統(tǒng)
4.1.1 系統(tǒng)概況
4.1.2 基于門機制的蛋白質(zhì)交互關系抽取系統(tǒng)
4.1.3 基于關系表示特征的蛋白質(zhì)交互關系抽取系統(tǒng)
4.1.4 基于注意力機制的蛋白質(zhì)交互關系抽取系統(tǒng)
4.2 基于關系表示的蛋白質(zhì)交互關系抽取實驗
4.2.1 基于關系表示的蛋白質(zhì)交互關系抽取性能
4.2.2 知識庫中的關系三元組統(tǒng)計數(shù)據(jù)
4.3 本章小結
5 基于記憶網(wǎng)絡的蛋白質(zhì)交互關系抽取
5.1 基于記憶網(wǎng)絡的蛋白質(zhì)交互關系抽取系統(tǒng)
5.1.1 系統(tǒng)概況
5.1.2 基于文本信息的蛋白質(zhì)交互關系抽取
5.1.3 基于實體表示和關系表示的蛋白質(zhì)交互關系抽取
5.1.4 后處理規(guī)則
5.2 基于記憶網(wǎng)絡蛋白質(zhì)交互關系抽取實驗
5.2.1 基于記憶網(wǎng)絡蛋白質(zhì)交互關系抽取性能
5.2.2 錯誤分析
5.2.3 與相關研究的對比
5.3 本章小結
結論
參考文獻
攻讀碩士學位期間發(fā)表學術論文情況
致謝
【參考文獻】:
期刊論文
[1]知識圖譜構建技術綜述[J]. 劉嶠,李楊,段宏,劉瑤,秦志光. 計算機研究與發(fā)展. 2016(03)
[2]知識表示學習研究進展[J]. 劉知遠,孫茂松,林衍凱,謝若冰. 計算機研究與發(fā)展. 2016(02)
本文編號:3628014
【文章來源】:大連理工大學遼寧省211工程院校985工程院校教育部直屬院校
【文章頁數(shù)】:76 頁
【學位級別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 研究內(nèi)容及意義
1.2 國內(nèi)外研究現(xiàn)狀
1.3 蛋白質(zhì)交互關系語料庫
1.4 知識庫
1.5 評測指標
1.6 本文主要工作
1.7 本文組織結構
2 關鍵技術概述
2.1 卷積神經(jīng)網(wǎng)絡
2.2 長短時記憶網(wǎng)絡
2.3 注意力機制
2.4 記憶網(wǎng)絡
2.5 知識表示學習
2.6 本章小結
3 基于實體表示的蛋白質(zhì)交互關系抽取
3.1 基于實體表示蛋白質(zhì)交互關系抽取系統(tǒng)
3.1.1 系統(tǒng)概況
3.1.2 語料預處理
3.1.3 構建候選樣例和詞向量序列
3.1.4 知識表示學習
3.1.5 基于CNN的蛋白質(zhì)交互關系抽取
3.1.6 基于LSTM的蛋白質(zhì)交互關系抽取
3.2 基于實體表示的蛋白質(zhì)交互關系抽取實驗
3.2.1 基于實體表示的蛋白質(zhì)交互關系抽取系統(tǒng)性能
3.2.2 知識庫中的蛋白質(zhì)實體統(tǒng)計數(shù)據(jù)
3.3 本章小結
4 基于關系表示的蛋白質(zhì)交互關系抽取
4.1 基于關系表示的蛋白質(zhì)交互關系抽取系統(tǒng)
4.1.1 系統(tǒng)概況
4.1.2 基于門機制的蛋白質(zhì)交互關系抽取系統(tǒng)
4.1.3 基于關系表示特征的蛋白質(zhì)交互關系抽取系統(tǒng)
4.1.4 基于注意力機制的蛋白質(zhì)交互關系抽取系統(tǒng)
4.2 基于關系表示的蛋白質(zhì)交互關系抽取實驗
4.2.1 基于關系表示的蛋白質(zhì)交互關系抽取性能
4.2.2 知識庫中的關系三元組統(tǒng)計數(shù)據(jù)
4.3 本章小結
5 基于記憶網(wǎng)絡的蛋白質(zhì)交互關系抽取
5.1 基于記憶網(wǎng)絡的蛋白質(zhì)交互關系抽取系統(tǒng)
5.1.1 系統(tǒng)概況
5.1.2 基于文本信息的蛋白質(zhì)交互關系抽取
5.1.3 基于實體表示和關系表示的蛋白質(zhì)交互關系抽取
5.1.4 后處理規(guī)則
5.2 基于記憶網(wǎng)絡蛋白質(zhì)交互關系抽取實驗
5.2.1 基于記憶網(wǎng)絡蛋白質(zhì)交互關系抽取性能
5.2.2 錯誤分析
5.2.3 與相關研究的對比
5.3 本章小結
結論
參考文獻
攻讀碩士學位期間發(fā)表學術論文情況
致謝
【參考文獻】:
期刊論文
[1]知識圖譜構建技術綜述[J]. 劉嶠,李楊,段宏,劉瑤,秦志光. 計算機研究與發(fā)展. 2016(03)
[2]知識表示學習研究進展[J]. 劉知遠,孫茂松,林衍凱,謝若冰. 計算機研究與發(fā)展. 2016(02)
本文編號:3628014
本文鏈接:http://www.sikaile.net/yixuelunwen/swyx/3628014.html
最近更新
教材專著