社保領(lǐng)域知識圖譜構(gòu)建及應(yīng)用研究
發(fā)布時(shí)間:2022-12-05 06:50
社會保障制度與民生息息相關(guān),而作為其重要組成部分的社會保險(xiǎn)更與本文普通人密不可分。但隨著經(jīng)濟(jì)的發(fā)展,大量的社會保險(xiǎn)知識呈現(xiàn)出地域化和碎片化,并且互聯(lián)網(wǎng)的發(fā)展使人們更愿意在網(wǎng)上提出問題。因此,目前亟需構(gòu)建一個(gè)社保領(lǐng)域知識庫,并在其之上能夠創(chuàng)造應(yīng)用價(jià)值,解決老百姓所遇到的社保問題,而知識圖譜可以作為解決以上問題的可行方法。基于以上背景,以自然語言處理技術(shù)和神經(jīng)網(wǎng)絡(luò)理論作為支撐,本文對社保領(lǐng)域知識圖譜構(gòu)建以及問答技術(shù)進(jìn)行了深入研究。本文的內(nèi)容主要分為兩個(gè)模塊:社保知識圖譜構(gòu)建與基于知識圖譜的問答原型構(gòu)建。在社保領(lǐng)域知識圖譜構(gòu)建模塊中,本文結(jié)合社保領(lǐng)域特點(diǎn)提出了一個(gè)知識圖譜構(gòu)建框架,主要包括知識的預(yù)處理,概念提取,實(shí)體識別以及關(guān)系抽取四個(gè)部分。在預(yù)處理部分,本文利用網(wǎng)絡(luò)爬蟲爬取了權(quán)威的領(lǐng)域知識并對文本進(jìn)行去噪。由于社保領(lǐng)域中的概念繁多,為了減少人工參與,所以本文首先利用規(guī)則與統(tǒng)計(jì)相結(jié)合的方法對領(lǐng)域概念進(jìn)行提取,將構(gòu)建好的領(lǐng)域概念集合用于分詞和標(biāo)注任務(wù)。為了獲取知識圖譜中的重要組成部分:實(shí)體和關(guān)系,本文接下來利用經(jīng)典的BiLSTM-CRF實(shí)體識別模型進(jìn)行社保領(lǐng)域?qū)嶓w識別,并在此基礎(chǔ)之針對領(lǐng)域特點(diǎn)...
【文章頁數(shù)】:79 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
abstract
第1章 緒論
1.1 研究背景及意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 知識圖譜研究現(xiàn)狀
1.2.2 問答技術(shù)研究現(xiàn)狀
1.3 論文研究內(nèi)容
1.4 論文組織結(jié)構(gòu)
第2章 相關(guān)理論與技術(shù)
2.1 語言模型理論
2.1.1 傳統(tǒng)語言模型
2.1.2 神經(jīng)概率語言模型
2.1.3 word2vec模型
2.2 神經(jīng)網(wǎng)絡(luò)相關(guān)技術(shù)
2.2.1 卷積神經(jīng)網(wǎng)絡(luò)
2.2.2 循環(huán)神經(jīng)網(wǎng)絡(luò)
2.3 條件隨機(jī)場模型
2.4 本章小結(jié)
第3章 社保領(lǐng)域知識圖譜構(gòu)建
3.1 引言
3.2 社保領(lǐng)域知識圖譜構(gòu)建預(yù)處理
3.2.1 知識獲取
3.2.2 數(shù)據(jù)預(yù)處理
3.3 社保領(lǐng)域概念提取算法
3.3.1 基于規(guī)則的候選概念選取
3.3.2 基于統(tǒng)計(jì)信息的概念篩選
3.4 社保領(lǐng)域?qū)嶓w識別模型構(gòu)建
3.4.1 實(shí)體識別模型形式化表示
3.4.2 實(shí)體識別模型構(gòu)建
3.5 基于遠(yuǎn)程監(jiān)督的社保領(lǐng)域關(guān)系抽取框架
3.5.1 關(guān)系實(shí)例構(gòu)建
3.5.2 關(guān)系語義特征選擇
3.5.3 分段卷積神經(jīng)網(wǎng)絡(luò)模型構(gòu)建
3.5.4 句子級別注意力模型構(gòu)建
3.5.5 引入實(shí)體描述
3.6 本章小結(jié)
第4章 基于社保領(lǐng)域知識圖譜的問答技術(shù)
4.1 引言
4.2 社保領(lǐng)域問句實(shí)體鏈接
4.3 社保領(lǐng)域問句關(guān)系預(yù)測模型構(gòu)建
4.3.1 嵌入層
4.3.2 關(guān)系表示層
4.3.3 問句表示層
4.3.4 注意力層
4.3.5 輸出層
4.4 知識圖譜形式化查詢
4.5 本章小節(jié)
第5章 社保領(lǐng)域知識圖譜構(gòu)建及問答實(shí)驗(yàn)
5.1 實(shí)驗(yàn)環(huán)境
5.2 社保領(lǐng)域知識圖譜構(gòu)建實(shí)驗(yàn)
5.2.1 實(shí)驗(yàn)數(shù)據(jù)設(shè)置和評價(jià)指標(biāo)
5.2.2 社保領(lǐng)域概念提取實(shí)驗(yàn)
5.2.3 社保領(lǐng)域?qū)嶓w識別實(shí)驗(yàn)
5.2.4 社保領(lǐng)域關(guān)系抽取實(shí)驗(yàn)
5.2.5 社保領(lǐng)域知識圖譜持久化
5.3 基于社保領(lǐng)域知識圖譜的問答實(shí)驗(yàn)
5.3.1 實(shí)驗(yàn)數(shù)據(jù)設(shè)置和評價(jià)指標(biāo)
5.3.2 社保領(lǐng)域問句實(shí)體抽取實(shí)驗(yàn)
5.3.3 社保領(lǐng)域問句關(guān)系預(yù)測實(shí)驗(yàn)
5.3.4 問答原型實(shí)驗(yàn)
5.4 本章小結(jié)
結(jié)論
參考文獻(xiàn)
攻讀碩士學(xué)位期間發(fā)表的論文和取得的科研成果
致謝
【參考文獻(xiàn)】:
期刊論文
[1]中國社會保障體系建設(shè)的基本經(jīng)驗(yàn)與未來展望[J]. 胡曉義. 經(jīng)濟(jì)研究參考. 2018(25)
[2]基于中文知識圖譜的電商領(lǐng)域問答系統(tǒng)[J]. 杜澤宇,楊燕,賀樑. 計(jì)算機(jī)應(yīng)用與軟件. 2017(05)
[3]中文信息處理研究現(xiàn)狀分析[J]. 宗成慶. 語言戰(zhàn)略研究. 2016(06)
[4]統(tǒng)計(jì)與規(guī)則相融合的領(lǐng)域術(shù)語抽取算法[J]. 樊夢佳,段東圣,杜翠蘭,張仰森,佟玲玲. 計(jì)算機(jī)應(yīng)用研究. 2016(08)
[5]基于條件隨機(jī)場方法的開放領(lǐng)域新詞發(fā)現(xiàn)[J]. 陳飛,劉奕群,魏超,張?jiān)屏?張敏,馬少平. 軟件學(xué)報(bào). 2013(05)
本文編號:3709902
【文章頁數(shù)】:79 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
abstract
第1章 緒論
1.1 研究背景及意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 知識圖譜研究現(xiàn)狀
1.2.2 問答技術(shù)研究現(xiàn)狀
1.3 論文研究內(nèi)容
1.4 論文組織結(jié)構(gòu)
第2章 相關(guān)理論與技術(shù)
2.1 語言模型理論
2.1.1 傳統(tǒng)語言模型
2.1.2 神經(jīng)概率語言模型
2.1.3 word2vec模型
2.2 神經(jīng)網(wǎng)絡(luò)相關(guān)技術(shù)
2.2.1 卷積神經(jīng)網(wǎng)絡(luò)
2.2.2 循環(huán)神經(jīng)網(wǎng)絡(luò)
2.3 條件隨機(jī)場模型
2.4 本章小結(jié)
第3章 社保領(lǐng)域知識圖譜構(gòu)建
3.1 引言
3.2 社保領(lǐng)域知識圖譜構(gòu)建預(yù)處理
3.2.1 知識獲取
3.2.2 數(shù)據(jù)預(yù)處理
3.3 社保領(lǐng)域概念提取算法
3.3.1 基于規(guī)則的候選概念選取
3.3.2 基于統(tǒng)計(jì)信息的概念篩選
3.4 社保領(lǐng)域?qū)嶓w識別模型構(gòu)建
3.4.1 實(shí)體識別模型形式化表示
3.4.2 實(shí)體識別模型構(gòu)建
3.5 基于遠(yuǎn)程監(jiān)督的社保領(lǐng)域關(guān)系抽取框架
3.5.1 關(guān)系實(shí)例構(gòu)建
3.5.2 關(guān)系語義特征選擇
3.5.3 分段卷積神經(jīng)網(wǎng)絡(luò)模型構(gòu)建
3.5.4 句子級別注意力模型構(gòu)建
3.5.5 引入實(shí)體描述
3.6 本章小結(jié)
第4章 基于社保領(lǐng)域知識圖譜的問答技術(shù)
4.1 引言
4.2 社保領(lǐng)域問句實(shí)體鏈接
4.3 社保領(lǐng)域問句關(guān)系預(yù)測模型構(gòu)建
4.3.1 嵌入層
4.3.2 關(guān)系表示層
4.3.3 問句表示層
4.3.4 注意力層
4.3.5 輸出層
4.4 知識圖譜形式化查詢
4.5 本章小節(jié)
第5章 社保領(lǐng)域知識圖譜構(gòu)建及問答實(shí)驗(yàn)
5.1 實(shí)驗(yàn)環(huán)境
5.2 社保領(lǐng)域知識圖譜構(gòu)建實(shí)驗(yàn)
5.2.1 實(shí)驗(yàn)數(shù)據(jù)設(shè)置和評價(jià)指標(biāo)
5.2.2 社保領(lǐng)域概念提取實(shí)驗(yàn)
5.2.3 社保領(lǐng)域?qū)嶓w識別實(shí)驗(yàn)
5.2.4 社保領(lǐng)域關(guān)系抽取實(shí)驗(yàn)
5.2.5 社保領(lǐng)域知識圖譜持久化
5.3 基于社保領(lǐng)域知識圖譜的問答實(shí)驗(yàn)
5.3.1 實(shí)驗(yàn)數(shù)據(jù)設(shè)置和評價(jià)指標(biāo)
5.3.2 社保領(lǐng)域問句實(shí)體抽取實(shí)驗(yàn)
5.3.3 社保領(lǐng)域問句關(guān)系預(yù)測實(shí)驗(yàn)
5.3.4 問答原型實(shí)驗(yàn)
5.4 本章小結(jié)
結(jié)論
參考文獻(xiàn)
攻讀碩士學(xué)位期間發(fā)表的論文和取得的科研成果
致謝
【參考文獻(xiàn)】:
期刊論文
[1]中國社會保障體系建設(shè)的基本經(jīng)驗(yàn)與未來展望[J]. 胡曉義. 經(jīng)濟(jì)研究參考. 2018(25)
[2]基于中文知識圖譜的電商領(lǐng)域問答系統(tǒng)[J]. 杜澤宇,楊燕,賀樑. 計(jì)算機(jī)應(yīng)用與軟件. 2017(05)
[3]中文信息處理研究現(xiàn)狀分析[J]. 宗成慶. 語言戰(zhàn)略研究. 2016(06)
[4]統(tǒng)計(jì)與規(guī)則相融合的領(lǐng)域術(shù)語抽取算法[J]. 樊夢佳,段東圣,杜翠蘭,張仰森,佟玲玲. 計(jì)算機(jī)應(yīng)用研究. 2016(08)
[5]基于條件隨機(jī)場方法的開放領(lǐng)域新詞發(fā)現(xiàn)[J]. 陳飛,劉奕群,魏超,張?jiān)屏?張敏,馬少平. 軟件學(xué)報(bào). 2013(05)
本文編號:3709902
本文鏈接:http://www.sikaile.net/shekelunwen/shehuibaozhanglunwen/3709902.html
最近更新
教材專著