基于中文知識圖譜的金融領(lǐng)域問答系統(tǒng)的研究與實(shí)現(xiàn)
發(fā)布時間:2024-03-26 18:45
隨著互聯(lián)網(wǎng)的飛速發(fā)展,問答系統(tǒng)為用戶提供智能知識服務(wù)而受到青睞。本文從金融領(lǐng)域的角度出發(fā),針對用戶所提問句的不確定性和多樣性,對金融領(lǐng)域中文數(shù)據(jù)進(jìn)行分析梳理和結(jié)構(gòu)化,構(gòu)建了知識圖譜,研究并實(shí)現(xiàn)了基于中文知識圖譜的金融領(lǐng)域問答系統(tǒng)(CF-KGQA)。主要工作如下:1.獲取與存儲數(shù)據(jù),構(gòu)建了具有金融領(lǐng)域特性知識圖譜。(1)搭建了一套一主十從的分布式爬蟲系統(tǒng),且為保障數(shù)據(jù)存儲的安全,搭建了可主從備份的數(shù)據(jù)庫集群。(2)定義知識圖譜中實(shí)體、實(shí)體間關(guān)系的概念。在構(gòu)建知識圖譜時,不僅要考慮金融領(lǐng)域特性設(shè)計(jì)圖譜結(jié)構(gòu),還要根據(jù)問答系統(tǒng)的實(shí)際需求不斷進(jìn)行調(diào)整。2.提出了基于深度學(xué)習(xí)的金融領(lǐng)域問句語義依存分析方法。提出了一種基于訊飛開放平臺的語義依存圖分析(Semantic Dependency Graph Parsing,SDGP)、雙向長短期記憶網(wǎng)絡(luò)(Bidirectional Long Short-Term Memory,BLSTM)和條件隨機(jī)場(Conditional Random Field,CRF)的語義依存分析方法(DR-BLSTM-CRF)。(1)結(jié)合BLSTM和CRF的命名實(shí)體識別(Na...
【文章頁數(shù)】:71 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
abstract
第1章 緒論
1.1 研究背景和意義
1.2 國內(nèi)外研究現(xiàn)狀
1.3 研究內(nèi)容與論文結(jié)構(gòu)
第2章 問答系統(tǒng)相關(guān)技術(shù)
2.1 數(shù)據(jù)獲取
2.2 數(shù)據(jù)存儲
2.2.1 關(guān)系型數(shù)據(jù)存儲
2.2.2 非關(guān)系型數(shù)據(jù)存儲
2.3 實(shí)體識別
2.3.1 基于規(guī)則和詞典的方法
2.3.2 基于統(tǒng)計(jì)模型的方法
2.3.3 基于深度學(xué)習(xí)的方法
2.4 實(shí)體鏈接
2.5 語義抽取
2.5.1 基于統(tǒng)計(jì)學(xué)習(xí)的語義抽取方法
2.5.2 基于語法解析的語義抽取方法
2.5.3 各類語義抽取方法的比較分析
2.6 Cypher
2.7 本章小結(jié)
第3章 問答系統(tǒng)數(shù)據(jù)的獲取與存儲
3.1 基于Pyspider的數(shù)據(jù)獲取方案
3.2 基于Mysql的數(shù)據(jù)存儲方案
3.3 基于Neo4j的數(shù)據(jù)存儲方案
3.4 本章小結(jié)
第4章 基于深度學(xué)習(xí)的金融領(lǐng)域問句語義依存分析
4.1 基于DR-BLSTM-CRF的金融領(lǐng)域問句語義依存分析
4.1.1 BLSTM
4.1.2 BLSTM-CRF
4.1.3 DR-BLSTM-CRF
4.2 實(shí)驗(yàn)及相關(guān)說明
4.2.1 數(shù)據(jù)集
4.2.2 實(shí)驗(yàn)設(shè)置
4.3 實(shí)驗(yàn)結(jié)果及分析
4.4 本章小結(jié)
第5章 問答系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)
5.1 系統(tǒng)框架設(shè)計(jì)
5.2 系統(tǒng)開發(fā)環(huán)境
5.3 知識圖譜模塊
5.4 問答模塊
5.4.1 意圖識別
5.4.2 查詢生成
5.5 前端展示模塊
5.6 問答系統(tǒng)頁面展示
5.7 本章小結(jié)
第6章 總結(jié)與展望
6.1 工作總結(jié)
6.2 后續(xù)工作展望
參考文獻(xiàn)
致謝
攻讀碩士學(xué)位期間從事的科研工作及取得的成果
本文編號:3939522
【文章頁數(shù)】:71 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
abstract
第1章 緒論
1.1 研究背景和意義
1.2 國內(nèi)外研究現(xiàn)狀
1.3 研究內(nèi)容與論文結(jié)構(gòu)
第2章 問答系統(tǒng)相關(guān)技術(shù)
2.1 數(shù)據(jù)獲取
2.2 數(shù)據(jù)存儲
2.2.1 關(guān)系型數(shù)據(jù)存儲
2.2.2 非關(guān)系型數(shù)據(jù)存儲
2.3 實(shí)體識別
2.3.1 基于規(guī)則和詞典的方法
2.3.2 基于統(tǒng)計(jì)模型的方法
2.3.3 基于深度學(xué)習(xí)的方法
2.4 實(shí)體鏈接
2.5 語義抽取
2.5.1 基于統(tǒng)計(jì)學(xué)習(xí)的語義抽取方法
2.5.2 基于語法解析的語義抽取方法
2.5.3 各類語義抽取方法的比較分析
2.6 Cypher
2.7 本章小結(jié)
第3章 問答系統(tǒng)數(shù)據(jù)的獲取與存儲
3.1 基于Pyspider的數(shù)據(jù)獲取方案
3.2 基于Mysql的數(shù)據(jù)存儲方案
3.3 基于Neo4j的數(shù)據(jù)存儲方案
3.4 本章小結(jié)
第4章 基于深度學(xué)習(xí)的金融領(lǐng)域問句語義依存分析
4.1 基于DR-BLSTM-CRF的金融領(lǐng)域問句語義依存分析
4.1.1 BLSTM
4.1.2 BLSTM-CRF
4.1.3 DR-BLSTM-CRF
4.2 實(shí)驗(yàn)及相關(guān)說明
4.2.1 數(shù)據(jù)集
4.2.2 實(shí)驗(yàn)設(shè)置
4.3 實(shí)驗(yàn)結(jié)果及分析
4.4 本章小結(jié)
第5章 問答系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)
5.1 系統(tǒng)框架設(shè)計(jì)
5.2 系統(tǒng)開發(fā)環(huán)境
5.3 知識圖譜模塊
5.4 問答模塊
5.4.1 意圖識別
5.4.2 查詢生成
5.5 前端展示模塊
5.6 問答系統(tǒng)頁面展示
5.7 本章小結(jié)
第6章 總結(jié)與展望
6.1 工作總結(jié)
6.2 后續(xù)工作展望
參考文獻(xiàn)
致謝
攻讀碩士學(xué)位期間從事的科研工作及取得的成果
本文編號:3939522
本文鏈接:http://www.sikaile.net/kejilunwen/shengwushengchang/3939522.html
最近更新
教材專著