基于檢索的高考?xì)v史題答案生成方法
發(fā)布時間:2024-03-16 11:10
隨著互聯(lián)網(wǎng)的發(fā)展與普及,互聯(lián)網(wǎng)上產(chǎn)生了海量的信息,人類需要以更簡單快速的方式獲取信息,過去的搜索引擎逐漸無法滿足人類對于信息獲取的要求。而自動問答系統(tǒng),則是一種比搜索引擎更為高級的信息服務(wù)形式,系統(tǒng)返回給用戶的不再是根據(jù)相關(guān)度排序的文檔列表,而是更為精準(zhǔn)的自然語言答案。人工智能技術(shù)的飛速發(fā)展對自動問答系統(tǒng)產(chǎn)生了巨大的推動作用,也促進(jìn)了自動問答系統(tǒng)在更細(xì)分的領(lǐng)域的推廣,在此背景下哈工大參與了國家的高考答題機(jī)器人項目。本文希望構(gòu)建一個面向高考?xì)v史簡答題的自動答題系統(tǒng),并重點探索基于檢索的答案生成方法在答題系統(tǒng)中的應(yīng)用。本文的主要研究內(nèi)容包括:試題分析與知識庫分析。本文對高考?xì)v史簡答題進(jìn)行統(tǒng)計分析,在此基礎(chǔ)上總結(jié)出題目的類型以及每種題目類型的特點;通過網(wǎng)絡(luò)等渠道獲得了一定數(shù)量的歷史語料,并針對這些語料在高考?xì)v史模擬試題上分析了知識庫中的知識點對高考知識點的覆蓋能力。問題和材料關(guān)鍵詞提取。為了更加準(zhǔn)確地提取關(guān)鍵詞,本文融合了多種方法,利用有監(jiān)督學(xué)習(xí)的算法來提取問題中的關(guān)鍵詞;對于歷史簡答題中的材料,本文結(jié)合歷史題特點,利用詞性標(biāo)注的方法提取關(guān)鍵詞。候選答案抽取和排序。本文根據(jù)問題和材料的關(guān)鍵詞...
【文章頁數(shù)】:58 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第1章 緒論
1.1 課題研究的背景及意義
1.2 國內(nèi)外相關(guān)技術(shù)研究現(xiàn)狀
1.2.1 自動問答系統(tǒng)研究現(xiàn)狀
1.2.2 自動答題系統(tǒng)研究現(xiàn)狀
1.2.3 自動問答系統(tǒng)的關(guān)鍵問題
1.3 本文的主要研究內(nèi)容
1.4 本文的組織結(jié)構(gòu)
第2章 試題分析與知識庫分析
2.1 引言
2.2 試題分析
2.3 知識庫分析
2.3.1 數(shù)據(jù)采集
2.3.2 知識庫覆蓋能力分析
2.4 系統(tǒng)架構(gòu)
2.5 本章小結(jié)
第3章 關(guān)鍵詞提取模塊
3.1 引言
3.2 問題預(yù)處理
3.3 問句關(guān)鍵詞提取
3.3.1 關(guān)鍵詞提取方法介紹
3.3.2 基于支持向量機(jī)的關(guān)鍵詞提取方法
3.4 材料關(guān)鍵詞提取
3.5 本章小結(jié)
第4章 基于檢索的答案生成模塊
4.1 引言
4.2 候選答案抽取
4.2.1 基于詞移距離的相似度計算方法
4.2.2 語句編碼模型介紹
4.2.3 基于循環(huán)神經(jīng)網(wǎng)絡(luò)的語句編碼模型
4.2.4 基于自注意力機(jī)制的語句編碼模型
4.2.5 問題-答案匹配方法
4.3 本章小結(jié)
第5章 實驗結(jié)果及分析
5.1 引言
5.2 評價指標(biāo)
5.3 關(guān)鍵詞提取實驗分析
5.3.1 問句關(guān)鍵詞提取實驗
5.3.2 材料關(guān)鍵詞提取實驗
5.4 語句編碼模型實驗分析
5.4.1 語句編碼模型訓(xùn)練
5.4.2 問句匹配實驗結(jié)果與分析
5.4.3 候選答案排序?qū)嶒?br> 5.5 自動答題系統(tǒng)性能分析
5.5.1 實驗設(shè)計及數(shù)據(jù)
5.5.2 實驗結(jié)果及分析
5.6 本章小結(jié)
結(jié)論
參考文獻(xiàn)
致謝
本文編號:3929570
【文章頁數(shù)】:58 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第1章 緒論
1.1 課題研究的背景及意義
1.2 國內(nèi)外相關(guān)技術(shù)研究現(xiàn)狀
1.2.1 自動問答系統(tǒng)研究現(xiàn)狀
1.2.2 自動答題系統(tǒng)研究現(xiàn)狀
1.2.3 自動問答系統(tǒng)的關(guān)鍵問題
1.3 本文的主要研究內(nèi)容
1.4 本文的組織結(jié)構(gòu)
第2章 試題分析與知識庫分析
2.1 引言
2.2 試題分析
2.3 知識庫分析
2.3.1 數(shù)據(jù)采集
2.3.2 知識庫覆蓋能力分析
2.4 系統(tǒng)架構(gòu)
2.5 本章小結(jié)
第3章 關(guān)鍵詞提取模塊
3.1 引言
3.2 問題預(yù)處理
3.3 問句關(guān)鍵詞提取
3.3.1 關(guān)鍵詞提取方法介紹
3.3.2 基于支持向量機(jī)的關(guān)鍵詞提取方法
3.4 材料關(guān)鍵詞提取
3.5 本章小結(jié)
第4章 基于檢索的答案生成模塊
4.1 引言
4.2 候選答案抽取
4.2.1 基于詞移距離的相似度計算方法
4.2.2 語句編碼模型介紹
4.2.3 基于循環(huán)神經(jīng)網(wǎng)絡(luò)的語句編碼模型
4.2.4 基于自注意力機(jī)制的語句編碼模型
4.2.5 問題-答案匹配方法
4.3 本章小結(jié)
第5章 實驗結(jié)果及分析
5.1 引言
5.2 評價指標(biāo)
5.3 關(guān)鍵詞提取實驗分析
5.3.1 問句關(guān)鍵詞提取實驗
5.3.2 材料關(guān)鍵詞提取實驗
5.4 語句編碼模型實驗分析
5.4.1 語句編碼模型訓(xùn)練
5.4.2 問句匹配實驗結(jié)果與分析
5.4.3 候選答案排序?qū)嶒?br> 5.5 自動答題系統(tǒng)性能分析
5.5.1 實驗設(shè)計及數(shù)據(jù)
5.5.2 實驗結(jié)果及分析
5.6 本章小結(jié)
結(jié)論
參考文獻(xiàn)
致謝
本文編號:3929570
本文鏈接:http://www.sikaile.net/kejilunwen/shengwushengchang/3929570.html
最近更新
教材專著