自動(dòng)問(wèn)答系統(tǒng)的研究與應(yīng)用
發(fā)布時(shí)間:2017-10-05 02:37
本文關(guān)鍵詞:自動(dòng)問(wèn)答系統(tǒng)的研究與應(yīng)用
更多相關(guān)文章: 自動(dòng)問(wèn)答 問(wèn)題分類 中文分詞 關(guān)鍵詞擴(kuò)展 答案抽取
【摘要】:當(dāng)今是一個(gè)互聯(lián)網(wǎng)的時(shí)代,也是一個(gè)信息爆炸的時(shí)代,用戶的檢索需求正在逐漸地發(fā)生變化。現(xiàn)有的搜索引擎一般只提供基于關(guān)鍵字組合的查詢,根據(jù)用戶輸入的查詢條件返回一個(gè)包含關(guān)鍵字或滿足查詢查詢條件的排序的網(wǎng)頁(yè)集,無(wú)法滿足精確搜索的需求;谧匀徽Z(yǔ)言處理技術(shù)的問(wèn)答系統(tǒng)是對(duì)傳統(tǒng)搜索引擎的一種改進(jìn)。問(wèn)答系統(tǒng)輸入的是以自然語(yǔ)言形式表達(dá)的問(wèn)句,通過(guò)提取問(wèn)句中的查詢信息,解析用戶的查詢意圖,然后根據(jù)查詢意圖從文檔中精準(zhǔn)定位答案所在,最終將自然語(yǔ)言形式的答案抽取出來(lái)返回給用戶,而不僅是將問(wèn)題的答案文檔返回給用戶。這不僅提高了檢索的精確度還更好地滿足了用戶的檢索體驗(yàn)。 本文的主要工作是對(duì)自動(dòng)問(wèn)答系統(tǒng)及其應(yīng)用進(jìn)行研究。首先給出一種自動(dòng)問(wèn)答系統(tǒng)的整體設(shè)計(jì)方案,然后對(duì)其中的問(wèn)題分類、關(guān)鍵詞擴(kuò)展和答案抽取三個(gè)核心模塊進(jìn)行了詳細(xì)設(shè)計(jì)和算法改進(jìn)。在問(wèn)題分類模塊,在分析現(xiàn)有分詞和分類模型的基礎(chǔ)上,提出一種樸素貝葉斯和SVM(Support Vector Machine)相結(jié)合的問(wèn)題分類算法;在關(guān)鍵詞擴(kuò)展模塊,在總結(jié)抽取流程的基礎(chǔ)上提出一種知網(wǎng)和同義詞詞典相結(jié)合的關(guān)鍵詞擴(kuò)展算法;在答案抽取模塊,提出一種基于語(yǔ)義依存關(guān)系的答案抽取算法。最后,給出了一個(gè)自動(dòng)問(wèn)答系統(tǒng)的應(yīng)用實(shí)例,即基于Nginx,擴(kuò)展Nginx原有的指令集并將問(wèn)答處理部分封裝成可動(dòng)態(tài)加載的模塊,在此基礎(chǔ)上實(shí)現(xiàn)了一個(gè)可應(yīng)用于實(shí)用的自動(dòng)問(wèn)答系統(tǒng)服務(wù)端。
【關(guān)鍵詞】:自動(dòng)問(wèn)答 問(wèn)題分類 中文分詞 關(guān)鍵詞擴(kuò)展 答案抽取
【學(xué)位授予單位】:北京郵電大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類號(hào)】:TP391.1
【目錄】:
- 摘要4-5
- abstract5-9
- 第一章 緒論9-13
- 1.1 課題的研究背景和意義9-10
- 1.2 國(guó)內(nèi)外相關(guān)研究工作10-12
- 1.3 本文研究目標(biāo)及主要研究?jī)?nèi)容12
- 1.4 本文組織結(jié)構(gòu)12-13
- 第二章 關(guān)鍵技術(shù)介紹13-17
- 2.1 問(wèn)題分類13-14
- 2.2 關(guān)鍵詞擴(kuò)展與抽取14-15
- 2.3 答案抽取15-17
- 第三章 需求分析與整體設(shè)計(jì)17-20
- 3.1 需求分析17-18
- 3.2 系統(tǒng)整體設(shè)計(jì)18-19
- 3.2.1 系統(tǒng)整體設(shè)計(jì)圖18
- 3.2.2 系統(tǒng)整體流程18-19
- 3.3 本章小結(jié)19-20
- 第四章 系統(tǒng)詳細(xì)設(shè)計(jì)20-42
- 4.1 問(wèn)題分類模塊20-29
- 4.1.1 文本預(yù)處理與分詞20-21
- 4.1.2 基于互信息的統(tǒng)計(jì)分詞方法21
- 4.1.3 基于字典的分詞方法21-23
- 4.1.4 基于隱馬爾科夫模型的分詞方法23
- 4.1.5 基于規(guī)則的問(wèn)題分類23-25
- 4.1.6 樸素貝葉斯分類25-27
- 4.1.7 一種樸素貝葉斯和SVM相結(jié)合的分類方法27-29
- 4.2 關(guān)鍵詞擴(kuò)展模塊29-34
- 4.2.1 去停用詞29-30
- 4.2.2 關(guān)鍵詞抽取30
- 4.2.3 基于同義詞詞典的關(guān)鍵詞擴(kuò)展30-31
- 4.2.4 基于知網(wǎng)的關(guān)鍵詞擴(kuò)展31-33
- 4.2.5 兩者相結(jié)合的關(guān)鍵詞擴(kuò)展33-34
- 4.3 答案抽取模塊34-42
- 4.3.1 文本索引設(shè)計(jì)34-35
- 4.3.2 文檔檢索模型35-36
- 4.3.3 答案抽取方法36-37
- 4.3.4 答案抽取一般流程37-38
- 4.3.5 基于語(yǔ)義依存關(guān)系的答案抽取方法38-42
- 第五章 應(yīng)用實(shí)例--基于Nginx的自動(dòng)問(wèn)答系統(tǒng)42-52
- 5.1 Nginx簡(jiǎn)介42-43
- 5.2 基于Nginx的自動(dòng)問(wèn)答系統(tǒng)的服務(wù)端的實(shí)現(xiàn)43-48
- 5.3 處理過(guò)程示例48-50
- 5.4 系統(tǒng)效果評(píng)測(cè)50-52
- 第六章 總結(jié)與展望52-53
- 6.1 總結(jié)52
- 6.2 展望52-53
- 參考文獻(xiàn)53-57
- 致謝57
【參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前1條
1 張亮;王樹梅;黃河燕;張孝飛;;面向中文問(wèn)答系統(tǒng)的問(wèn)句句法分析[J];山東大學(xué)學(xué)報(bào)(理學(xué)版);2006年03期
,本文編號(hào):974337
本文鏈接:http://www.sikaile.net/kejilunwen/sousuoyinqinglunwen/974337.html
最近更新
教材專著