基于用戶意圖和句法角色的問句相似度計算研究
本文關(guān)鍵詞:基于用戶意圖和句法角色的問句相似度計算研究
更多相關(guān)文章: FAQs問答系統(tǒng) 詞語相似度 問句相似度 問句分類 語義相似度
【摘要】:隨著信息化社會的發(fā)展,信息爆炸性的增長,搜索引擎技術(shù)的出現(xiàn)使人們能夠快速的獲取到信息。但是,傳統(tǒng)的搜索引擎也存在其固有的缺陷,用戶只能通過關(guān)鍵詞進行檢索,而關(guān)鍵詞并不能充分表達用戶的搜索意圖,而且讓用戶從返回的大量包含關(guān)鍵詞的結(jié)果中挑選可能的答案,難以給用戶帶來更好地體驗。為了解決這些問題,,自動問答系統(tǒng)被提出。用戶直接向問答系統(tǒng)提問,系統(tǒng)返回簡單直接的答案,為用戶節(jié)省了大量的時間,同時帶來了更好的體驗。 在基于常用問題庫(FAQs)的自動問答系統(tǒng)中,問句的相似度計算是其最重要的一環(huán),決定著整個問答系統(tǒng)效果的好壞,因此,本文重點對其進行了研究。論文的主要工作如下: (1)傳統(tǒng)基于《知網(wǎng)》的詞語相似度計算方法忽略了反義詞間的關(guān)系,而這種處理方式會導(dǎo)致兩個表達截然相反意思的問句具有很高的問句相似度。并且,基于《知網(wǎng)》的詞語相似度計算方法,對語義詞典依賴性很強,而對于層出不窮的網(wǎng)絡(luò)新詞和舊詞新意問題則束手無策。為了解決這些問題,本文采用了一種考慮反義和對義關(guān)系的詞語相似度計算方法,同時融合了基于統(tǒng)計的方法,解決這些問題。 (2)在傳統(tǒng)的問答系統(tǒng)檢索模型中,相似度是其考慮的核心因素,F(xiàn)AQ之間都是相互獨立的,返回相似度最高的問句對應(yīng)的答案給用戶,此時,忽略了用戶其他可能的意圖,無法滿足用戶的多樣性需求。因此,本文對問句匹配返回的結(jié)果進行意圖分類,按照意圖分組返回給用戶,滿足用戶的多樣性需求,同時又將其應(yīng)用到問句相似度計算中,提高問句相似度計算的準確性。 (3)本文設(shè)計一種新的問句相似度計算方法,在基于詞語語義特征的基礎(chǔ)上,使用問句意圖特征和句法角色特征,分別解決用戶意圖多樣性和問句語義相似度高而問句表達意思不同的問題,提高了問句匹配的準確性,并且通過實驗驗證了該方法的有效性。 (4)基于以上相關(guān)研究,構(gòu)建了一個基于FAQs的自動問答系統(tǒng)的原型,并對相關(guān)模塊進行了改進,為今后的應(yīng)用和進一步的研究提供了一個平臺。
【關(guān)鍵詞】:FAQs問答系統(tǒng) 詞語相似度 問句相似度 問句分類 語義相似度
【學(xué)位授予單位】:青島理工大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2014
【分類號】:TP391.1
【目錄】:
- 摘要8-9
- Abstract9-11
- 第1章 緒論11-17
- 1.1 研究的背景和意義11-12
- 1.2 國內(nèi)外研究現(xiàn)狀12-14
- 1.3 本文工作簡介14-17
- 1.3.1 本文研究內(nèi)容14-15
- 1.3.2 本文組織結(jié)構(gòu)15-17
- 第2章 相關(guān)技術(shù)簡介17-31
- 2.1 詞語相似度計算方法17-22
- 2.1.1 基于語義詞典的方法17-20
- 2.1.2 基于大規(guī)模語料統(tǒng)計的方法20-22
- 2.1.3 兩種方法比較22
- 2.2 問句相似度計算方法22-27
- 2.2.1 詞語語義方法22-23
- 2.2.2 詞語重疊方法23-24
- 2.2.3 向量空間方法24
- 2.2.4 基于句法的方法24-27
- 2.3 層次分類27-29
- 2.3.1 全局分類方法27-28
- 2.3.2 自上而下的分類方法28
- 2.3.3 收縮分類方法28-29
- 2.4 用戶意圖29-30
- 2.5 本章小結(jié)30-31
- 第3章 詞語相似度計算31-36
- 3.1 引言31
- 3.2 詞語相似度計算方法31-33
- 3.3 實驗結(jié)果及分析33-35
- 3.4 本章小結(jié)35-36
- 第4章 基于意圖的問句分類36-41
- 4.1 引言36
- 4.2 用戶意圖36-39
- 4.2.1 意圖類別37-38
- 4.2.2 分類方法38-39
- 4.3 實驗結(jié)果及分析39-40
- 4.4 本章小結(jié)40-41
- 第5章 基于意圖和句法角色的問句相似度計算41-48
- 5.1 引言41-42
- 5.2 問句相似度方法42-45
- 5.2.1 問句語義相似度42-43
- 5.2.2 問句意圖類型相似度43
- 5.2.3 句法角色相似度43-44
- 5.2.4 融合三種特征問句相似度方法44-45
- 5.3 實驗結(jié)果及分析45-47
- 5.4 本章小結(jié)47-48
- 第6章 自動問答系統(tǒng)原型48-61
- 6.1 系統(tǒng)總體架構(gòu)48-49
- 6.2 系統(tǒng)流程49-50
- 6.3 系統(tǒng)功能模塊設(shè)計與實現(xiàn)50-55
- 6.3.1 問答模塊50-54
- 6.3.2 知識庫維護模塊54-55
- 6.4 數(shù)據(jù)庫設(shè)計實現(xiàn)55-56
- 6.5 Web Service 接口56-57
- 6.6 系統(tǒng)展示57-60
- 6.6.1 系統(tǒng)交互頁面截圖57
- 6.6.2 系統(tǒng)寒暄演示57-58
- 6.6.3 問答效果演示58-59
- 6.6.4 系統(tǒng)維護模塊59-60
- 6.7 本章小結(jié)60-61
- 第7章 總結(jié)與展望61-63
- 參考文獻63-66
- 攻讀碩士學(xué)位期間取得成果66-67
- 致謝67
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 李偉;;中文語句相似度計算的方法初探[J];蘭州工業(yè)高等?茖W(xué)校學(xué)報;2009年04期
2 蘭美輝;任友俊;徐堅;高煒;;k-部排序本體相似度計算[J];計算機應(yīng)用;2012年04期
3 詹志建;梁麗娜;楊小平;;基于百度百科的詞語相似度計算[J];計算機科學(xué);2013年06期
4 田芳;;基于詞語情感傾向的問句相似度計算[J];安慶師范學(xué)院學(xué)報(自然科學(xué)版);2014年02期
5 李鋒,周凱波,馮珊;基于統(tǒng)計特征的屬性相似度計算模型[J];華中科技大學(xué)學(xué)報(自然科學(xué)版);2005年06期
6 李仲生;王家琴;;基于本體的上層概念間相似度計算的研究[J];科學(xué)技術(shù)與工程;2007年10期
7 智慧來;智東杰;劉宗田;;基于概念格的概念相似度計算[J];計算機科學(xué);2008年09期
8 賈宗福;王知非;;中文句子相似度計算的研究[J];科技信息;2009年11期
9 袁正午;李玉森;張雪英;;基于屬性的文本相似度計算算法改進[J];計算機工程;2009年17期
10 鄧林;李斌;鄭南;;基于本體相似度計算的研究[J];電腦知識與技術(shù);2010年13期
中國重要會議論文全文數(shù)據(jù)庫 前10條
1 劉磊;張桂平;蔡東風(fēng);季鐸;;基于語義預(yù)測的雙語術(shù)語相似度計算[A];第四屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議論文集(上)[C];2008年
2 郭麗;蔡東風(fēng);季鐸;白宇;;統(tǒng)計與語義相融合的詞語相似度計算[A];第四屆全國學(xué)生計算語言學(xué)研討會會議論文集[C];2008年
3 吳志雄;;不精確數(shù)據(jù)的相似度計算[A];邏輯學(xué)及其應(yīng)用研究——第四屆全國邏輯系統(tǒng)、智能科學(xué)與信息科學(xué)學(xué)術(shù)會議論文集[C];2008年
4 王凱;李紹穩(wěn);張友華;劉超;;缺值背景中的粗糙形式概念相似度計算理論與方法[A];中國農(nóng)業(yè)工程學(xué)會電氣信息與自動化專業(yè)委員會、中國電機工程學(xué)會農(nóng)村電氣化分會科技與教育專委會2010年學(xué)術(shù)年會論文摘要[C];2010年
5 陳立;宋自林;鄭世明;張英;;基于本體的概念相似度計算研究[A];江蘇省系統(tǒng)工程學(xué)會第十一屆學(xué)術(shù)年會論文集[C];2009年
6 車萬翔;劉挺;秦兵;李生;;面向雙語句對檢索的漢語句子相似度計算[A];語言計算與基于內(nèi)容的文本處理——全國第七屆計算語言學(xué)聯(lián)合學(xué)術(shù)會議論文集[C];2003年
7 郭文宏;范學(xué)峰;;基于語義詞典和本體知識的概念相似度計算[A];2008'中國信息技術(shù)與應(yīng)用學(xué)術(shù)論壇論文集(二)[C];2008年
8 宋彥;張桂平;蔡東風(fēng);;基于N-gram的句子相似度計算技術(shù)[A];內(nèi)容計算的研究與應(yīng)用前沿——第九屆全國計算語言學(xué)學(xué)術(shù)會議論文集[C];2007年
9 關(guān)毅;王曉龍;王強;;論系統(tǒng)相似的度量[A];全國第八屆計算語言學(xué)聯(lián)合學(xué)術(shù)會議(JSCL-2005)論文集[C];2005年
10 林民;宋柔;;基于結(jié)構(gòu)描述的漢字字形相似度計算[A];第三屆學(xué)生計算語言學(xué)研討會論文集[C];2006年
中國重要報紙全文數(shù)據(jù)庫 前1條
1 海量智能計算技術(shù)研究中心 霍剛;新興技術(shù)為互聯(lián)網(wǎng)加速[N];計算機世界;2007年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前3條
1 王秀紅;文本相似度計算核函數(shù)的構(gòu)造及其在分布式信息檢索中的應(yīng)用研究[D];江蘇大學(xué);2012年
2 劉磊;概念內(nèi)涵屬性計算研究[D];上海交通大學(xué);2011年
3 任磊;推薦系統(tǒng)關(guān)鍵技術(shù)研究[D];華東師范大學(xué);2012年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 薛慧芳;句子相似度計算理論及應(yīng)用研究[D];西北大學(xué);2011年
2 張玉娟;基于《知網(wǎng)》的句子相似度計算的研究[D];中國地質(zhì)大學(xué)(北京);2006年
3 王石穎;基于情景框架和依存樹的突發(fā)事件相似度計算[D];大連理工大學(xué);2013年
4 張猛;基于話題的事件相似度計算[D];河北大學(xué);2014年
5 張福華;本體自動生成中詞匯相似度計算的研究[D];大連海事大學(xué);2008年
6 李國佳;漢語全文相似度計算的研究及應(yīng)用[D];電子科技大學(xué);2011年
7 孫鴻偉;基于相似度計算的編程題自動評判方法研究[D];哈爾濱工程大學(xué);2011年
8 郭勇;基于《知網(wǎng)》的詞語相似度計算研究及應(yīng)用[D];湖南大學(xué);2012年
9 劉俊;基于依存關(guān)系的漢語復(fù)句內(nèi)分句的相似度計算[D];華中師范大學(xué);2014年
10 唐琦;基于語義分析的句子相似度計算研究[D];華北電力大學(xué)(北京);2009年
本文編號:973517
本文鏈接:http://www.sikaile.net/kejilunwen/sousuoyinqinglunwen/973517.html