基于知識圖譜的問答系統(tǒng)問句理解方法研究
發(fā)布時間:2021-08-19 23:26
從互聯(lián)網(wǎng)的海量數(shù)據(jù)中獲取信息已經(jīng)成為人們的基本需要。由于搜索引擎不能直接得到所需的答案,因此本文對基于知識圖譜的問答系統(tǒng)進行研究,旨在提出可以理解用戶以自然語言提出的問句,并返回一個簡潔答案的模型。在知識圖譜中,知識以三元組<實體,關(guān)系,實體>的方式進行存儲,因此基于知識圖譜的問答系統(tǒng)主要解決由三元組構(gòu)成的事實類問題。在問答系統(tǒng)中,準確理解用戶問句,需要理解多樣化的自然語言表述,這是本文的研究重點。根據(jù)問句信息的不同層次,本文將對問句的理解分為宏觀和微觀兩個部分。宏觀理解從句子層面進行,微觀理解則從實體層面和關(guān)系層面來開展。具體工作主要有:1.本文提出一個基于膠囊網(wǎng)絡(luò)的問句分類模型(Cap-net)。該模型能夠結(jié)合雙向LSTM和注意力機制,再加上膠囊網(wǎng)絡(luò),提取問句更多的特征。然后根據(jù)需要,將問句按照用戶意圖或者答案類型進行分類。2.本文提出一個基于語義相似性的實體鏈接和關(guān)系檢測模型。該模型使用卷積神經(jīng)網(wǎng)絡(luò),對問句和知識圖譜中的實體與關(guān)系進行向量化表示。在實體鏈接任務(wù)中,本文提出,將問句中識別出來的實體表述,通過實體-表述映射表,得到候選實體。然后通過本文提出基于語義相似性的...
【文章來源】:西華大學四川省
【文章頁數(shù)】:63 頁
【學位級別】:碩士
【部分圖文】:
CBOW模型
圖 2.2 知識圖譜示例Fig. 2.2 Knowledge Graph example圖 2.2 所示,當用戶在知識圖譜中查找實體“西華大學”,可以得到它的所在辦時間、簡稱和類別等信息。得到所在城市“成都”,可以在網(wǎng)絡(luò)中繼續(xù)查找關(guān)信息。這極大加快了檢索信息的速度。。15 年,杜亞軍等人對微博知識圖譜構(gòu)建方法進行了研究[46],將其分為實體提取、知識圖譜建立幾部分。從現(xiàn)實世界非結(jié)構(gòu)化數(shù)據(jù)中,提取出了實體和關(guān)系將其組合為知識三元組。本文的研究實質(zhì)上是在已有知識三元組的基礎(chǔ)上,將到對應(yīng)知識圖譜實體和關(guān)系上,得到能回答問句的三元組,也就得到了答案。義相似性模型文利用語義相似性模型來完成實體鏈接及關(guān)系檢測任務(wù)。計算文本相似度主要語法和句法結(jié)構(gòu)、基于語料庫的方法。于語法和句法結(jié)構(gòu)的文本語義相似性模型,通過對文本的語法分析,將其語法度與詞組語義相似度相結(jié)合,能夠計算不同詞組順序?qū)ξ谋镜挠绊,更好地?
基于知識圖譜的問句理解方法研究3.2 問句分類模型結(jié)構(gòu)深度學習的神經(jīng)網(wǎng)絡(luò)模型是使用不帶有方向的標量來表示句子,雖然近年來基于深度學習的方法在問句分類上有了許多成果。但是由于語言表達的復雜性,使用標量來表達問句具有一定的局限性。針對這一問題,結(jié)合問句分類的特點,本文提出了一種基于膠囊網(wǎng)絡(luò)(Capsule network)的問句分類模型(Cap-net)。膠囊網(wǎng)絡(luò)[50]能夠?qū)肆哭D(zhuǎn)化為帶有位置信息的矢量,更好地表示問句中的語義等信息。本文采用自然語言處理中常用的雙向 LSTM(Bi-LSTM),將問句轉(zhuǎn)化成標量,再傳入膠囊網(wǎng)絡(luò)中轉(zhuǎn)化成矢量,進行本文的問句分類研究。同時,由于問句中不同詞對于分類任務(wù)貢獻不同,這里引入詞級別的注意力機制,使分類模型能夠更關(guān)注對分類任務(wù)貢獻大的詞。
【參考文獻】:
期刊論文
[1]一種基于特征加權(quán)的文本相似度計算算法[J]. 邱先標,陳笑蓉. 貴州大學學報(自然科學版). 2018(01)
[2]基于中文知識圖譜的電商領(lǐng)域問答系統(tǒng)[J]. 杜澤宇,楊燕,賀樑. 計算機應(yīng)用與軟件. 2017(05)
[3]CLEQS——基于知識圖譜構(gòu)建的跨語言實體查詢系統(tǒng)[J]. 蘇永浩,張馳,程文亮,錢衛(wèi)寧. 計算機應(yīng)用. 2016(S1)
[4]中文短文本語法語義相似度算法[J]. 廖志芳,周國恩,李俊鋒,劉飛,蔡飛. 湖南大學學報(自然科學版). 2016(02)
[5]融合知識圖譜的查詢擴展模型及其穩(wěn)定性研究[J]. 郝林雪,張鵬,宋大為,候越先. 計算機科學與探索. 2017(01)
[6]一種面向多源知識圖譜的樣例查詢方法[J]. 湯楠,申德榮,寇月,聶鐵錚. 計算機研究與發(fā)展. 2015(S1)
[7]基于本體的航空領(lǐng)域問答系統(tǒng)[J]. 張克亮,李偉剛,王慧蘭. 中文信息學報. 2015(04)
[8]微博知識圖譜構(gòu)建方法研究[J]. 杜亞軍,吳越. 西華大學學報(自然科學版). 2015(01)
[9]實體鏈指技術(shù)研究進展[J]. 郭宇航,秦兵,劉挺,李生. 智能計算機與應(yīng)用. 2014(05)
[10]基于主動學習的中文問題分類數(shù)據(jù)集構(gòu)建[J]. 邱錫鵬,繆有棟,黃萱菁. 哈爾濱工業(yè)大學學報. 2012(05)
碩士論文
[1]基于深度學習的中文實體關(guān)系抽取方法研究[D]. 唐敏.西南交通大學 2018
[2]基于信息抽取的英文問句意圖分類[D]. 鐘世敏.西華大學 2018
[3]基于序列短文本的事件分類和話題追蹤[D]. 賀立言.西華大學 2018
[4]Web信息抽取中的若干關(guān)鍵問題研究[D]. 于永波.中國科學技術(shù)大學 2015
[5]基于潛在語義分析的學科知識圖譜構(gòu)建[D]. 孫小欣.華中師范大學 2013
本文編號:3352338
【文章來源】:西華大學四川省
【文章頁數(shù)】:63 頁
【學位級別】:碩士
【部分圖文】:
CBOW模型
圖 2.2 知識圖譜示例Fig. 2.2 Knowledge Graph example圖 2.2 所示,當用戶在知識圖譜中查找實體“西華大學”,可以得到它的所在辦時間、簡稱和類別等信息。得到所在城市“成都”,可以在網(wǎng)絡(luò)中繼續(xù)查找關(guān)信息。這極大加快了檢索信息的速度。。15 年,杜亞軍等人對微博知識圖譜構(gòu)建方法進行了研究[46],將其分為實體提取、知識圖譜建立幾部分。從現(xiàn)實世界非結(jié)構(gòu)化數(shù)據(jù)中,提取出了實體和關(guān)系將其組合為知識三元組。本文的研究實質(zhì)上是在已有知識三元組的基礎(chǔ)上,將到對應(yīng)知識圖譜實體和關(guān)系上,得到能回答問句的三元組,也就得到了答案。義相似性模型文利用語義相似性模型來完成實體鏈接及關(guān)系檢測任務(wù)。計算文本相似度主要語法和句法結(jié)構(gòu)、基于語料庫的方法。于語法和句法結(jié)構(gòu)的文本語義相似性模型,通過對文本的語法分析,將其語法度與詞組語義相似度相結(jié)合,能夠計算不同詞組順序?qū)ξ谋镜挠绊,更好地?
基于知識圖譜的問句理解方法研究3.2 問句分類模型結(jié)構(gòu)深度學習的神經(jīng)網(wǎng)絡(luò)模型是使用不帶有方向的標量來表示句子,雖然近年來基于深度學習的方法在問句分類上有了許多成果。但是由于語言表達的復雜性,使用標量來表達問句具有一定的局限性。針對這一問題,結(jié)合問句分類的特點,本文提出了一種基于膠囊網(wǎng)絡(luò)(Capsule network)的問句分類模型(Cap-net)。膠囊網(wǎng)絡(luò)[50]能夠?qū)肆哭D(zhuǎn)化為帶有位置信息的矢量,更好地表示問句中的語義等信息。本文采用自然語言處理中常用的雙向 LSTM(Bi-LSTM),將問句轉(zhuǎn)化成標量,再傳入膠囊網(wǎng)絡(luò)中轉(zhuǎn)化成矢量,進行本文的問句分類研究。同時,由于問句中不同詞對于分類任務(wù)貢獻不同,這里引入詞級別的注意力機制,使分類模型能夠更關(guān)注對分類任務(wù)貢獻大的詞。
【參考文獻】:
期刊論文
[1]一種基于特征加權(quán)的文本相似度計算算法[J]. 邱先標,陳笑蓉. 貴州大學學報(自然科學版). 2018(01)
[2]基于中文知識圖譜的電商領(lǐng)域問答系統(tǒng)[J]. 杜澤宇,楊燕,賀樑. 計算機應(yīng)用與軟件. 2017(05)
[3]CLEQS——基于知識圖譜構(gòu)建的跨語言實體查詢系統(tǒng)[J]. 蘇永浩,張馳,程文亮,錢衛(wèi)寧. 計算機應(yīng)用. 2016(S1)
[4]中文短文本語法語義相似度算法[J]. 廖志芳,周國恩,李俊鋒,劉飛,蔡飛. 湖南大學學報(自然科學版). 2016(02)
[5]融合知識圖譜的查詢擴展模型及其穩(wěn)定性研究[J]. 郝林雪,張鵬,宋大為,候越先. 計算機科學與探索. 2017(01)
[6]一種面向多源知識圖譜的樣例查詢方法[J]. 湯楠,申德榮,寇月,聶鐵錚. 計算機研究與發(fā)展. 2015(S1)
[7]基于本體的航空領(lǐng)域問答系統(tǒng)[J]. 張克亮,李偉剛,王慧蘭. 中文信息學報. 2015(04)
[8]微博知識圖譜構(gòu)建方法研究[J]. 杜亞軍,吳越. 西華大學學報(自然科學版). 2015(01)
[9]實體鏈指技術(shù)研究進展[J]. 郭宇航,秦兵,劉挺,李生. 智能計算機與應(yīng)用. 2014(05)
[10]基于主動學習的中文問題分類數(shù)據(jù)集構(gòu)建[J]. 邱錫鵬,繆有棟,黃萱菁. 哈爾濱工業(yè)大學學報. 2012(05)
碩士論文
[1]基于深度學習的中文實體關(guān)系抽取方法研究[D]. 唐敏.西南交通大學 2018
[2]基于信息抽取的英文問句意圖分類[D]. 鐘世敏.西華大學 2018
[3]基于序列短文本的事件分類和話題追蹤[D]. 賀立言.西華大學 2018
[4]Web信息抽取中的若干關(guān)鍵問題研究[D]. 于永波.中國科學技術(shù)大學 2015
[5]基于潛在語義分析的學科知識圖譜構(gòu)建[D]. 孫小欣.華中師范大學 2013
本文編號:3352338
本文鏈接:http://www.sikaile.net/kejilunwen/shengwushengchang/3352338.html
最近更新
教材專著