面向知識(shí)庫(kù)問(wèn)答的深度神經(jīng)網(wǎng)絡(luò)語(yǔ)義匹配方法研究
發(fā)布時(shí)間:2021-08-07 11:49
隨著互聯(lián)網(wǎng)的快速發(fā)展,可用信息量呈指數(shù)級(jí)增長(zhǎng),互聯(lián)網(wǎng)已成為人們獲取信息的重要途徑。雖然當(dāng)前的搜索引擎可以較好地幫助用戶在互聯(lián)網(wǎng)中搜索信息,但是也會(huì)返回大量與用戶需求不相關(guān)的結(jié)果。基于知識(shí)庫(kù)的自動(dòng)問(wèn)答系統(tǒng)指的是針對(duì)給出的自然語(yǔ)言形式問(wèn)題,通過(guò)利用自然語(yǔ)言處理技術(shù)在結(jié)構(gòu)化知識(shí)庫(kù)中進(jìn)行查詢、推理、匹配得到相應(yīng)答案。知識(shí)庫(kù)問(wèn)答系統(tǒng)不僅可以為用戶提供支持自然語(yǔ)言的友好人機(jī)交互方式,還可以精準(zhǔn)并高效地幫助用戶獲取到有效的信息。因而知識(shí)庫(kù)問(wèn)答是自然語(yǔ)言處理和信息檢索領(lǐng)域重要的研究方向。傳統(tǒng)基于符號(hào)的知識(shí)庫(kù)問(wèn)答方法往往難以解決文本的語(yǔ)義鴻溝問(wèn)題,基于向量空間建模的方法試圖用向量的形式解決該問(wèn)題,但該方法僅涉及淺層的語(yǔ)義表示。此外,與英文相比,中文的語(yǔ)法結(jié)構(gòu)和表述形式更為復(fù)雜和多變,所以中文知識(shí)庫(kù)問(wèn)答的研究面臨著更大的挑戰(zhàn)。針對(duì)以上情況,本文主要研究基于深度神經(jīng)網(wǎng)絡(luò)的文本語(yǔ)義學(xué)習(xí)與匹配,然后將其應(yīng)用于知識(shí)庫(kù)問(wèn)答中,即將問(wèn)答的過(guò)程視為問(wèn)句與知識(shí)庫(kù)語(yǔ)義表示的學(xué)習(xí)和匹配過(guò)程。主要研究?jī)?nèi)容如下:(1)針對(duì)文本語(yǔ)義的學(xué)習(xí)和匹配,提出一種帶注意力機(jī)制的長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)的文本語(yǔ)義匹配方法。該方法首先使用長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)和...
【文章來(lái)源】:中國(guó)工程物理研究院北京市
【文章頁(yè)數(shù)】:63 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖1-1基于語(yǔ)義解析的知識(shí)庫(kù)問(wèn)答示意圖??
因而該方法一般只適合在小規(guī)模范圍內(nèi)的應(yīng)用。隨著進(jìn)一步的發(fā)展,基于??問(wèn)答對(duì)等形式的語(yǔ)料條件下,研宂人員開(kāi)始采用弱監(jiān)督學(xué)習(xí)算法來(lái)解析問(wèn)句文本??以進(jìn)行知識(shí)庫(kù)問(wèn)答。如圖1-1所示為基于語(yǔ)義解析的知識(shí)庫(kù)問(wèn)答方法結(jié)構(gòu)示意圖,??對(duì)于問(wèn)句“你知道龍眼的生物目屬嗎??”,其首先將自然語(yǔ)言表達(dá)的問(wèn)句通過(guò)語(yǔ)??義解析模塊轉(zhuǎn)換為對(duì)應(yīng)的邏輯表達(dá)形式,這是一種可以表達(dá)整個(gè)文本語(yǔ)義的形式??和方法,常見(jiàn)的有lambda表達(dá)式和依存組合語(yǔ)義樹(shù)等,其類似于數(shù)據(jù)庫(kù)語(yǔ)言用??于數(shù)據(jù)庫(kù)中進(jìn)行搜索查詢一樣,這些邏輯表達(dá)形式可用在知識(shí)庫(kù)系統(tǒng)中進(jìn)行查詢、??推理、匹配,進(jìn)而得到問(wèn)題所對(duì)應(yīng)的答案。??Q:你知道龍眼的生物目屬嗎???;——I????1^??>??語(yǔ)義解析模塊??????知識(shí)庫(kù)???^?乂??語(yǔ)義查詢、?f?:??推理、匹配??^?A:無(wú)患子目????V?'??圖1-1基于語(yǔ)義解析的知識(shí)庫(kù)問(wèn)答示意圖??另一方面,基于信息檢索的方法則著重于對(duì)特征的提取,然后通過(guò)構(gòu)建模型??對(duì)候選答案進(jìn)行分類選擇。比如Yao等人[1()]通過(guò)利用依存分析技術(shù)對(duì)自然語(yǔ)言??問(wèn)句進(jìn)行解析從而得到相應(yīng)的依存分析樹(shù)和問(wèn)句所包含的實(shí)體,然后根據(jù)實(shí)體在??知識(shí)庫(kù)中找出對(duì)應(yīng)的主題圖(TopicGraph)。在得到主題圖之后
?/??圖1-3本文組織結(jié)構(gòu)示意圖??如圖1-3所示為本文的組織結(jié)構(gòu)示意圖,其分五個(gè)章節(jié)分別介紹碩士期間的??主要研究工作。第一章為緒論,第二章介紹一種基于深度神經(jīng)網(wǎng)絡(luò)的文本語(yǔ)義匹??配方法。第三章和第四章分別介紹面向知識(shí)庫(kù)問(wèn)答的問(wèn)句實(shí)體鏈指方法和基于深??度文本語(yǔ)義匹配的知識(shí)庫(kù)問(wèn)答方法。第五章為總結(jié)和展望。各章節(jié)的具體內(nèi)容安??排如下:??第一章緒論。本章首先介紹知識(shí)庫(kù)問(wèn)答的相關(guān)研究背景和研究意義,然后??對(duì)知識(shí)庫(kù)構(gòu)建技術(shù)、知識(shí)庫(kù)問(wèn)答研宄方法、文本語(yǔ)義匹配研究方法的現(xiàn)狀進(jìn)行介??紹,最后提出本文的研究目標(biāo)和內(nèi)容,并簡(jiǎn)要介紹論文的整體結(jié)構(gòu)安排。??第二章深度神經(jīng)網(wǎng)絡(luò)和文本語(yǔ)義匹配方法。本章首先對(duì)本文涉及的基礎(chǔ)技??術(shù)如循環(huán)神經(jīng)網(wǎng)絡(luò)、雙向長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)和注意力機(jī)制等內(nèi)容進(jìn)行簡(jiǎn)要介紹,然??后提出一個(gè)帶有注意力機(jī)制的Bi-LSTM文本語(yǔ)義匹配方法,最后介紹文本語(yǔ)義??匹配的實(shí)驗(yàn)設(shè)計(jì)和實(shí)驗(yàn)結(jié)果,并對(duì)相應(yīng)的實(shí)驗(yàn)方法和結(jié)果進(jìn)行分析。??第三章基于知識(shí)庫(kù)的二分類實(shí)體鏈指方法。本章首先介紹本文知識(shí)庫(kù)問(wèn)答??中實(shí)體鏈指數(shù)據(jù)集的構(gòu)建,然后通過(guò)特征工程來(lái)提取候選實(shí)體的統(tǒng)計(jì)特征,并構(gòu)??9??
【參考文獻(xiàn)】:
期刊論文
[1]深度文本匹配綜述[J]. 龐亮,蘭艷艷,徐君,郭嘉豐,萬(wàn)圣賢,程學(xué)旗. 計(jì)算機(jī)學(xué)報(bào). 2017(04)
[2]基于路徑與深度的同義詞詞林詞語(yǔ)相似度計(jì)算[J]. 陳宏朝,李飛,朱新華,馬潤(rùn)聰. 中文信息學(xué)報(bào). 2016(05)
[3]知識(shí)圖譜構(gòu)建技術(shù)綜述[J]. 劉嶠,李楊,段宏,劉瑤,秦志光. 計(jì)算機(jī)研究與發(fā)展. 2016(03)
碩士論文
[1]基于知識(shí)庫(kù)的自動(dòng)問(wèn)答關(guān)鍵技術(shù)研究[D]. 周博通.哈爾濱工業(yè)大學(xué) 2017
本文編號(hào):3327745
【文章來(lái)源】:中國(guó)工程物理研究院北京市
【文章頁(yè)數(shù)】:63 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖1-1基于語(yǔ)義解析的知識(shí)庫(kù)問(wèn)答示意圖??
因而該方法一般只適合在小規(guī)模范圍內(nèi)的應(yīng)用。隨著進(jìn)一步的發(fā)展,基于??問(wèn)答對(duì)等形式的語(yǔ)料條件下,研宂人員開(kāi)始采用弱監(jiān)督學(xué)習(xí)算法來(lái)解析問(wèn)句文本??以進(jìn)行知識(shí)庫(kù)問(wèn)答。如圖1-1所示為基于語(yǔ)義解析的知識(shí)庫(kù)問(wèn)答方法結(jié)構(gòu)示意圖,??對(duì)于問(wèn)句“你知道龍眼的生物目屬嗎??”,其首先將自然語(yǔ)言表達(dá)的問(wèn)句通過(guò)語(yǔ)??義解析模塊轉(zhuǎn)換為對(duì)應(yīng)的邏輯表達(dá)形式,這是一種可以表達(dá)整個(gè)文本語(yǔ)義的形式??和方法,常見(jiàn)的有lambda表達(dá)式和依存組合語(yǔ)義樹(shù)等,其類似于數(shù)據(jù)庫(kù)語(yǔ)言用??于數(shù)據(jù)庫(kù)中進(jìn)行搜索查詢一樣,這些邏輯表達(dá)形式可用在知識(shí)庫(kù)系統(tǒng)中進(jìn)行查詢、??推理、匹配,進(jìn)而得到問(wèn)題所對(duì)應(yīng)的答案。??Q:你知道龍眼的生物目屬嗎???;——I????1^??>??語(yǔ)義解析模塊??????知識(shí)庫(kù)???^?乂??語(yǔ)義查詢、?f?:??推理、匹配??^?A:無(wú)患子目????V?'??圖1-1基于語(yǔ)義解析的知識(shí)庫(kù)問(wèn)答示意圖??另一方面,基于信息檢索的方法則著重于對(duì)特征的提取,然后通過(guò)構(gòu)建模型??對(duì)候選答案進(jìn)行分類選擇。比如Yao等人[1()]通過(guò)利用依存分析技術(shù)對(duì)自然語(yǔ)言??問(wèn)句進(jìn)行解析從而得到相應(yīng)的依存分析樹(shù)和問(wèn)句所包含的實(shí)體,然后根據(jù)實(shí)體在??知識(shí)庫(kù)中找出對(duì)應(yīng)的主題圖(TopicGraph)。在得到主題圖之后
?/??圖1-3本文組織結(jié)構(gòu)示意圖??如圖1-3所示為本文的組織結(jié)構(gòu)示意圖,其分五個(gè)章節(jié)分別介紹碩士期間的??主要研究工作。第一章為緒論,第二章介紹一種基于深度神經(jīng)網(wǎng)絡(luò)的文本語(yǔ)義匹??配方法。第三章和第四章分別介紹面向知識(shí)庫(kù)問(wèn)答的問(wèn)句實(shí)體鏈指方法和基于深??度文本語(yǔ)義匹配的知識(shí)庫(kù)問(wèn)答方法。第五章為總結(jié)和展望。各章節(jié)的具體內(nèi)容安??排如下:??第一章緒論。本章首先介紹知識(shí)庫(kù)問(wèn)答的相關(guān)研究背景和研究意義,然后??對(duì)知識(shí)庫(kù)構(gòu)建技術(shù)、知識(shí)庫(kù)問(wèn)答研宄方法、文本語(yǔ)義匹配研究方法的現(xiàn)狀進(jìn)行介??紹,最后提出本文的研究目標(biāo)和內(nèi)容,并簡(jiǎn)要介紹論文的整體結(jié)構(gòu)安排。??第二章深度神經(jīng)網(wǎng)絡(luò)和文本語(yǔ)義匹配方法。本章首先對(duì)本文涉及的基礎(chǔ)技??術(shù)如循環(huán)神經(jīng)網(wǎng)絡(luò)、雙向長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)和注意力機(jī)制等內(nèi)容進(jìn)行簡(jiǎn)要介紹,然??后提出一個(gè)帶有注意力機(jī)制的Bi-LSTM文本語(yǔ)義匹配方法,最后介紹文本語(yǔ)義??匹配的實(shí)驗(yàn)設(shè)計(jì)和實(shí)驗(yàn)結(jié)果,并對(duì)相應(yīng)的實(shí)驗(yàn)方法和結(jié)果進(jìn)行分析。??第三章基于知識(shí)庫(kù)的二分類實(shí)體鏈指方法。本章首先介紹本文知識(shí)庫(kù)問(wèn)答??中實(shí)體鏈指數(shù)據(jù)集的構(gòu)建,然后通過(guò)特征工程來(lái)提取候選實(shí)體的統(tǒng)計(jì)特征,并構(gòu)??9??
【參考文獻(xiàn)】:
期刊論文
[1]深度文本匹配綜述[J]. 龐亮,蘭艷艷,徐君,郭嘉豐,萬(wàn)圣賢,程學(xué)旗. 計(jì)算機(jī)學(xué)報(bào). 2017(04)
[2]基于路徑與深度的同義詞詞林詞語(yǔ)相似度計(jì)算[J]. 陳宏朝,李飛,朱新華,馬潤(rùn)聰. 中文信息學(xué)報(bào). 2016(05)
[3]知識(shí)圖譜構(gòu)建技術(shù)綜述[J]. 劉嶠,李楊,段宏,劉瑤,秦志光. 計(jì)算機(jī)研究與發(fā)展. 2016(03)
碩士論文
[1]基于知識(shí)庫(kù)的自動(dòng)問(wèn)答關(guān)鍵技術(shù)研究[D]. 周博通.哈爾濱工業(yè)大學(xué) 2017
本文編號(hào):3327745
本文鏈接:http://www.sikaile.net/kejilunwen/zidonghuakongzhilunwen/3327745.html
最近更新
教材專著