天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 搜索引擎論文 >

基于閱讀理解技術(shù)的問答系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)

發(fā)布時(shí)間:2020-05-31 07:48
【摘要】:面對(duì)互聯(lián)網(wǎng)上海量的信息,人們?cè)絹碓揭揽克阉饕娅@取信息。傳統(tǒng)的搜索引擎檢索返回與用戶查詢相關(guān)的網(wǎng)頁,用戶需要花費(fèi)大量時(shí)間和精力從中獲取所需信息。區(qū)別于傳統(tǒng)的搜索引擎,檢索式問答系統(tǒng)通過信息檢索技術(shù)獲取相關(guān)文檔,利用問答算法從相關(guān)文檔中抽取答案,其能夠?yàn)橛脩籼峁┖?jiǎn)短和準(zhǔn)確的結(jié)果。傳統(tǒng)的檢索式問答系統(tǒng)采用基于流水線方式的問答算法,該類問答算法只能捕捉輸入信息中的淺層語義關(guān)聯(lián),且存在著優(yōu)化成本高和優(yōu)化難度大等問題?紤]到目前端到端的閱讀理解模型訓(xùn)練簡(jiǎn)便、優(yōu)化效果直觀且能夠捕捉輸入信息的深層語義關(guān)聯(lián)等優(yōu)點(diǎn),本文設(shè)計(jì)并實(shí)現(xiàn)了一個(gè)基于閱讀理解技術(shù)的問答系統(tǒng)。對(duì)于本文設(shè)計(jì)并實(shí)現(xiàn)的問答系統(tǒng),其包含Web服務(wù)模塊、信息檢索模塊、中文預(yù)處理模塊、答案預(yù)測(cè)模塊和日志與存儲(chǔ)模塊五個(gè)模塊。其中,答案預(yù)測(cè)模塊的問答算法基于閱讀理解模型實(shí)現(xiàn)。特別地,針對(duì)目前閱讀理解模型難以滿足檢索式問答系統(tǒng)對(duì)問答算法計(jì)算效率的要求,且不能處理相關(guān)文檔中答案數(shù)量不固定的情況,本文設(shè)計(jì)了一個(gè)面向檢索式問答系統(tǒng)的閱讀理解模型(Reading Comprehension model for Retrieval-based Question Answering System,RQA-RC)。RQA-RC模型由問題編碼結(jié)構(gòu)、文檔編碼結(jié)構(gòu)、注意力機(jī)制和預(yù)測(cè)結(jié)構(gòu)組成?紤]到檢索式問答系統(tǒng)注重問答算法的計(jì)算效率和該問答場(chǎng)景中問答數(shù)據(jù)的特點(diǎn),本文設(shè)計(jì)并結(jié)合了基于雙向長(zhǎng)短期記憶網(wǎng)絡(luò)的問題編碼結(jié)構(gòu)和基于卷積神經(jīng)網(wǎng)絡(luò)的文檔編碼結(jié)構(gòu),使得模型在保持良好文本編碼效果的前提下顯著提升了計(jì)算效率?紤]到該問答場(chǎng)景中相關(guān)文檔的答案數(shù)量不固定,本文設(shè)計(jì)了一個(gè)基于序列標(biāo)注的預(yù)測(cè)結(jié)構(gòu)并提出了一種參考Focal Loss思想的損失函數(shù),使得模型能夠有效地處理相關(guān)文檔中任意數(shù)量的答案。實(shí)驗(yàn)結(jié)果表明,在面向檢索式問答系統(tǒng)的問答任務(wù)中,RQA-RC模型相比現(xiàn)有的閱讀理解模型,其在計(jì)算效率和F1值上具有明顯的提升。通過系統(tǒng)測(cè)試,本文自主設(shè)計(jì)和實(shí)現(xiàn)的問答系統(tǒng)各功能模塊均符合預(yù)期,系統(tǒng)非功能指標(biāo)符合應(yīng)用要求。
【圖文】:

示意圖,語義分析,向量,年代


同時(shí),隨著詞庫(kù)中詞數(shù)量的增長(zhǎng),詞向量將變得非常稀疏和巨大。不妨假逡逑設(shè)詞庫(kù)中一共存在N個(gè)詞,那么?{汽車,轎車,,蘋果,河流,太陽丨五個(gè)詞此時(shí)的逡逑one-hot向量如圖2-1所示。逡逑位置0邋兔1邋i2邋i3邋i4邋i5邋N逡逑詞語邋廠邐邐邐邐邐J逡逑|邐轎車邐I邐:逡逑:蘋果邐¥邐丨邐CL.CL.0...1...0...0...0邐i邋r逡逑!河流【邐丨邐…i逡逑?大陽邐:邐0邐0邋“邋?邋04邋*?邋0邋**?邋0邐“邋0邐_逡逑;v邐數(shù)據(jù)邐」逡逑圖2-】one-hot向量示意圖逡逑為解決該問題,從上個(gè)世紀(jì)90年代開始,隱含語義分析(Latent邋Semantic逡逑Analysis,邋LSA)[9]和主題模型(Latent邋Dirichlet邋Allocation,LDA)[U]相繼被提出。這些逡逑模型通過生成稠密的實(shí)數(shù)向量作為詞向量,這些低維稠密的詞向量解決了邋one-逡逑hot邋詞向量中邋“詞匯鴻溝”邋和維度爆炸等問題。邋2003邋年,邋Bengio邋利用神經(jīng)網(wǎng)絡(luò)訓(xùn)逡逑練詞向量,并首次將神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)參數(shù)和詞向量一起訓(xùn)練[121。2013年,Mikolov逡逑7逡逑

示意圖,結(jié)構(gòu)示意圖,自然語言處理,北京郵電大學(xué)


北京郵電大學(xué)工學(xué)碩士學(xué)位論文出了一種詞向量的計(jì)算方式word2vec。其中,word2vec較的效果使得詞向量逐漸進(jìn)入實(shí)用化階段,以下將詳細(xì)地介紹word2veC被廣泛地應(yīng)用于自然語言處理任務(wù)中,例如智能問答、要(Automatic邋Summarization)等領(lǐng)域。word2vec訓(xùn)練時(shí)依據(jù)邋CBOW(Continuous邋Bag-of-Words,邋C.BOW)和邋Skip-gi_am(Continkip-gram)兩種模型。給定訓(xùn)練語料[WpW^w;^...,wN],對(duì)于c需要指定上下文窗口的大。祝椋睿洌铮鳎撸螅椋濉<僭O(shè)Window_size窗口內(nèi)的詞分別有wt_2、Wty、wt+1和wt+2。基于如上信息,Cm的模型結(jié)構(gòu)示意圖如圖2-2和圖2-3所示。逡逑
【學(xué)位授予單位】:北京郵電大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2019
【分類號(hào)】:TP391.1

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 任夢(mèng)婷;王娟;阮佩姍;劉振盼;;影響高質(zhì)量網(wǎng)絡(luò)問答系統(tǒng)建設(shè)的因素[J];物流科技;2016年12期

2 武振國(guó);李艷翠;;植物病蟲害智能問答系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[J];農(nóng)業(yè)網(wǎng)絡(luò)信息;2017年01期

3 費(fèi)建軍;;智能問答系統(tǒng)中命名實(shí)體識(shí)別問題研究[J];數(shù)字技術(shù)與應(yīng)用;2017年07期

4 何秀;;智能問答系統(tǒng)的研究與設(shè)計(jì)[J];南方農(nóng)機(jī);2017年20期

5 張中峰;李秋丹;;社區(qū)問答系統(tǒng)研究綜述[J];計(jì)算機(jī)科學(xué);2010年11期

6 劉文華;康海燕;;領(lǐng)域問答系統(tǒng)生成器的研究[J];北京信息科技大學(xué)學(xué)報(bào)(自然科學(xué)版);2009年03期

7 張積賓;徐志明;王恒;潘啟樹;;面向大規(guī)模網(wǎng)絡(luò)數(shù)據(jù)的社會(huì)化問答系統(tǒng)[J];哈爾濱工業(yè)大學(xué)學(xué)報(bào);2008年12期

8 胡婕;陶宏才;;基于深度學(xué)習(xí)的領(lǐng)域問答系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J];成都信息工程大學(xué)學(xué)報(bào);2019年03期

9 徐雄;;基于深度學(xué)習(xí)的問答系統(tǒng)研究[J];湖北師范大學(xué)學(xué)報(bào)(自然科學(xué)版);2019年01期

10 吳靈慧;;問答系統(tǒng)研究綜述[J];科技傳播;2019年05期

相關(guān)會(huì)議論文 前10條

1 何靖;陳

本文編號(hào):2689532


資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/sousuoyinqinglunwen/2689532.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶378c3***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com