天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 搜索引擎論文 >

基于Internet的問答系統答案抽取方法研究與實現

發(fā)布時間:2017-09-20 22:37

  本文關鍵詞:基于Internet的問答系統答案抽取方法研究與實現


  更多相關文章: 問答系統 網頁信息抽取 答案抽取 中文問句相似度


【摘要】:隨著Internet的快速發(fā)展,互聯網上的知識資源也在不斷的膨脹。然而,網頁如此繁雜以至于人們無法快速獲取自己想要的信息。搜索引擎的出現,雖然在很大程度上緩解了這個問題,但是效果卻不能令人滿意。人們對于快速獲取信息的強烈需求,使得越來越多的人投入到自動問答系統的研究中。自動問答系統企圖不借助任何人力,利用自然語言理解、信息檢索、信息抽取等技術,以自動化的方式回答用戶的問題?紤]到當今問答系統在網絡上的新發(fā)展,同時也考慮到構建一個開放領域問答系統的復雜性與系統性,本文將主要研究網頁信息抽取、中文問句相似度等。本文試圖通過這些方面的研究,為受限領域問答系統做支持,從而實現從網絡抽取答案的目標。本研究基于通常的網頁抽取方法基礎上,提出了一種基于“DOM模板與頁面特征信息綜合抽取”的方法,具體是從百度知道等網站抽取出用戶提問的候選問題及其對應答案集,這相當于將FAQ庫從本地擴展到了Internet,增加了知識的廣度與范圍,使受限領域問答系統不再局限于特定領域知識的問答。然后,利用中文問句相似度計算等思想找到最相似的問句對應的答案返回給用戶,從而實現受限領域的自動回答。本文從基于Internet的問答系統研究的相關背景入手,首先闡述了研究的基礎平臺,接著詳細的分析了網頁信息抽取與中文文件相似度的計算,最后重點的對答案抽取系統做了相關實現。
【關鍵詞】:問答系統 網頁信息抽取 答案抽取 中文問句相似度
【學位授予單位】:浙江工業(yè)大學
【學位級別】:碩士
【學位授予年份】:2014
【分類號】:TP391.1
,

本文編號:890837

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/sousuoyinqinglunwen/890837.html


Copyright(c)文論論文網All Rights Reserved | 網站地圖 |

版權申明:資料由用戶ef335***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com