天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 搜索引擎論文 >

支付寶服務數(shù)據(jù)垂直搜索引擎研究暨用戶輸入處理模塊的設計與實現(xiàn)

發(fā)布時間:2021-07-30 17:53
  在支付寶服務體系的長期運營過程中,積累了大量的服務數(shù)據(jù),包括客服人員整理的服務知識點以及與客戶交流的服務聊天記錄等。然而,這海量的服務數(shù)據(jù)并沒有被加以利用。為提升整體服務質(zhì)量,降低服務成本,并同時支持不同的服務應用,本文針對支付寶服務應用對于搜索的需求以及服務數(shù)據(jù)的特點做了深入的研究,設計和構建了一套高效、穩(wěn)定、適應服務發(fā)展需求的垂直搜索引擎。并在此基礎上,對系統(tǒng)的核心模塊——用戶輸入處理模塊作了具體的實現(xiàn)。用戶輸入處理模塊主要對用戶輸入的查詢語句進行預處理操作,包括前端查詢解釋、分詞、關鍵詞提取、同義替換、緊密度標注以及二次查詢等操作。在這個過程中,本文結合N-gram模型,分詞詞性特點,編輯距離,余弦相似度,向量空間模型等算法,在分布式Hadoop計算平臺下,通過優(yōu)化模型計算以及結合算法間的邏輯操作,針對服務歷史數(shù)據(jù)進行數(shù)據(jù)計算,從而生成自有的停用詞表,挖掘出基于業(yè)務的同義詞庫,以及生成可用的單詞間緊密度信息。與此同時,本文針對短文本提出了一種有效地關鍵詞提取算法流程,在保證理解用戶查詢意圖的同時提取出用戶搜索的關鍵信息,從而提高了搜索的準確率和召回率。另外,針對用戶輸入處理模塊中... 

【文章來源】:中山大學廣東省 211工程院校 985工程院校 教育部直屬院校

【文章頁數(shù)】:96 頁

【學位級別】:碩士

【部分圖文】:

支付寶服務數(shù)據(jù)垂直搜索引擎研究暨用戶輸入處理模塊的設計與實現(xiàn)


圖3-1支付寶服務數(shù)據(jù)垂直搜索引擎——項目定位圖

服務數(shù)據(jù),查詢處理,用戶輸入,數(shù)據(jù)信息


圖 3-2 支付寶服務數(shù)據(jù)垂直搜索引擎——項目數(shù)據(jù)流圖從圖 3-2 可見,當用戶提交了一個查詢請求之后,系統(tǒng)將會對用戶輸入的查詢請求進行預處理操作。該輸入查詢處理操作需要讀取停用詞表、同義詞表以及N-gram 模型的數(shù)據(jù)信息,同時該處理過程的所有操作將會被記錄在查詢處理日

服務數(shù)據(jù),總體架構,基礎服務,搜索引擎


圖 3-3 支付寶服務數(shù)據(jù)垂直搜索引擎——總體架構圖3 中,清晰可見,本搜索引擎構建于 ISearch5 之上,頂層索請求,底層則是基于服務中心的原始基礎服務數(shù)據(jù)構建


本文編號:3311855

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/sousuoyinqinglunwen/3311855.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶dac67***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com