支付寶服務數(shù)據(jù)垂直搜索引擎研究暨用戶輸入處理模塊的設計與實現(xiàn)
發(fā)布時間:2021-07-30 17:53
在支付寶服務體系的長期運營過程中,積累了大量的服務數(shù)據(jù),包括客服人員整理的服務知識點以及與客戶交流的服務聊天記錄等。然而,這海量的服務數(shù)據(jù)并沒有被加以利用。為提升整體服務質(zhì)量,降低服務成本,并同時支持不同的服務應用,本文針對支付寶服務應用對于搜索的需求以及服務數(shù)據(jù)的特點做了深入的研究,設計和構建了一套高效、穩(wěn)定、適應服務發(fā)展需求的垂直搜索引擎。并在此基礎上,對系統(tǒng)的核心模塊——用戶輸入處理模塊作了具體的實現(xiàn)。用戶輸入處理模塊主要對用戶輸入的查詢語句進行預處理操作,包括前端查詢解釋、分詞、關鍵詞提取、同義替換、緊密度標注以及二次查詢等操作。在這個過程中,本文結合N-gram模型,分詞詞性特點,編輯距離,余弦相似度,向量空間模型等算法,在分布式Hadoop計算平臺下,通過優(yōu)化模型計算以及結合算法間的邏輯操作,針對服務歷史數(shù)據(jù)進行數(shù)據(jù)計算,從而生成自有的停用詞表,挖掘出基于業(yè)務的同義詞庫,以及生成可用的單詞間緊密度信息。與此同時,本文針對短文本提出了一種有效地關鍵詞提取算法流程,在保證理解用戶查詢意圖的同時提取出用戶搜索的關鍵信息,從而提高了搜索的準確率和召回率。另外,針對用戶輸入處理模塊中...
【文章來源】:中山大學廣東省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:96 頁
【學位級別】:碩士
【部分圖文】:
圖3-1支付寶服務數(shù)據(jù)垂直搜索引擎——項目定位圖
圖 3-2 支付寶服務數(shù)據(jù)垂直搜索引擎——項目數(shù)據(jù)流圖從圖 3-2 可見,當用戶提交了一個查詢請求之后,系統(tǒng)將會對用戶輸入的查詢請求進行預處理操作。該輸入查詢處理操作需要讀取停用詞表、同義詞表以及N-gram 模型的數(shù)據(jù)信息,同時該處理過程的所有操作將會被記錄在查詢處理日
圖 3-3 支付寶服務數(shù)據(jù)垂直搜索引擎——總體架構圖3 中,清晰可見,本搜索引擎構建于 ISearch5 之上,頂層索請求,底層則是基于服務中心的原始基礎服務數(shù)據(jù)構建
本文編號:3311855
【文章來源】:中山大學廣東省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:96 頁
【學位級別】:碩士
【部分圖文】:
圖3-1支付寶服務數(shù)據(jù)垂直搜索引擎——項目定位圖
圖 3-2 支付寶服務數(shù)據(jù)垂直搜索引擎——項目數(shù)據(jù)流圖從圖 3-2 可見,當用戶提交了一個查詢請求之后,系統(tǒng)將會對用戶輸入的查詢請求進行預處理操作。該輸入查詢處理操作需要讀取停用詞表、同義詞表以及N-gram 模型的數(shù)據(jù)信息,同時該處理過程的所有操作將會被記錄在查詢處理日
圖 3-3 支付寶服務數(shù)據(jù)垂直搜索引擎——總體架構圖3 中,清晰可見,本搜索引擎構建于 ISearch5 之上,頂層索請求,底層則是基于服務中心的原始基礎服務數(shù)據(jù)構建
本文編號:3311855
本文鏈接:http://www.sikaile.net/kejilunwen/sousuoyinqinglunwen/3311855.html
最近更新
教材專著