天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 社科論文 > 圖書檔案論文 >

基于LDA的文本推薦算法的研究及在文獻檢索的應用

發(fā)布時間:2024-02-23 15:11

    伴隨著IT和互聯(lián)網的發(fā)展,人類所面臨的網絡信息正在呈現(xiàn)出爆炸式的增長。因此如何從大量的文本信息中屏蔽掉無用信息并獲取目標信息,一直是研究自然語言處理問題的熱點話題。目前在文本處理領域存在的一個基本問題在于如何量化描述文本的特征,而量化文本特征的優(yōu)劣很大程度上是由文本相似度的計算直接決定,這也是聚類、推薦和基于內容等方法的基石。因此本文利用LDA主題模型來量化描述文本的特征,結合文本自身所蘊含的潛在主題信息來提高文本相似度計算的精度,并在圖書館文獻檢索領域開展基于LDA模型檢索方法的應用研究。本文主要工作包括以下三個方面:第一、提出了一種基于LDA主題模型的文本相似度計算方法。該方法利用LDA模型為文本建模,利用MCMC中的Gibbs抽樣方法,間接計算模型參數(shù),挖掘出文本與主題的關系和主題與關鍵詞的關系,從而得到文本關于主題的分布和主題關于關鍵字的分布,進而以參考主題的關鍵字權重分布來計算文本之間的相似度。這種計算方法為后面的推薦算法研究奠定基礎。第二、將LDA模型引入推薦問題的處理,提出了基于LDA的文本推薦算法。其中使用本文提出的基于LDA的文本特征描述方法作為相似度計算的度量值,并將相似度最高的Top-N作為推薦結果返回,提高了文本推薦質量。第三、將基于LDA的文本推薦算法應用于圖書館文獻檢索系統(tǒng),該系統(tǒng)具有高內聚低耦合的特點。系統(tǒng)采用事件驅動基于Listener-Runner架構,使檢索系統(tǒng)具有異步處理性等特點。

【關鍵詞】:
【學位授予單位】:遼寧大學
【學位級別】:碩士
【學位授予年份】:2015
【分類號】:TP391.1
【部分圖文】:

圖2-1LDA概率模型圖


圖 2-1 LDA 概率模型圖 模型時一種典型的貝葉斯網絡(有向圖)。在 LDA 模型中特征詞組成的分層結構,其中潛在主題服從狄利克雷分布。其中 參數(shù) 、 定義了 LDA 模型中的文本集層。隨機A 模型中的文本層。特征詞 參數(shù) 、z[3]描述了文本集中特系統(tǒng) 化推薦系統(tǒng)是為用戶....

圖4-4檢索功能模塊用例圖

圖 4-4 檢索功能模塊用例圖書分類管理模塊圖書分類按樹形 的方式顯示?梢栽黾臃诸惢騽h除分類,還圖 4-5圖書 分類 管理模塊用例圖所示。圖 4-5 圖書分類管理模塊用例圖閱管理模塊書管理

圖4-3網絡拓撲圖


第 4 章 系統(tǒng)需求分析及設計(3)系統(tǒng)的體系結構由于用戶范圍和業(yè)務量較少,只在信息中心設立一個中心服務器 集中處理數(shù)據。系統(tǒng)網絡拓撲圖 如圖 4-3 所示,有一臺內網的數(shù)據庫服務器不可以在網絡上直接訪問,只有 WEB服 務器才可以被外網訪問。而且在 WEB服 務器和互聯(lián)網之間設....

 



本文編號:86291

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/tushudanganlunwen/86291.html


Copyright(c)文論論文網All Rights Reserved | 網站地圖 |

版權申明:資料由用戶290f2***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com