天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 軟件論文 >

基于主題模型的多標(biāo)簽文本分類(lèi)及推薦系統(tǒng)若干問(wèn)題研究

發(fā)布時(shí)間:2021-01-18 00:39
  在互聯(lián)網(wǎng)高速發(fā)展的今天,海量的信息通過(guò)互聯(lián)網(wǎng)進(jìn)行發(fā)布、傳播,政治、經(jīng)濟(jì)、娛樂(lè)、教育、文化、學(xué)術(shù)論文等各行各業(yè)的信息,以文字、圖像、聲音、視頻、結(jié)構(gòu)化文檔等多種形式進(jìn)行發(fā)布,同時(shí)也在系統(tǒng)中進(jìn)行數(shù)字化存儲(chǔ)。信息量的不斷增加提升了信息檢索的難度,也對(duì)信息的有序管理提出更高的挑戰(zhàn)。這就需要更加有效的方法和工具以高效地、自動(dòng)地完成海量信息的組織、理解、檢索,提高信息的利用效率和精準(zhǔn)度,減少信息利用難度。多標(biāo)簽分類(lèi)是對(duì)文本、圖片、視頻、結(jié)構(gòu)化文檔等信息資源進(jìn)行組織和利用的有效方法;诙鄻(biāo)簽的自動(dòng)分類(lèi)技術(shù)能夠提高信息的處理效率,節(jié)約人工處理成本,改善用戶(hù)使用體驗(yàn),近年來(lái)已得到了廣泛的關(guān)注,已成為信息檢索與數(shù)據(jù)挖掘研究領(lǐng)域的熱點(diǎn)方向。以LDA為代表的主題模型方法是對(duì)文本信息進(jìn)行自動(dòng)組織和歸納的有效方法,能夠揭示文檔的潛在語(yǔ)義,能夠分析海量信息中蘊(yùn)藏的主題,是重要的文本自動(dòng)化處理技術(shù),已在多標(biāo)簽文本分類(lèi)、推薦系統(tǒng)等多個(gè)領(lǐng)域中得到廣泛的應(yīng)用。本文主要研究基于主題模型的有監(jiān)督多標(biāo)簽文本分類(lèi)方法和結(jié)合主題模型的個(gè)性化推薦方法。1、經(jīng)典的多標(biāo)簽文本分類(lèi)L-LDA和Dependency-LDA模型,忽略了詞項(xiàng)的... 

【文章來(lái)源】:吉林大學(xué)吉林省 211工程院校 985工程院校 教育部直屬院校

【文章頁(yè)數(shù)】:98 頁(yè)

【學(xué)位級(jí)別】:博士

【文章目錄】:
摘要
abstract
第1章 緒論
    1.1 研究背景與意義
    1.2 國(guó)內(nèi)外研究現(xiàn)狀
        1.2.1 主題模型研究現(xiàn)狀
        1.2.2 多標(biāo)簽文本分類(lèi)研究現(xiàn)狀
        1.2.3 社會(huì)化標(biāo)簽推薦研究現(xiàn)狀
    1.3 本文研究重點(diǎn)和工作內(nèi)容
第2章 相關(guān)背景知識(shí)
    2.1 詞語(yǔ)表示模型
        2.1.1 One-Hot
        2.1.2 基于頻率的詞嵌入
        2.1.3 分布式詞向量
    2.2 主題模型
        2.2.1 LSI模型
        2.2.2 PLSI模型
        2.2.3 LDA模型
    2.3 多標(biāo)簽文本分類(lèi)
    2.4 主題模型學(xué)習(xí)算法
        2.4.1 變分推斷和參數(shù)估計(jì)
        2.4.2 Gibbs采樣和參數(shù)估計(jì)
    2.5 多標(biāo)簽文本分類(lèi)的有監(jiān)督主題模型
        2.5.1 L-LDA
        2.5.2 Dependency-LDA
    2.6 推薦系統(tǒng)
        2.6.1 推薦系統(tǒng)的構(gòu)成
        2.6.2 基于協(xié)同過(guò)濾的推薦方法
        2.6.3 基于內(nèi)容的推薦方法
        2.6.4 混合推薦方法
    2.7 小結(jié)
第3章 基于主題模型的多標(biāo)簽文本分類(lèi)
    3.1 概述
    3.2 詞項(xiàng)權(quán)重設(shè)置
    3.3 WL-LDA模型
        3.3.1 模型訓(xùn)練
        3.3.2 模型測(cè)試
    3.4 WD-LDA模型
        3.4.1 模型訓(xùn)練
        3.4.2 模型測(cè)試
    3.5 實(shí)驗(yàn)
        3.5.1 實(shí)驗(yàn)設(shè)置
        3.5.2 與基線算法比較
        3.5.3 參數(shù)實(shí)驗(yàn)
    3.6 本章小結(jié)
第4章 結(jié)合主題模型的個(gè)性化標(biāo)簽推薦方法
    4.1 概述
    4.2 SIM-LDA-TAG模型
        4.2.1 問(wèn)題定義
        4.2.2 推薦模型
    4.3 LDA過(guò)程
    4.4 實(shí)驗(yàn)
        4.4.1 數(shù)據(jù)集
        4.4.2 基線算法
        4.4.3 評(píng)估度量
        4.4.4 結(jié)果評(píng)價(jià)
    4.5 本章小結(jié)
第5章 結(jié)合主題模型的個(gè)性化資源推薦方法
    5.1 概述
    5.2 SIM-LDA模型
        5.2.1 問(wèn)題定義
        5.2.2 推薦模型
    5.3 LDA過(guò)程
    5.4 實(shí)驗(yàn)
        5.4.1 數(shù)據(jù)集
        5.4.2 基線算法
        5.4.3 評(píng)估度量
        5.4.4 結(jié)果評(píng)價(jià)
    5.5 本章小結(jié)
第6章 結(jié)論與展望
    6.1 本文總結(jié)
    6.2 工作展望
參考文獻(xiàn)
作者簡(jiǎn)介及在學(xué)期間所取得的科研成果
致謝



本文編號(hào):2983913

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/2983913.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶(hù)04bef***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com