基于主題模型的多標(biāo)簽文本分類(lèi)及推薦系統(tǒng)若干問(wèn)題研究

發(fā)布時(shí)間：2021-01-18 00:39

　　在互聯(lián)網(wǎng)高速發(fā)展的今天,海量的信息通過(guò)互聯(lián)網(wǎng)進(jìn)行發(fā)布、傳播,政治、經(jīng)濟(jì)、娛樂(lè)、教育、文化、學(xué)術(shù)論文等各行各業(yè)的信息,以文字、圖像、聲音、視頻、結(jié)構(gòu)化文檔等多種形式進(jìn)行發(fā)布,同時(shí)也在系統(tǒng)中進(jìn)行數(shù)字化存儲(chǔ)。信息量的不斷增加提升了信息檢索的難度,也對(duì)信息的有序管理提出更高的挑戰(zhàn)。這就需要更加有效的方法和工具以高效地、自動(dòng)地完成海量信息的組織、理解、檢索,提高信息的利用效率和精準(zhǔn)度,減少信息利用難度。多標(biāo)簽分類(lèi)是對(duì)文本、圖片、視頻、結(jié)構(gòu)化文檔等信息資源進(jìn)行組織和利用的有效方法�；诙鄻�(biāo)簽的自動(dòng)分類(lèi)技術(shù)能夠提高信息的處理效率,節(jié)約人工處理成本,改善用戶(hù)使用體驗(yàn),近年來(lái)已得到了廣泛的關(guān)注,已成為信息檢索與數(shù)據(jù)挖掘研究領(lǐng)域的熱點(diǎn)方向。以LDA為代表的主題模型方法是對(duì)文本信息進(jìn)行自動(dòng)組織和歸納的有效方法,能夠揭示文檔的潛在語(yǔ)義,能夠分析海量信息中蘊(yùn)藏的主題,是重要的文本自動(dòng)化處理技術(shù),已在多標(biāo)簽文本分類(lèi)、推薦系統(tǒng)等多個(gè)領(lǐng)域中得到廣泛的應(yīng)用。本文主要研究基于主題模型的有監(jiān)督多標(biāo)簽文本分類(lèi)方法和結(jié)合主題模型的個(gè)性化推薦方法。1、經(jīng)典的多標(biāo)簽文本分類(lèi)L-LDA和Dependency-LDA模型,忽略了詞項(xiàng)的...

【文章來(lái)源】：吉林大學(xué)吉林省 211工程院校 985工程院校教育部直屬院校

【文章頁(yè)數(shù)】：98 頁(yè)

【學(xué)位級(jí)別】：博士

【文章目錄】：
摘要
abstract
第1章緒論
    1.1 研究背景與意義
    1.2 國(guó)內(nèi)外研究現(xiàn)狀
        1.2.1 主題模型研究現(xiàn)狀
        1.2.2 多標(biāo)簽文本分類(lèi)研究現(xiàn)狀
        1.2.3 社會(huì)化標(biāo)簽推薦研究現(xiàn)狀
    1.3 本文研究重點(diǎn)和工作內(nèi)容
第2章相關(guān)背景知識(shí)
    2.1 詞語(yǔ)表示模型
        2.1.1 One-Hot
        2.1.2 基于頻率的詞嵌入
        2.1.3 分布式詞向量
    2.2 主題模型
        2.2.1 LSI模型
        2.2.2 PLSI模型
        2.2.3 LDA模型
    2.3 多標(biāo)簽文本分類(lèi)
    2.4 主題模型學(xué)習(xí)算法
        2.4.1 變分推斷和參數(shù)估計(jì)
        2.4.2 Gibbs采樣和參數(shù)估計(jì)
    2.5 多標(biāo)簽文本分類(lèi)的有監(jiān)督主題模型
        2.5.1 L-LDA
        2.5.2 Dependency-LDA
    2.6 推薦系統(tǒng)
        2.6.1 推薦系統(tǒng)的構(gòu)成
        2.6.2 基于協(xié)同過(guò)濾的推薦方法
        2.6.3 基于內(nèi)容的推薦方法
        2.6.4 混合推薦方法
    2.7 小結(jié)
第3章基于主題模型的多標(biāo)簽文本分類(lèi)
    3.1 概述
    3.2 詞項(xiàng)權(quán)重設(shè)置
    3.3 WL-LDA模型
        3.3.1 模型訓(xùn)練
        3.3.2 模型測(cè)試
    3.4 WD-LDA模型
        3.4.1 模型訓(xùn)練
        3.4.2 模型測(cè)試
    3.5 實(shí)驗(yàn)
        3.5.1 實(shí)驗(yàn)設(shè)置
        3.5.2 與基線算法比較
        3.5.3 參數(shù)實(shí)驗(yàn)
    3.6 本章小結(jié)
第4章結(jié)合主題模型的個(gè)性化標(biāo)簽推薦方法
    4.1 概述
    4.2 SIM-LDA-TAG模型
        4.2.1 問(wèn)題定義
        4.2.2 推薦模型
    4.3 LDA過(guò)程
    4.4 實(shí)驗(yàn)
        4.4.1 數(shù)據(jù)集
        4.4.2 基線算法
        4.4.3 評(píng)估度量
        4.4.4 結(jié)果評(píng)價(jià)
    4.5 本章小結(jié)
第5章結(jié)合主題模型的個(gè)性化資源推薦方法
    5.1 概述
    5.2 SIM-LDA模型
        5.2.1 問(wèn)題定義
        5.2.2 推薦模型
    5.3 LDA過(guò)程
    5.4 實(shí)驗(yàn)
        5.4.1 數(shù)據(jù)集
        5.4.2 基線算法
        5.4.3 評(píng)估度量
        5.4.4 結(jié)果評(píng)價(jià)
    5.5 本章小結(jié)
第6章結(jié)論與展望
    6.1 本文總結(jié)
    6.2 工作展望
參考文獻(xiàn)
作者簡(jiǎn)介及在學(xué)期間所取得的科研成果
致謝

本文編號(hào)：2983913

資料下載

論文發(fā)表

支付寶下載

Download by Alipay
微信下載

Download by Wechat
會(huì)員下載

Download by Member

本文鏈接：http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/2983913.html

上一篇：自閉癥康復(fù)訓(xùn)練的移動(dòng)終端應(yīng)用
下一篇：基于區(qū)塊鏈的智能合約在共享經(jīng)濟(jì)中的應(yīng)用

論文發(fā)表

·知網(wǎng)|萬(wàn)方|維普|龍?jiān)磡省級(jí)|國(guó)家級(jí)|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|

天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于主題模型的多標(biāo)簽文本分類(lèi)及推薦系統(tǒng)若干問(wèn)題研究