基于主題模型的多標(biāo)簽文本分類(lèi)及推薦系統(tǒng)若干問(wèn)題研究
發(fā)布時(shí)間:2021-01-18 00:39
在互聯(lián)網(wǎng)高速發(fā)展的今天,海量的信息通過(guò)互聯(lián)網(wǎng)進(jìn)行發(fā)布、傳播,政治、經(jīng)濟(jì)、娛樂(lè)、教育、文化、學(xué)術(shù)論文等各行各業(yè)的信息,以文字、圖像、聲音、視頻、結(jié)構(gòu)化文檔等多種形式進(jìn)行發(fā)布,同時(shí)也在系統(tǒng)中進(jìn)行數(shù)字化存儲(chǔ)。信息量的不斷增加提升了信息檢索的難度,也對(duì)信息的有序管理提出更高的挑戰(zhàn)。這就需要更加有效的方法和工具以高效地、自動(dòng)地完成海量信息的組織、理解、檢索,提高信息的利用效率和精準(zhǔn)度,減少信息利用難度。多標(biāo)簽分類(lèi)是對(duì)文本、圖片、視頻、結(jié)構(gòu)化文檔等信息資源進(jìn)行組織和利用的有效方法;诙鄻(biāo)簽的自動(dòng)分類(lèi)技術(shù)能夠提高信息的處理效率,節(jié)約人工處理成本,改善用戶(hù)使用體驗(yàn),近年來(lái)已得到了廣泛的關(guān)注,已成為信息檢索與數(shù)據(jù)挖掘研究領(lǐng)域的熱點(diǎn)方向。以LDA為代表的主題模型方法是對(duì)文本信息進(jìn)行自動(dòng)組織和歸納的有效方法,能夠揭示文檔的潛在語(yǔ)義,能夠分析海量信息中蘊(yùn)藏的主題,是重要的文本自動(dòng)化處理技術(shù),已在多標(biāo)簽文本分類(lèi)、推薦系統(tǒng)等多個(gè)領(lǐng)域中得到廣泛的應(yīng)用。本文主要研究基于主題模型的有監(jiān)督多標(biāo)簽文本分類(lèi)方法和結(jié)合主題模型的個(gè)性化推薦方法。1、經(jīng)典的多標(biāo)簽文本分類(lèi)L-LDA和Dependency-LDA模型,忽略了詞項(xiàng)的...
【文章來(lái)源】:吉林大學(xué)吉林省 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:98 頁(yè)
【學(xué)位級(jí)別】:博士
【文章目錄】:
摘要
abstract
第1章 緒論
1.1 研究背景與意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.2.1 主題模型研究現(xiàn)狀
1.2.2 多標(biāo)簽文本分類(lèi)研究現(xiàn)狀
1.2.3 社會(huì)化標(biāo)簽推薦研究現(xiàn)狀
1.3 本文研究重點(diǎn)和工作內(nèi)容
第2章 相關(guān)背景知識(shí)
2.1 詞語(yǔ)表示模型
2.1.1 One-Hot
2.1.2 基于頻率的詞嵌入
2.1.3 分布式詞向量
2.2 主題模型
2.2.1 LSI模型
2.2.2 PLSI模型
2.2.3 LDA模型
2.3 多標(biāo)簽文本分類(lèi)
2.4 主題模型學(xué)習(xí)算法
2.4.1 變分推斷和參數(shù)估計(jì)
2.4.2 Gibbs采樣和參數(shù)估計(jì)
2.5 多標(biāo)簽文本分類(lèi)的有監(jiān)督主題模型
2.5.1 L-LDA
2.5.2 Dependency-LDA
2.6 推薦系統(tǒng)
2.6.1 推薦系統(tǒng)的構(gòu)成
2.6.2 基于協(xié)同過(guò)濾的推薦方法
2.6.3 基于內(nèi)容的推薦方法
2.6.4 混合推薦方法
2.7 小結(jié)
第3章 基于主題模型的多標(biāo)簽文本分類(lèi)
3.1 概述
3.2 詞項(xiàng)權(quán)重設(shè)置
3.3 WL-LDA模型
3.3.1 模型訓(xùn)練
3.3.2 模型測(cè)試
3.4 WD-LDA模型
3.4.1 模型訓(xùn)練
3.4.2 模型測(cè)試
3.5 實(shí)驗(yàn)
3.5.1 實(shí)驗(yàn)設(shè)置
3.5.2 與基線算法比較
3.5.3 參數(shù)實(shí)驗(yàn)
3.6 本章小結(jié)
第4章 結(jié)合主題模型的個(gè)性化標(biāo)簽推薦方法
4.1 概述
4.2 SIM-LDA-TAG模型
4.2.1 問(wèn)題定義
4.2.2 推薦模型
4.3 LDA過(guò)程
4.4 實(shí)驗(yàn)
4.4.1 數(shù)據(jù)集
4.4.2 基線算法
4.4.3 評(píng)估度量
4.4.4 結(jié)果評(píng)價(jià)
4.5 本章小結(jié)
第5章 結(jié)合主題模型的個(gè)性化資源推薦方法
5.1 概述
5.2 SIM-LDA模型
5.2.1 問(wèn)題定義
5.2.2 推薦模型
5.3 LDA過(guò)程
5.4 實(shí)驗(yàn)
5.4.1 數(shù)據(jù)集
5.4.2 基線算法
5.4.3 評(píng)估度量
5.4.4 結(jié)果評(píng)價(jià)
5.5 本章小結(jié)
第6章 結(jié)論與展望
6.1 本文總結(jié)
6.2 工作展望
參考文獻(xiàn)
作者簡(jiǎn)介及在學(xué)期間所取得的科研成果
致謝
本文編號(hào):2983913
【文章來(lái)源】:吉林大學(xué)吉林省 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:98 頁(yè)
【學(xué)位級(jí)別】:博士
【文章目錄】:
摘要
abstract
第1章 緒論
1.1 研究背景與意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.2.1 主題模型研究現(xiàn)狀
1.2.2 多標(biāo)簽文本分類(lèi)研究現(xiàn)狀
1.2.3 社會(huì)化標(biāo)簽推薦研究現(xiàn)狀
1.3 本文研究重點(diǎn)和工作內(nèi)容
第2章 相關(guān)背景知識(shí)
2.1 詞語(yǔ)表示模型
2.1.1 One-Hot
2.1.2 基于頻率的詞嵌入
2.1.3 分布式詞向量
2.2 主題模型
2.2.1 LSI模型
2.2.2 PLSI模型
2.2.3 LDA模型
2.3 多標(biāo)簽文本分類(lèi)
2.4 主題模型學(xué)習(xí)算法
2.4.1 變分推斷和參數(shù)估計(jì)
2.4.2 Gibbs采樣和參數(shù)估計(jì)
2.5 多標(biāo)簽文本分類(lèi)的有監(jiān)督主題模型
2.5.1 L-LDA
2.5.2 Dependency-LDA
2.6 推薦系統(tǒng)
2.6.1 推薦系統(tǒng)的構(gòu)成
2.6.2 基于協(xié)同過(guò)濾的推薦方法
2.6.3 基于內(nèi)容的推薦方法
2.6.4 混合推薦方法
2.7 小結(jié)
第3章 基于主題模型的多標(biāo)簽文本分類(lèi)
3.1 概述
3.2 詞項(xiàng)權(quán)重設(shè)置
3.3 WL-LDA模型
3.3.1 模型訓(xùn)練
3.3.2 模型測(cè)試
3.4 WD-LDA模型
3.4.1 模型訓(xùn)練
3.4.2 模型測(cè)試
3.5 實(shí)驗(yàn)
3.5.1 實(shí)驗(yàn)設(shè)置
3.5.2 與基線算法比較
3.5.3 參數(shù)實(shí)驗(yàn)
3.6 本章小結(jié)
第4章 結(jié)合主題模型的個(gè)性化標(biāo)簽推薦方法
4.1 概述
4.2 SIM-LDA-TAG模型
4.2.1 問(wèn)題定義
4.2.2 推薦模型
4.3 LDA過(guò)程
4.4 實(shí)驗(yàn)
4.4.1 數(shù)據(jù)集
4.4.2 基線算法
4.4.3 評(píng)估度量
4.4.4 結(jié)果評(píng)價(jià)
4.5 本章小結(jié)
第5章 結(jié)合主題模型的個(gè)性化資源推薦方法
5.1 概述
5.2 SIM-LDA模型
5.2.1 問(wèn)題定義
5.2.2 推薦模型
5.3 LDA過(guò)程
5.4 實(shí)驗(yàn)
5.4.1 數(shù)據(jù)集
5.4.2 基線算法
5.4.3 評(píng)估度量
5.4.4 結(jié)果評(píng)價(jià)
5.5 本章小結(jié)
第6章 結(jié)論與展望
6.1 本文總結(jié)
6.2 工作展望
參考文獻(xiàn)
作者簡(jiǎn)介及在學(xué)期間所取得的科研成果
致謝
本文編號(hào):2983913
本文鏈接:http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/2983913.html
最近更新
教材專(zhuān)著