面向科研人員興趣畫像的多語作者主題模型研究
發(fā)布時間:2021-06-03 19:40
全球化背景下,從不同語種的海量科研文獻數(shù)據(jù)集中自動挖掘隱含主題,精準(zhǔn)刻畫科研人員研究興趣是信息服務(wù)邁向知識服務(wù)的關(guān)鍵問題,也是跨語言信息檢索的關(guān)鍵技術(shù)之一。目前刻畫科研人員興趣的方法多基于其某一語種的文獻,不適用于多語言數(shù)據(jù)集。本文在作者主題模型和多語言主題模型的基礎(chǔ)上提出了多語作者主題(JointAT)模型,可從多語言數(shù)據(jù)集刻畫作者興趣,并給出了一種估計JointAT模型參數(shù)的吉布斯采樣方法。實驗結(jié)果表明,JointAT模型與作者主題(AT)模型相比具有更好的泛化能力。
【文章來源】:情報學(xué)報. 2020,39(06)北大核心CSSCICSCD
【文章頁數(shù)】:8 頁
【部分圖文】:
LDA模型的概率圖模型
綜上,AT模型可以在單語言語料集中挖掘作者興趣,JointLDA則適用于在多語言文本下挖掘文檔主題。本文的目標(biāo)就是構(gòu)建融合這兩種模型特征的新模型,實現(xiàn)在多語言語料中挖掘作者興趣的目標(biāo)。圖3 JointLDA模型的概率圖模型
JointLDA模型的概率圖模型
【參考文獻】:
期刊論文
[1]作者主題演化模型及其在研究興趣演化分析中的應(yīng)用[J]. 史慶偉,喬曉東,徐碩,農(nóng)國武. 情報學(xué)報. 2013 (09)
本文編號:3211129
【文章來源】:情報學(xué)報. 2020,39(06)北大核心CSSCICSCD
【文章頁數(shù)】:8 頁
【部分圖文】:
LDA模型的概率圖模型
綜上,AT模型可以在單語言語料集中挖掘作者興趣,JointLDA則適用于在多語言文本下挖掘文檔主題。本文的目標(biāo)就是構(gòu)建融合這兩種模型特征的新模型,實現(xiàn)在多語言語料中挖掘作者興趣的目標(biāo)。圖3 JointLDA模型的概率圖模型
JointLDA模型的概率圖模型
【參考文獻】:
期刊論文
[1]作者主題演化模型及其在研究興趣演化分析中的應(yīng)用[J]. 史慶偉,喬曉東,徐碩,農(nóng)國武. 情報學(xué)報. 2013 (09)
本文編號:3211129
本文鏈接:http://www.sikaile.net/tushudanganlunwen/3211129.html