基于PBTM的海量微博主題發(fā)現(xiàn)
本文關鍵詞:基于PBTM的海量微博主題發(fā)現(xiàn)
更多相關文章: 主題模型 主題發(fā)現(xiàn) PBTM 吉布斯采樣 分布式計算
【摘要】:BTM(biterm topic model)能較好挖掘出微博主題。但面對海量微博,BTM無法勝任,因為BTM挖掘主題速度過慢;诖,提出一種基于吉布斯采樣本主機biterm元組來更新主題單詞全局矩陣的分布式的BTM模型PBTM(parallel biterm topic model),通過多臺主機同時對語料庫進行本主機biterm吉布斯采樣,然后每次迭代后更新全局主題單詞矩陣,直到采樣收斂。通過MPI集群實現(xiàn)PBTM模型,實驗結果表明,PBTM主題挖掘微博文本速度較BTM大大加快。
【作者單位】: 武漢大學計算機學院;
【關鍵詞】: 主題模型 主題發(fā)現(xiàn) PBTM 吉布斯采樣 分布式計算
【基金】:國家自然科學基金重點項目(61133012);國家自然科學基金面上項目(61173062)
【分類號】:TP393.092
【正文快照】: 微博即微博客,始于美國Twitter公司,是一個基于用戶關系信息分享、傳播以及獲取的平臺。用戶可以通過Web、WAP等各種客戶端組建個人社區(qū),以140字左右的文字更新信息,并實現(xiàn)即時分享。同時本土的微博服務在這幾年非常盛行,其中騰訊微博、新浪微博最為流行。如何快速從這種海量
【參考文獻】
中國期刊全文數(shù)據(jù)庫 前1條
1 張晨逸;孫建伶;丁軼群;;基于MB-LDA模型的微博主題挖掘[J];計算機研究與發(fā)展;2011年10期
【共引文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 孫乃利;王玉龍;沈奇威;;微博客意見領袖識別的研究[J];電信技術;2012年12期
2 王君澤;馬靜;杜洪濤;;微博輿情分析平臺的框架與支撐技術研究[J];電子政務;2013年01期
3 馬慧芳;王博;;基于增量主題模型的微博在線事件分析[J];計算機工程;2013年03期
4 余淼淼;王俊麗;趙曉東;岳曉冬;;PAM概率主題模型研究綜述[J];計算機科學;2013年05期
5 謝昊;江紅;;一種面向微博主題挖掘的改進LDA模型[J];華東師范大學學報(自然科學版);2013年06期
6 馬雯雯;魏文晗;鄧一貴;;基于隱含語義分析的微博話題發(fā)現(xiàn)方法[J];計算機工程與應用;2014年01期
7 王楨文;肖衛(wèi)東;譚文堂;;基于概率生成模型的網(wǎng)絡數(shù)據(jù)分類方法[J];計算機研究與發(fā)展;2013年12期
8 孫勁光;馬志芳;孟祥福;;基于情感詞屬性和云模型的文本情感分類方法[J];計算機工程;2013年12期
9 賴錦輝;梁松;;一種消除孤立點的微博熱點話題發(fā)現(xiàn)方法[J];計算機應用與軟件;2014年01期
10 姜曉偉;王建民;丁貴廣;;基于主題模型的微博重要話題發(fā)現(xiàn)與排序方法[J];計算機研究與發(fā)展;2013年S1期
中國重要會議論文全文數(shù)據(jù)庫 前1條
1 劉娜;肖智博;路瑩;唐曉君;肖鵬;;自適應主題融合的多文檔自動摘要算法[A];2013年中國智能自動化學術會議論文集(第五分冊)[C];2013年
中國博士學位論文全文數(shù)據(jù)庫 前8條
1 劉娜;文本自動摘要和信息抽取方法及其應用研究[D];大連海事大學;2012年
2 田占偉;基于復雜網(wǎng)絡的微博信息傳播研究[D];哈爾濱工業(yè)大學;2012年
3 呂英杰;網(wǎng)絡健康社區(qū)中的文本挖掘方法研究[D];上海交通大學;2013年
4 段亞娟;微博搜索的關鍵技術研究[D];中國科學技術大學;2014年
5 丁兆云;面向微博輿情的影響力分析關鍵技術研究[D];國防科學技術大學;2013年
6 苑衛(wèi)國;微博用戶行為分析和網(wǎng)絡結構演化的研究[D];北京交通大學;2014年
7 陳靜茜;表演的狂歡:網(wǎng)絡社會的個體自我呈現(xiàn)與交往行為[D];復旦大學;2013年
8 肖智博;排序主題模型及其應用研究[D];大連海事大學;2014年
中國碩士學位論文全文數(shù)據(jù)庫 前10條
1 姜楊;基于社會化媒體節(jié)點屬性的信息預測研究[D];北京郵電大學;2012年
2 熊會會;基于復雜網(wǎng)絡的微博客信息傳播機制研究[D];華南理工大學;2012年
3 鄒鴻程;微博話題檢測與追蹤技術研究[D];解放軍信息工程大學;2012年
4 何翔;基于微博的主題社區(qū)發(fā)現(xiàn)[D];華東理工大學;2013年
5 邱洋;微博數(shù)據(jù)提取及話題檢測方法研究[D];大連理工大學;2013年
6 王偉;Web挖掘技術及其在互聯(lián)網(wǎng)中的應用研究[D];山東大學;2013年
7 王熙;基于用戶關系分析和微博內(nèi)容挖掘的信息推薦系統(tǒng)研究[D];北京郵電大學;2013年
8 詹勇;基于主題模型和混合模型的微博客交叉話題發(fā)現(xiàn)研究[D];西南交通大學;2013年
9 謝昊;基于主題模型的微博推薦系統(tǒng)研究[D];華東師范大學;2013年
10 張思龍;微博熱點話題預判技術研究[D];解放軍信息工程大學;2013年
,本文編號:1015985
本文鏈接:http://www.sikaile.net/guanlilunwen/ydhl/1015985.html