基于速度增長(zhǎng)的微博熱點(diǎn)話題發(fā)現(xiàn)
發(fā)布時(shí)間:2021-06-15 01:10
在微博熱點(diǎn)話題發(fā)現(xiàn)中,由于微博文本短、詞量少、用詞不規(guī)范等特征,使得傳統(tǒng)的熱點(diǎn)話題檢測(cè)方法力不從心。針對(duì)這一問題,提出了基于速度增長(zhǎng)的微博熱點(diǎn)話題發(fā)現(xiàn)方法。首先把經(jīng)過預(yù)處理的微博按等數(shù)量窗口劃分,統(tǒng)計(jì)每個(gè)窗口內(nèi)各詞語的詞頻,并表示成時(shí)間二元組序列;然后通過計(jì)算每相鄰兩個(gè)窗口的個(gè)詞語的增長(zhǎng)斜率來發(fā)現(xiàn)增長(zhǎng)速度快的詞語;再通過計(jì)算與該詞語有關(guān)的用戶的增長(zhǎng)速度和微博條數(shù)的增長(zhǎng)速度來確定該詞語是否是熱點(diǎn)主題詞;最后通過熱點(diǎn)主題詞聚類產(chǎn)生熱點(diǎn)話題。通過實(shí)驗(yàn)驗(yàn)證了該方法的可行性。實(shí)驗(yàn)結(jié)果表明,該方法在一定程度上提高了檢測(cè)效率,降低了漏檢率和誤檢率,可以有效地及時(shí)發(fā)現(xiàn)微博熱點(diǎn)話題。
【文章來源】:計(jì)算機(jī)應(yīng)用研究. 2013,30(09)北大核心CSCD
【文章頁數(shù)】:4 頁
【參考文獻(xiàn)】:
期刊論文
[1]一種中文微博新聞話題檢測(cè)的方法[J]. 鄭斐然,苗奪謙,張志飛,高燦. 計(jì)算機(jī)科學(xué). 2012(01)
[2]引入活躍指數(shù)的微博用戶排名機(jī)制[J]. 石磊,張聰,衛(wèi)琳. 小型微型計(jì)算機(jī)系統(tǒng). 2012(01)
碩士論文
[1]中文微博客熱點(diǎn)話題檢測(cè)與跟蹤技術(shù)研究[D]. 孫勝平.北京交通大學(xué) 2011
[2]微博客熱點(diǎn)話題發(fā)現(xiàn)策略研究[D]. 楊冠超.浙江大學(xué) 2011
本文編號(hào):3230600
【文章來源】:計(jì)算機(jī)應(yīng)用研究. 2013,30(09)北大核心CSCD
【文章頁數(shù)】:4 頁
【參考文獻(xiàn)】:
期刊論文
[1]一種中文微博新聞話題檢測(cè)的方法[J]. 鄭斐然,苗奪謙,張志飛,高燦. 計(jì)算機(jī)科學(xué). 2012(01)
[2]引入活躍指數(shù)的微博用戶排名機(jī)制[J]. 石磊,張聰,衛(wèi)琳. 小型微型計(jì)算機(jī)系統(tǒng). 2012(01)
碩士論文
[1]中文微博客熱點(diǎn)話題檢測(cè)與跟蹤技術(shù)研究[D]. 孫勝平.北京交通大學(xué) 2011
[2]微博客熱點(diǎn)話題發(fā)現(xiàn)策略研究[D]. 楊冠超.浙江大學(xué) 2011
本文編號(hào):3230600
本文鏈接:http://www.sikaile.net/guanlilunwen/ydhl/3230600.html
最近更新
教材專著