基于LSA和結構特性的微博話題檢測
發(fā)布時間:2017-12-06 06:26
本文關鍵詞:基于LSA和結構特性的微博話題檢測
更多相關文章: 微博 話題檢測 文本聚類 語義空間 潛在語義分析
【摘要】:針對傳統(tǒng)的話題檢測方法在處理大規(guī)模微博短文本時出現(xiàn)的降維能力不足和語義信息丟失等問題,提出基于潛在語義分析和結構特性相結合的微博話題檢測方法。根據(jù)微博的對話屬性和傳播模型,首先要合并微博討論樹擴展微博文本,創(chuàng)建基于潛在語義分析(LSA)的微博文本模型以解決數(shù)據(jù)稀疏性問題,最后結合時間信息給出新的相似度計算方法,并采用凝聚層次聚類法檢測微博話題。實驗結果表明,提出的方法降低了話題檢測的錯失率,大大提高了微博話題檢測的性能。
【作者單位】: 上海理工大學光電信息與計算機工程學院;
【基金】:國家自然科學基金資助項目(61074087) 上海市教育委員會科研創(chuàng)新項目(12ZZ144) 上海市一流學科(系統(tǒng)科學)資助項目(XTKX2012)
【分類號】:TP391.1;TP393.092
【正文快照】: 0引言微博是一種基于Web 2.0技術實現(xiàn)的社會媒體(socialmedia),其允許用戶通過Web、WAP以及各種客戶端設備及時更新簡短文本并公開發(fā)布,是一種基于用戶關系的信息分享、傳播及獲取平臺。隨著網絡全球化進程的加快以及移動技術的推廣,微博已經成為了網絡輿論的主要源頭和重要的
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前2條
1 陳國蘭;孫國梓;;微博平臺監(jiān)測網絡突發(fā)事件的關鍵問題研究[J];情報探索;2014年08期
2 ;[J];;年期
,本文編號:1257676
本文鏈接:http://www.sikaile.net/guanlilunwen/ydhl/1257676.html
最近更新
教材專著