基于層次分析的微博短文本特征計算方法
發(fā)布時間:2017-08-23 06:02
本文關鍵詞:基于層次分析的微博短文本特征計算方法
【摘要】:為了建立用戶精準興趣模型以有效發(fā)現(xiàn)具有相似興趣的用戶群,提出了一種針對微博的短文本特征計算方法用于聚類算法,提升聚類效果以更好地挖掘微博用戶的相似興趣集合。該方法融合了微博轉發(fā)數(shù)、評論數(shù)、點贊數(shù)等多個關鍵指標來度量微博短文本特征的重要性。同時,引入層次分析技術,改進了傳統(tǒng)的tf-idf特征計算方法,并利用經(jīng)典文本聚類算法進行實驗。實驗結果表明,改進后的短文本特征計算方法與傳統(tǒng)的tf-idf特征計算方法相比,在類內集中度和類間分散度上取得了更好的效果。
【作者單位】: 中國科學院信息工程研究所;國家計算機網(wǎng)絡應急技術處理協(xié)調中心;中國科學院大學;北京郵電大學信息與通信工程學院;
【關鍵詞】: 層次分析 特征計算 文本聚類 短文本
【基金】:國家高技術研究發(fā)展計劃(“863”計劃)基金資助項目(No.SS2014AA012303) 國家自然科學基金資助項目(No.61300206,No.61402123)~~
【分類號】:TP391.1
【正文快照】: 近年來,快速發(fā)展的社交網(wǎng)絡已成為人們交流信息的重要平臺。其中,微博作為主流社交平臺之一,吸引了越來越多的網(wǎng)民參與其中。隨著微博用戶規(guī)模的迅速膨脹,微博平臺上產(chǎn)生和流動的大量數(shù)據(jù)(如朋友關系、用戶發(fā)布的內容等)具有重要的研究意義和應用價值。其中,如何基于微博平臺
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前6條
1 張大鵬;左旺孟;;生物特征計算進展[J];智能計算機與應用;2011年03期
2 吳中海,,張行功,葉澄清,潘云鶴;一個適合于特征計算的多邊形逼近算法[J];計算機學報;1997年12期
3 于子凡;杜貴君;林宗堅;;圖像盒子維數(shù)特征計算方法改進[J];測繪科學;2006年01期
4 羅楓,陳志楊,張三元,葉修梓;基于OBB樹層次關系的相交體特征計算[J];計算機應用研究;2005年10期
5 王慧斌;程勇;陳哲;;融合視覺深度的特征計算與水下目標跟蹤[J];中國圖象圖形學報;2014年04期
6 ;[J];;年期
本文編號:723357
本文鏈接:http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/723357.html
最近更新
教材專著