基于箱線圖的微博客熱點話題發(fā)現(xiàn)
本文關鍵詞:基于箱線圖的微博客熱點話題發(fā)現(xiàn)
更多相關文章: 微博客 熱點話題 突發(fā)詞 箱線圖 噪聲微博
【摘要】:提出了一種基于箱線圖原理識別突發(fā)詞的熱點話題發(fā)現(xiàn)方法。該方法首先統(tǒng)計了噪聲微博的特征,并根據(jù)這些特征對微博進行了過濾,然后利用箱線圖原理識別突發(fā)詞,最后通過計算不同時段突發(fā)詞的權(quán)重來發(fā)現(xiàn)微博熱點話題。實驗結(jié)果表明,與SSM、EC、ELM方法相比,基于箱線圖原理識別突發(fā)詞的熱點話題發(fā)現(xiàn)方法在F1值上平均提高了13.8%,而且對噪聲不敏感。
【作者單位】: 福州大學數(shù)學與計算機科學學院;
【關鍵詞】: 微博客 熱點話題 突發(fā)詞 箱線圖 噪聲微博
【基金】:福建省科技重大項目(2013H6012) 教育部博士點基金聯(lián)合資助項目(2012351410010) 福建省自然科學基金(2010J05133) 福州市科技計劃(2012-G-113)
【分類號】:TP393.092;TP391.1
【正文快照】: 0引言微博[1],即微博客(Microblog)的簡稱,是一個基于用戶關系信息分享、傳播以及獲取的平臺,以140字左右的文字更新信息,具有草根性強、分布廣、即時性、多噪聲等特點。CNNIC發(fā)布的第31次中國互聯(lián)網(wǎng)絡發(fā)展狀況統(tǒng)計報告顯示[2],截至2012年12月底,我國微博用戶規(guī)模為3.09億,較2
【參考文獻】
中國期刊全文數(shù)據(jù)庫 前1條
1 楊亮;林原;林鴻飛;;基于情感分布的微博熱點事件發(fā)現(xiàn)[J];中文信息學報;2012年01期
【共引文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 苗蕊;劉魯;劉志明;;基于隱馬爾可夫模型的突發(fā)事件新聞報道的爆發(fā)性分析[J];系統(tǒng)工程;2010年08期
2 王君澤;馬靜;杜洪濤;;微博輿情分析平臺的框架與支撐技術研究[J];電子政務;2013年01期
3 張東霞;;基于高校學生微博的輿情熱點分析與發(fā)現(xiàn)[J];東南傳播;2013年06期
4 牛洪林;孫海萍;;基于CSSCI(2000~2011)的我國體育學學科知識圖譜研究[J];圖書與情報;2014年01期
5 胡榜利;覃山羽;黃鑫;楊光業(yè);陳斌冠;鄧莉;蔡金華;;內(nèi)鏡逆行胰膽管造影術的文獻計量學研究[J];重慶醫(yī)學;2014年10期
6 胡改麗;陳福集;;網(wǎng)絡輿情熱點話題傳播結(jié)構(gòu)研究[J];發(fā)展研究;2014年08期
7 周澍綺;;基于Kleinberg算法的楚辭文獻突發(fā)信息監(jiān)測研究[J];電腦知識與技術;2015年04期
8 冀俊忠;貝飛;吳晨生;柴鷹;宋辰;;詞性對新聞和微博網(wǎng)絡話題檢測的影響[J];北京工業(yè)大學學報;2015年04期
9 張鈺莎;蔣盛益;;微博公共事件演化分析研究綜述[J];廣東工業(yè)大學學報;2015年02期
10 DONG Guozhong;LI Ruiguang;YANG Wu;WANG Wei;GONG Liangyi;SHEN Guowei;YU Miao;LV Jiguang;;Microblog Burst Keywords Detection Based on Social Trust and Dynamics Model[J];Chinese Journal of Electronics;2014年04期
中國重要會議論文全文數(shù)據(jù)庫 前5條
1 高繼平;丁X;;基于德溫特專利數(shù)據(jù)庫兩岸納米專利的定量研究[A];經(jīng)濟發(fā)展方式轉(zhuǎn)變與自主創(chuàng)新——第十二屆中國科學技術協(xié)會年會(第四卷)[C];2010年
2 高繼平;丁X;;基于德溫特專利數(shù)據(jù)庫兩岸納米專利的定量研究[A];第12屆中國科協(xié)年會第31分會場海峽兩岸區(qū)域合作與協(xié)同發(fā)展論壇論文集[C];2010年
3 周春姐;孟小峰;文潔;;Flickr中的復合事件檢測[A];NDBC2010第27屆中國數(shù)據(jù)庫學術會議論文集(B輯)[C];2010年
4 邱均平;柴雯;;國際科學計量學研究的進展與趨勢[A];第十屆中國科技政策與管理學術年會論文集——分6:區(qū)域創(chuàng)新與綠色發(fā)展(Ⅰ)[C];2014年
5 杜剛;張晨;朱艷云;杜雪濤;孟德香;;移動偽基站定位和軌跡追蹤技術研究[A];2014全國無線及移動通信學術大會論文集[C];2014年
中國博士學位論文全文數(shù)據(jù)庫 前10條
1 陳偉;基于時序文本挖掘的新聞內(nèi)容理解與推薦技術研究[D];浙江大學;2010年
2 謝興;社會網(wǎng)絡中興趣發(fā)現(xiàn)與信息組織的研究[D];復旦大學;2011年
3 龐杰;知識流動理論框架下的科學前沿與技術前沿研究[D];大連理工大學;2011年
4 張?zhí)斐?實時數(shù)據(jù)流相關性分析與挖掘技術研究[D];東北大學;2008年
5 李小寧;藥品監(jiān)管的多元參與:科學計量學的視角[D];大連理工大學;2010年
6 杜剛;新聞數(shù)據(jù)中突發(fā)話題檢測研究[D];北京郵電大學;2012年
7 李軍;基于用戶行為挖掘的數(shù)據(jù)流管理技術研究[D];北京郵電大學;2012年
8 郭涵寧;多元科學指標視角下的新興研究領域識別探索[D];大連理工大學;2013年
9 盛立;生物醫(yī)學領域研究前沿識別與趨勢預測[D];中國人民解放軍軍事醫(yī)學科學院;2013年
10 吳聯(lián)仁;基于人類動力學的社交網(wǎng)絡信息傳播實證分析與建模研究[D];北京郵電大學;2013年
中國碩士學位論文全文數(shù)據(jù)庫 前10條
1 喬文妤;高校BBS平臺信息有序化研究[D];南京大學;2011年
2 徐東亮;基于聚類分析的網(wǎng)絡論壇輿情信息挖掘技術研究[D];哈爾濱工業(yè)大學;2010年
3 孔旗;基于并行機器學習的大規(guī)模專利分類[D];上海交通大學;2011年
4 劉豐;基于微博的突發(fā)事件檢測和信息傳播建模[D];哈爾濱工業(yè)大學;2011年
5 李璐e,
本文編號:897180
本文鏈接:http://www.sikaile.net/guanlilunwen/ydhl/897180.html