基于微博的主題社區(qū)發(fā)現(xiàn)
發(fā)布時間:2019-10-13 22:36
【摘要】:微博,作為一種新興的互聯(lián)網(wǎng)交流與分享平臺,已經(jīng)獲得巨大數(shù)量用戶的親睞,Twitter、FaceBook、Sina、Tencent等微博網(wǎng)站已成為海量信息的發(fā)布體。微博平臺中蘊含著大量有價值的信息有待挖掘。 在數(shù)據(jù)挖掘領(lǐng)域,盡管傳統(tǒng)的基于文本、基于內(nèi)容的挖掘分析方法已經(jīng)得到了廣泛的研究并取得了很大的成功。但對于微博文本的特殊性,每條文本信息短小、口語化且?guī)в幸恍┙Y(jié)構(gòu)化社會網(wǎng)絡(luò)方面的信息,傳統(tǒng)的文本挖掘算法不能很好的對它進行建模。而由于海量用戶及信息的存在,使微博的數(shù)據(jù)挖掘不能僅僅依靠用戶關(guān)系的分析。 為了滿足微博營銷尋找投放目標的需求,本文綜合考慮了面向微博文本內(nèi)容及微博用戶社會化鏈接關(guān)系,提出了一種微博主題社區(qū)的發(fā)現(xiàn)方法。文中創(chuàng)造性的結(jié)合了領(lǐng)袖發(fā)現(xiàn)、文本分類以及最大流社區(qū)發(fā)現(xiàn)的基于內(nèi)容、鏈接關(guān)系的分析技術(shù),同時采用多種剪枝策略,設(shè)計出了一個比較高效準確的微博主題爬蟲。 實驗經(jīng)過真實數(shù)據(jù)的采集,并且從不同的維度對結(jié)果數(shù)據(jù)進行了實驗分析。
【學位授予單位】:華東理工大學
【學位級別】:碩士
【學位授予年份】:2013
【分類號】:TP393.092;TP311.13
本文編號:2548927
【學位授予單位】:華東理工大學
【學位級別】:碩士
【學位授予年份】:2013
【分類號】:TP393.092;TP311.13
【參考文獻】
相關(guān)期刊論文 前10條
1 汪濤,樊孝忠,顧益軍,劉林;基于概念分析的主題爬蟲設(shè)計[J];北京理工大學學報;2004年10期
2 李林容;黎薇;;微博的文化特性及傳播價值[J];當代傳播;2011年01期
3 曾水香;羅林波;;基于改進Hits算法的多主題爬蟲研究與實現(xiàn)[J];福建電腦;2010年05期
4 劉林,汪濤,樊孝忠;主題爬蟲的解決方案[J];華南理工大學學報(自然科學版);2004年S1期
5 金永生;王睿;陳祥兵;;企業(yè)微博營銷效果和粉絲數(shù)量的短期互動模型[J];管理科學;2011年04期
6 張晨逸;孫建伶;丁軼群;;基于MB-LDA模型的微博主題挖掘[J];計算機研究與發(fā)展;2011年10期
7 周德懋;李舟軍;;高性能網(wǎng)絡(luò)爬蟲:研究綜述[J];計算機科學;2009年08期
8 張金增;范明;;一種改進的基于最大流的Web社區(qū)挖掘算法[J];計算機應(yīng)用;2009年01期
9 皮靖;邵雄凱;肖雅夫;;基于樸素貝葉斯算法的主題爬蟲的研究[J];計算機與數(shù)字工程;2012年06期
10 高琰;谷士文;唐t;;基于鏈接分析的Web社區(qū)發(fā)現(xiàn)技術(shù)的研究[J];計算機應(yīng)用研究;2006年07期
,本文編號:2548927
本文鏈接:http://www.sikaile.net/guanlilunwen/ydhl/2548927.html
最近更新
教材專著