天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于AT模型的微博用戶興趣挖掘研究

發(fā)布時(shí)間:2017-11-09 21:27

  本文關(guān)鍵詞:基于AT模型的微博用戶興趣挖掘研究


  更多相關(guān)文章: 微博 主題挖掘 AT模型 吉布斯采樣


【摘要】:隨著微博的日趨流行與廣泛使用,新浪等微博網(wǎng)站已經(jīng)成為海量信息的來源,雖然傳統(tǒng)的文本主題挖掘方法已經(jīng)得到廣泛的應(yīng)用研究,但對(duì)于微博這種特殊結(jié)構(gòu)的文本,傳統(tǒng)的挖掘算法不能很好地對(duì)其進(jìn)行研究。為了彌補(bǔ)目前微博平臺(tái)主題挖掘方法的不足,以及考慮到微博信息的稀疏性,多維性等特點(diǎn),提出有針對(duì)性的預(yù)處理方法,將用戶微博數(shù)據(jù)與AT模型結(jié)合,通過吉布斯采樣進(jìn)行微博主題挖掘,對(duì)作者主題進(jìn)一步提取得到用戶興趣。通過在真實(shí)數(shù)據(jù)集上的實(shí)驗(yàn),以及與LDA模型對(duì)比,證明該模型能有效得到微博主題。
【作者單位】: 遼寧工程技術(shù)大學(xué)軟件學(xué)院;
【基金】:國(guó)家自然科學(xué)基金(No.60903082) 遼寧省教育廳項(xiàng)目(No.L2012113)
【分類號(hào)】:TP393.092;TP391.1
【正文快照】: 1引言作為一個(gè)提供用戶互相交流與分享信息的社交網(wǎng)站,微博以其簡(jiǎn)單、便捷,傳遞速度快等特性,受到廣大用戶的青睞,并風(fēng)靡全球。著名的Twitter微博網(wǎng)站用戶數(shù)已經(jīng)突破5億[1],而截至2012年8月,新浪微博用戶數(shù)已達(dá)3.65億。用戶不僅可以通過微博網(wǎng)站平臺(tái)發(fā)布自己最新的情況、表達(dá)

【參考文獻(xiàn)】

中國(guó)期刊全文數(shù)據(jù)庫 前8條

1 吳晶;張品;羅辛;盛浩;熊璋;;門戶個(gè)性化興趣獲取與遷移模式發(fā)現(xiàn)[J];計(jì)算機(jī)研究與發(fā)展;2007年08期

2 張晨逸;孫建伶;丁軼群;;基于MB-LDA模型的微博主題挖掘[J];計(jì)算機(jī)研究與發(fā)展;2011年10期

3 康楠;金蓓弘;李京;;面向Blog的興趣挖掘和推薦系統(tǒng)[J];計(jì)算機(jī)工程;2008年02期

4 徐戈;王厚峰;;自然語言處理中主題模型的發(fā)展[J];計(jì)算機(jī)學(xué)報(bào);2011年08期

5 刁宇峰;楊亮;林鴻飛;;基于LDA模型的博客垃圾評(píng)論發(fā)現(xiàn)[J];中文信息學(xué)報(bào);2011年01期

6 石晶;范猛;李萬龍;;基于LDA模型的主題分析[J];自動(dòng)化學(xué)報(bào);2009年12期

7 唐曉波;王洪艷;;基于潛在語義分析的微博主題挖掘模型研究[J];圖書情報(bào)工作;2012年24期

8 趙愛華;劉培玉;鄭燕;;基于LDA的新聞話題子話題劃分方法[J];小型微型計(jì)算機(jī)系統(tǒng);2013年04期

【共引文獻(xiàn)】

中國(guó)期刊全文數(shù)據(jù)庫 前10條

1 郭力軍;朱群雄;;基于RSS數(shù)據(jù)源的用戶興趣模型改進(jìn)及應(yīng)用[J];北京化工大學(xué)學(xué)報(bào)(自然科學(xué)版);2011年01期

2 胡艷麗;白亮;張維明;;網(wǎng)絡(luò)輿情中一種基于OLDA的在線話題演化方法[J];國(guó)防科技大學(xué)學(xué)報(bào);2012年01期

3 孫乃利;王玉龍;沈奇威;;微博客意見領(lǐng)袖識(shí)別的研究[J];電信技術(shù);2012年12期

4 朱然;李德華;;新聞聚合系統(tǒng)中的數(shù)據(jù)挖掘技術(shù)初探[J];電腦知識(shí)與技術(shù);2013年01期

5 王君澤;馬靜;杜洪濤;;微博輿情分析平臺(tái)的框架與支撐技術(shù)研究[J];電子政務(wù);2013年01期

6 葛昊;葉艷;包西林;吳敏;;基于主題模型的英語寫作批閱系統(tǒng)個(gè)性化推薦模塊設(shè)計(jì)與實(shí)現(xiàn)[J];科技和產(chǎn)業(yè);2013年06期

7 王旭仁;姚葉鵬;冉春風(fēng);何發(fā)鎂;;一種并行LDA主題模型建立方法研究[J];北京理工大學(xué)學(xué)報(bào);2013年06期

8 劉江鳴;徐金安;張玉潔;;基于隱主題馬爾科夫模型的多特征自動(dòng)文摘[J];北京大學(xué)學(xué)報(bào)(自然科學(xué)版);2014年01期

9 鄭誠(chéng);熊大康;劉倩倩;;基于卡方特征選擇和LDA主題模型的中文短文本分類[J];電腦知識(shí)與技術(shù);2014年13期

10 談成訪;汪材印;;基于LDA模型的新聞話題分類研究[J];電腦知識(shí)與技術(shù);2014年16期

中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫 前2條

1 劉娜;肖智博;路瑩;唐曉君;肖鵬;;自適應(yīng)主題融合的多文檔自動(dòng)摘要算法[A];2013年中國(guó)智能自動(dòng)化學(xué)術(shù)會(huì)議論文集(第五分冊(cè))[C];2013年

2 丁兆云;王暉;;一種詞位置相關(guān)的LDA模型[A];2013第一屆中國(guó)指揮控制大會(huì)論文集[C];2013年

中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫 前10條

1 劉慧君;用戶瀏覽模式挖掘方法與應(yīng)用研究[D];重慶大學(xué);2010年

2 劉娜;文本自動(dòng)摘要和信息抽取方法及其應(yīng)用研究[D];大連海事大學(xué);2012年

3 張冬梅;文本情感分類及觀點(diǎn)摘要關(guān)鍵問題研究[D];山東大學(xué);2012年

4 賈冬梅;基于數(shù)據(jù)挖掘方法的聶莉芳教授治療慢性腎小球腎炎經(jīng)驗(yàn)研究[D];中國(guó)中醫(yī)科學(xué)院;2012年

5 王志軍;面向標(biāo)識(shí)商品的RFID網(wǎng)絡(luò)情境信息管理研究[D];東華大學(xué);2013年

6 羅遠(yuǎn)勝;跨語言信息檢索中雙語主題模型及算法研究[D];江西財(cái)經(jīng)大學(xué);2013年

7 段東圣;社會(huì)網(wǎng)絡(luò)中群組探測(cè)和話題建模技術(shù)研究[D];華中科技大學(xué);2013年

8 陸前;英、漢跨語言話題檢測(cè)與跟蹤技術(shù)研究[D];中央民族大學(xué);2013年

9 劉杰;食品安全突發(fā)事件跨媒體信息的語義分析與分類研究[D];北京郵電大學(xué);2013年

10 田占偉;基于復(fù)雜網(wǎng)絡(luò)的微博信息傳播研究[D];哈爾濱工業(yè)大學(xué);2012年

中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫 前10條

1 曾凡興;基于用戶興趣和瀏覽行為的個(gè)性化推薦技術(shù)研究[D];江西農(nóng)業(yè)大學(xué);2011年

2 戎怡;局部描述特征結(jié)合概率潛在語義模型的場(chǎng)景分類技術(shù)研究[D];燕山大學(xué);2010年

3 王嵩;基于貝葉斯理論的社會(huì)化標(biāo)注主題聚類模型研究[D];江蘇科技大學(xué);2011年

4 劉星;基于融合分類器的垃圾評(píng)論識(shí)別方法研究[D];天津大學(xué);2012年

5 刁宇峰;基于博客的作者聲譽(yù)度分析[D];大連理工大學(xué);2011年

6 劉慧;基于Agent元搜索引擎的個(gè)性化研究[D];東華大學(xué);2012年

7 姜楊;基于社會(huì)化媒體節(jié)點(diǎn)屬性的信息預(yù)測(cè)研究[D];北京郵電大學(xué);2012年

8 劉紅艷;基于hLDA層次主題模型的多文檔摘要技術(shù)研究[D];北京郵電大學(xué);2012年

9 蔣,

本文編號(hào):1163678


資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/guanlilunwen/ydhl/1163678.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶43b27***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com