【摘要】:隨著互聯(lián)網(wǎng)的不斷發(fā)展和用戶需求的不斷提高,有關(guān)網(wǎng)絡(luò)用戶的行為分析和數(shù)據(jù)挖掘研究迅速發(fā)展起來。作為Web2.0技術(shù)的典型代表,網(wǎng)絡(luò)論壇承擔(dān)著傳播信息和輿論導(dǎo)向的作用。因此,對(duì)論壇用戶的興趣建模和預(yù)測(cè)不僅有助于正確分析用戶的興趣所在,而且有助于向用戶提供個(gè)性化服務(wù)。論壇帖子的熱度預(yù)測(cè)對(duì)于提前掌握輿論動(dòng)向具有重要意義。 本文首先對(duì)常用的數(shù)據(jù)挖掘算法和用戶興趣模型進(jìn)行簡(jiǎn)要介紹,然后對(duì)天涯論壇的用戶數(shù)據(jù)集進(jìn)行處理分析,設(shè)計(jì)了適合論壇的用戶興趣權(quán)重更新算法,并對(duì)用戶興趣進(jìn)行有效預(yù)測(cè),接下來分析了帖子熱度的影響特征來對(duì)熱門帖子進(jìn)行預(yù)測(cè)。 基于論壇訪問時(shí)間間隔和發(fā)帖回帖數(shù)量的用戶興趣權(quán)重更新算法,建立在用戶訪問時(shí)間存在較大間隔的基礎(chǔ)上,將用戶的訪問時(shí)間間隔和發(fā)帖回帖次數(shù)同時(shí)作為權(quán)重計(jì)算的重要變量;在興趣預(yù)測(cè)方面,設(shè)計(jì)了一種兩階段的用戶興趣聚類算法。通過對(duì)論壇數(shù)據(jù)集進(jìn)行仿真實(shí)驗(yàn),驗(yàn)證了用戶興趣更新算法和推薦的有效性和準(zhǔn)確性。 論壇帖子熱度受多方面因素的影響。根據(jù)網(wǎng)站用戶的好友關(guān)系、關(guān)注關(guān)系、經(jīng)驗(yàn)值等信息提取出用戶性質(zhì)和用戶關(guān)系特征;帖子受眾程度與其討論內(nèi)容有密切聯(lián)系,因此帖子內(nèi)容也是熱度的重要影響因素;另外,帖子的發(fā)帖時(shí)間也會(huì)對(duì)其熱度產(chǎn)生一定程度的影響。在分析帖子熱度影響特征的基礎(chǔ)上對(duì)帖子熱度進(jìn)行支持向量機(jī)回歸,取得了滿意的預(yù)測(cè)結(jié)果。 最后,將用戶興趣建模和熱帖預(yù)測(cè)相關(guān)算法應(yīng)用到網(wǎng)絡(luò)輿論分析中,設(shè)計(jì)了基于論壇的用戶行為分析系統(tǒng)。系統(tǒng)分為數(shù)據(jù)獲取、數(shù)據(jù)預(yù)處理、用戶行為分析和數(shù)據(jù)存儲(chǔ)模塊,負(fù)責(zé)實(shí)現(xiàn)用戶興趣識(shí)別、上網(wǎng)時(shí)間統(tǒng)計(jì)、活躍用戶發(fā)現(xiàn)、意見領(lǐng)袖發(fā)現(xiàn)和熱帖預(yù)測(cè)等功能,并詳細(xì)介紹了各個(gè)模塊的設(shè)計(jì),然后對(duì)系統(tǒng)的設(shè)計(jì)框架進(jìn)行構(gòu)建,作為未來系統(tǒng)實(shí)現(xiàn)的基礎(chǔ)。 論文的工作得到了國(guó)家自然科學(xué)基金(No.61172072,61271308)、北京市自然科學(xué)基金(No.4112045)、高等教育博士點(diǎn)基金(No.W11C100030)、北京科技計(jì)劃(No.Z121100000312024)和北京市教育委員會(huì)學(xué)科建設(shè)與研究生建設(shè)項(xiàng)目等課題的支持。
【學(xué)位授予單位】:北京交通大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2014
【分類號(hào)】:TP393.09;TP311.13
【參考文獻(xiàn)】
相關(guān)期刊論文 前9條
1 徐衛(wèi);陳麗亞;劉功申;;基于用戶行為分析的網(wǎng)站廣告投放策略[J];計(jì)算機(jī)工程與應(yīng)用;2006年28期
2 付關(guān)友,朱征宇;個(gè)性化服務(wù)中基于行為分析的用戶興趣建模[J];計(jì)算機(jī)工程與科學(xué);2005年12期
3 楊亮;林原;林鴻飛;;基于情感分布的微博熱點(diǎn)事件發(fā)現(xiàn)[J];中文信息學(xué)報(bào);2012年01期
4 張學(xué)工;關(guān)于統(tǒng)計(jì)學(xué)習(xí)理論與支持向量機(jī)[J];自動(dòng)化學(xué)報(bào);2000年01期
5 于洪;李轉(zhuǎn)運(yùn);;基于遺忘曲線的協(xié)同過濾推薦算法[J];南京大學(xué)學(xué)報(bào)(自然科學(xué)版);2010年05期
6 高彬;;大學(xué)生社交網(wǎng)站使用動(dòng)機(jī)研究——以人人網(wǎng)為例[J];學(xué)理論;2012年17期
7 陳克寒;韓盼盼;吳健;;基于用戶聚類的異構(gòu)社交網(wǎng)絡(luò)推薦算法[J];計(jì)算機(jī)學(xué)報(bào);2013年02期
8 陳珂,殷國(guó)富,羅小賓;基于統(tǒng)計(jì)特征聚類原理的圖像識(shí)別技術(shù)[J];四川大學(xué)學(xué)報(bào)(工程科學(xué)版);2003年03期
9 費(fèi)巍;黃如花;;基于用戶行為分析的搜索引擎優(yōu)化策略[J];圖書情報(bào)工作;2005年10期
,
本文編號(hào):
2542290
本文鏈接:http://www.sikaile.net/guanlilunwen/ydhl/2542290.html