基于隱性語(yǔ)義挖掘的社區(qū)劃分算法
發(fā)布時(shí)間:2021-08-26 21:26
Web2.0時(shí)代,社交網(wǎng)絡(luò)在世界范圍內(nèi)流行了起來(lái)。社交網(wǎng)絡(luò)中用戶結(jié)構(gòu)、信息結(jié)構(gòu)和社群結(jié)構(gòu)是社交網(wǎng)絡(luò)所研究的重點(diǎn)課題。近年來(lái),中國(guó)新浪微博的發(fā)展速度很快,并且為開(kāi)發(fā)者和研究者提供了便于開(kāi)發(fā)與研究的數(shù)據(jù)開(kāi)放平臺(tái),成為業(yè)界和學(xué)術(shù)界研究的熱點(diǎn)。本文基于新浪微博開(kāi)放平臺(tái)的數(shù)據(jù),對(duì)新浪微博的用戶結(jié)構(gòu)、信息結(jié)構(gòu)做了詳細(xì)的統(tǒng)計(jì)和分析。在新浪微博用戶社區(qū)結(jié)構(gòu)上,結(jié)合新浪微博社交性和媒體性特點(diǎn),本文提出了將用戶的“社交”維度和“興趣”維度分開(kāi)的主張。作者用適合社區(qū)檢索的LDA(隱性語(yǔ)義挖掘)的算法,對(duì)原本用于“詞-文本”挖掘的算法進(jìn)行了改進(jìn),將“用戶-好友”和“用戶-興趣點(diǎn)”作為L(zhǎng)DA的初始資料庫(kù),進(jìn)行訓(xùn)練和分群。在文章中,作者對(duì)新浪微博的用戶進(jìn)行了分類,統(tǒng)計(jì)了所有類別用戶的在關(guān)系結(jié)構(gòu)上的比例特點(diǎn),并對(duì)其中的統(tǒng)計(jì)特點(diǎn)做了詳細(xì)的解釋。同時(shí),作者對(duì)新浪微博的微博信息進(jìn)行了分類,統(tǒng)計(jì)和分析了各類信息、不同用戶的發(fā)布和轉(zhuǎn)發(fā)情況,并對(duì)各種統(tǒng)計(jì)現(xiàn)象做了詳細(xì)解釋。本文對(duì)“社交群”與“興趣群”重疊的網(wǎng)絡(luò),提出了改進(jìn)的LDA模型。1.本文提出了SI-LDA算法模型。其基本假設(shè)是每一個(gè)人都是可以用他的好友來(lái)形容,同時(shí)用戶的興...
【文章來(lái)源】:電子科技大學(xué)四川省 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:79 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
一個(gè)用絡(luò)是重疊的,用戶d的微博其重疊部分博網(wǎng)絡(luò)的建模分是用戶d因模因?yàn)榕d趣而關(guān)注的大眾用戶戶u
社區(qū)劃分的過(guò)程
黃宇KaldrArt的Louvain算法社臣劃分
本文編號(hào):3364997
【文章來(lái)源】:電子科技大學(xué)四川省 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:79 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
一個(gè)用絡(luò)是重疊的,用戶d的微博其重疊部分博網(wǎng)絡(luò)的建模分是用戶d因模因?yàn)榕d趣而關(guān)注的大眾用戶戶u
社區(qū)劃分的過(guò)程
黃宇KaldrArt的Louvain算法社臣劃分
本文編號(hào):3364997
本文鏈接:http://www.sikaile.net/guanlilunwen/ydhl/3364997.html
最近更新
教材專著