社交網(wǎng)絡(luò)賬號(hào)的智能分類方法
發(fā)布時(shí)間:2023-09-24 17:20
隨著信息技術(shù)的發(fā)展,以推特(Twitter)、領(lǐng)英(LinkedIn)、微博為代表的在線社交網(wǎng)絡(luò)越來越受到人們的青睞和關(guān)注。推特作為全球最大的在線社交網(wǎng)絡(luò),已經(jīng)成為國外網(wǎng)民發(fā)表自己意見和分享訊息的重要平臺(tái)。推特每日活躍著海量的賬號(hào)(用戶),推特中的賬號(hào)又會(huì)發(fā)布或者轉(zhuǎn)發(fā)大量的文本信息,通常賬號(hào)發(fā)布或者轉(zhuǎn)發(fā)的文本信息與賬號(hào)的興趣愛好及個(gè)人生活息息相關(guān),另一方面,賬號(hào)也會(huì)傾向于關(guān)注與自己有相同興趣愛好的其他賬號(hào),彼此之間的如轉(zhuǎn)發(fā)、提及等互動(dòng)行為也會(huì)更加頻繁。社交網(wǎng)絡(luò)賬號(hào)的分類問題正是基于上述的情況,利用賬號(hào)發(fā)布的文本內(nèi)容以及賬號(hào)間的關(guān)系信息來實(shí)現(xiàn)賬號(hào)分類,以達(dá)到特定類別賬號(hào)個(gè)性化推薦、識(shí)別封禁垃圾賬號(hào)等目的。本文以推特社交網(wǎng)絡(luò)中的賬號(hào)為研究對(duì)象,從賬號(hào)發(fā)布的文本內(nèi)容和賬號(hào)關(guān)系的角度出發(fā),對(duì)推特的賬號(hào)分類問題展開研究,主要研究內(nèi)容如下:1.針對(duì)賬號(hào)的文本表征問題,本文以分布式詞嵌入模型word2vec為基礎(chǔ),考慮到傳統(tǒng)的詞嵌入模型是一個(gè)無監(jiān)督的訓(xùn)練過程,提出了半監(jiān)督賬號(hào)文本嵌入表示模型Semi-User2vec,將賬號(hào)的文本信息映射為一個(gè)稠密的低維向量,生成帶有標(biāo)簽信息的賬號(hào)文本特征向量,然后...
【文章頁數(shù)】:75 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
abstract
第一章 緒論
1.1 研究背景及意義
1.2 國內(nèi)外相關(guān)研究現(xiàn)狀
1.2.1 基于機(jī)器學(xué)習(xí)的賬號(hào)分類方法
1.2.2 基于深度學(xué)習(xí)的賬號(hào)分類
1.3 論文研究內(nèi)容
1.4 論文結(jié)構(gòu)
第二章 賬號(hào)分類研究基礎(chǔ)
2.1 社交網(wǎng)絡(luò)賬號(hào)分類理論基礎(chǔ)
2.1.1 社交網(wǎng)絡(luò)基本概念
2.1.2 復(fù)雜網(wǎng)絡(luò)科學(xué)基礎(chǔ)理論
2.2 機(jī)器學(xué)習(xí)
2.2.1 機(jī)器學(xué)習(xí)的分類
2.2.2 機(jī)器學(xué)習(xí)常用分類器
2.3 文本信息表征方法
2.3.1 詞袋模型
2.3.2 word2vec
2.4 本章小結(jié)
第三章 基于半監(jiān)督User2vec的賬號(hào)分類方法
3.1 數(shù)據(jù)預(yù)處理
3.2 基于半監(jiān)督User2vec的賬號(hào)特征表示
3.2.1 半監(jiān)督賬號(hào)文本嵌入表示
3.2.2 基于文本特征的賬號(hào)分類方法
3.3 基于賬號(hào)文本特征的鄰居相似度
3.3.1 鄰居相似度
3.3.2 基于鄰居相似度的賬號(hào)分類方法
3.4 基于集成學(xué)習(xí)的賬號(hào)分類方法
3.5 實(shí)驗(yàn)及結(jié)果分析
3.5.1 實(shí)驗(yàn)數(shù)據(jù)
3.5.2 分類性能評(píng)估
3.5.3 Semi-User2vec實(shí)驗(yàn)結(jié)果分析
3.5.4 鄰居相似度實(shí)驗(yàn)結(jié)果分析
3.6 本章小結(jié)
第四章 基于多維網(wǎng)絡(luò)的深度學(xué)習(xí)賬號(hào)分類方法
4.1 多維關(guān)系網(wǎng)絡(luò)的構(gòu)建
4.2 基于多維圖卷積網(wǎng)絡(luò)的賬號(hào)分類方法
4.2.1 多維圖卷積網(wǎng)絡(luò)的基本組成
4.2.2 圖卷積網(wǎng)絡(luò)
4.2.3 注意力機(jī)制
4.2.4 賬號(hào)分類方法
4.3 實(shí)驗(yàn)及結(jié)果分析
4.3.1 實(shí)驗(yàn)內(nèi)容
4.3.2 實(shí)驗(yàn)結(jié)果及分析
4.3.3 注意力機(jī)制分析
4.4 本章小結(jié)
第五章 結(jié)論
5.1 后續(xù)工作展望
5.2 全文總結(jié)
致謝
參考文獻(xiàn)
攻讀碩士學(xué)位期間取得的研究成果
本文編號(hào):3848433
【文章頁數(shù)】:75 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
abstract
第一章 緒論
1.1 研究背景及意義
1.2 國內(nèi)外相關(guān)研究現(xiàn)狀
1.2.1 基于機(jī)器學(xué)習(xí)的賬號(hào)分類方法
1.2.2 基于深度學(xué)習(xí)的賬號(hào)分類
1.3 論文研究內(nèi)容
1.4 論文結(jié)構(gòu)
第二章 賬號(hào)分類研究基礎(chǔ)
2.1 社交網(wǎng)絡(luò)賬號(hào)分類理論基礎(chǔ)
2.1.1 社交網(wǎng)絡(luò)基本概念
2.1.2 復(fù)雜網(wǎng)絡(luò)科學(xué)基礎(chǔ)理論
2.2 機(jī)器學(xué)習(xí)
2.2.1 機(jī)器學(xué)習(xí)的分類
2.2.2 機(jī)器學(xué)習(xí)常用分類器
2.3 文本信息表征方法
2.3.1 詞袋模型
2.3.2 word2vec
2.4 本章小結(jié)
第三章 基于半監(jiān)督User2vec的賬號(hào)分類方法
3.1 數(shù)據(jù)預(yù)處理
3.2 基于半監(jiān)督User2vec的賬號(hào)特征表示
3.2.1 半監(jiān)督賬號(hào)文本嵌入表示
3.2.2 基于文本特征的賬號(hào)分類方法
3.3 基于賬號(hào)文本特征的鄰居相似度
3.3.1 鄰居相似度
3.3.2 基于鄰居相似度的賬號(hào)分類方法
3.4 基于集成學(xué)習(xí)的賬號(hào)分類方法
3.5 實(shí)驗(yàn)及結(jié)果分析
3.5.1 實(shí)驗(yàn)數(shù)據(jù)
3.5.2 分類性能評(píng)估
3.5.3 Semi-User2vec實(shí)驗(yàn)結(jié)果分析
3.5.4 鄰居相似度實(shí)驗(yàn)結(jié)果分析
3.6 本章小結(jié)
第四章 基于多維網(wǎng)絡(luò)的深度學(xué)習(xí)賬號(hào)分類方法
4.1 多維關(guān)系網(wǎng)絡(luò)的構(gòu)建
4.2 基于多維圖卷積網(wǎng)絡(luò)的賬號(hào)分類方法
4.2.1 多維圖卷積網(wǎng)絡(luò)的基本組成
4.2.2 圖卷積網(wǎng)絡(luò)
4.2.3 注意力機(jī)制
4.2.4 賬號(hào)分類方法
4.3 實(shí)驗(yàn)及結(jié)果分析
4.3.1 實(shí)驗(yàn)內(nèi)容
4.3.2 實(shí)驗(yàn)結(jié)果及分析
4.3.3 注意力機(jī)制分析
4.4 本章小結(jié)
第五章 結(jié)論
5.1 后續(xù)工作展望
5.2 全文總結(jié)
致謝
參考文獻(xiàn)
攻讀碩士學(xué)位期間取得的研究成果
本文編號(hào):3848433
本文鏈接:http://www.sikaile.net/kejilunwen/shengwushengchang/3848433.html
最近更新
教材專著