社交網(wǎng)絡(luò)虛假媒體內(nèi)容檢測研究
發(fā)布時間:2023-02-23 19:12
在互聯(lián)網(wǎng)高度發(fā)達的今天,移動資訊高速流動,微博等社交網(wǎng)絡(luò)媒體所涵蓋的信息量正以指數(shù)級的速度增長,并逐漸成為人們分享生活、互動交友和獲取信息的主要平臺之一。然而,在進行信息消費時,由于媒體內(nèi)容自身所擁有的便捷訪問、快速傳播、低成本的特點,使其成為當(dāng)今我國虛假輿情泛濫的主要策源地和傳播介質(zhì),影響人們的日常生活。虛假媒體內(nèi)容檢測技術(shù)就是一項針對社交網(wǎng)絡(luò)中的海量信息進行挖掘、分析、識別和過濾的技術(shù),能夠及時發(fā)現(xiàn)和處理社交網(wǎng)絡(luò)中的虛假媒體內(nèi)容,防止人們在認識事物和生活消費時受到此種信息的誤導(dǎo)。本文主要基于傳統(tǒng)機器學(xué)習(xí)方法和深度學(xué)習(xí)方法對社交網(wǎng)絡(luò)虛假媒體內(nèi)容進行檢測研究,并構(gòu)建了性能優(yōu)良的分類模型。具體研究內(nèi)容如下:1)本文利用傳統(tǒng)機器學(xué)習(xí)方法構(gòu)建基于集成學(xué)習(xí)的虛假媒體內(nèi)容分類模型。通過觀察數(shù)據(jù)集結(jié)構(gòu)特點,采集所需數(shù)據(jù),制定對應(yīng)的文本清洗方法,借助正則表達式抽取微博正文內(nèi)容特征,利用人工拓建的中文情感詞庫提取各微博事件的評論情感傾向性特征,結(jié)合用戶特征和傳播特征,構(gòu)建特征集,并借用常用的機器學(xué)習(xí)方法,構(gòu)建基分類器,最后使用Stacking集成方法構(gòu)建強分類器,實驗結(jié)果顯示其準確率達到93.19%,...
【文章頁數(shù)】:76 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
abstract
第一章 緒論
1.1 研究背景及意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 國外研究現(xiàn)狀
1.2.2 國內(nèi)研究現(xiàn)狀
1.3 本文研究內(nèi)容
1.4 論文結(jié)構(gòu)安排
第二章 虛假媒體內(nèi)容檢測的相關(guān)技術(shù)研究
2.1 文本預(yù)處理技術(shù)
2.1.1 中文分詞
2.1.2 word2vec詞向量模型
2.2 基于傳統(tǒng)機器學(xué)習(xí)的文本分類方法
2.2.1 樸素貝葉斯
2.2.2 支持向量機
2.2.3 邏輯回歸
2.2.4 決策樹
2.3 基于深度學(xué)習(xí)的文本分類方法
2.3.1 RNN及其變體
2.3.2 注意力機制
2.4 集成學(xué)習(xí)
2.5 模型的評價指標
2.6 本章小結(jié)
第三章 基于傳統(tǒng)機器學(xué)習(xí)的虛假媒體內(nèi)容分類方法
3.1 數(shù)據(jù)獲取及預(yù)處理
3.1.1 數(shù)據(jù)獲取及詞庫構(gòu)建
3.1.2 文本清洗
3.1.3 文本切分處理
3.2 特征工程
3.2.1 特征簡介
3.2.2 表層特征提取
3.2.3 評論情感傾向性特征提取
3.3 基于Stacking集成方法的虛假媒體內(nèi)容檢測模型
3.3.1 模型簡述
3.3.2 虛假媒體內(nèi)容檢測算法
3.4 實驗及結(jié)果分析
3.4.1 實驗環(huán)境及評估指標
3.4.2 相關(guān)特征的有效性驗證與結(jié)果分析
3.4.3 集成分類模型的有效性驗證及結(jié)果分析
3.5 本章小結(jié)
第四章 基于深度學(xué)習(xí)的虛假媒體內(nèi)容分類方法
4.1 獲取微博正文和評論文本的詞向量
4.2 基于集成學(xué)習(xí)的虛假媒體內(nèi)容檢測模型
4.2.1 模型描述
4.2.2 微博正文表示
4.2.3 評論文本表示
4.2.4 基于微博正文和評論文本的虛假媒體內(nèi)容檢測算法
4.3 實驗及結(jié)果分析
4.3.1 實驗環(huán)境及評價指標
4.3.2 對比方法介紹
4.3.3 各模型對比實驗
4.4 本章小結(jié)
第五章 社交網(wǎng)絡(luò)虛假媒體內(nèi)容檢測系統(tǒng)
5.1 需求分析
5.2 可行性分析
5.3 系統(tǒng)詳細設(shè)計
5.4 功能模塊設(shè)計
5.4.1 話題模塊
5.4.2 邏輯處理模塊
5.4.3 模型計算模塊
5.5 功能演示
5.5.1 系統(tǒng)開發(fā)環(huán)境
5.5.2 話題內(nèi)容的虛假性檢測
5.5.3 模型訓(xùn)練
5.6 本章小結(jié)
第六章 總結(jié)與展望
6.1 工作總結(jié)
6.2 未來工作展望
致謝
參考文獻
攻讀碩士學(xué)位期間取得的成果
本文編號:3748579
【文章頁數(shù)】:76 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
abstract
第一章 緒論
1.1 研究背景及意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 國外研究現(xiàn)狀
1.2.2 國內(nèi)研究現(xiàn)狀
1.3 本文研究內(nèi)容
1.4 論文結(jié)構(gòu)安排
第二章 虛假媒體內(nèi)容檢測的相關(guān)技術(shù)研究
2.1 文本預(yù)處理技術(shù)
2.1.1 中文分詞
2.1.2 word2vec詞向量模型
2.2 基于傳統(tǒng)機器學(xué)習(xí)的文本分類方法
2.2.1 樸素貝葉斯
2.2.2 支持向量機
2.2.3 邏輯回歸
2.2.4 決策樹
2.3 基于深度學(xué)習(xí)的文本分類方法
2.3.1 RNN及其變體
2.3.2 注意力機制
2.4 集成學(xué)習(xí)
2.5 模型的評價指標
2.6 本章小結(jié)
第三章 基于傳統(tǒng)機器學(xué)習(xí)的虛假媒體內(nèi)容分類方法
3.1 數(shù)據(jù)獲取及預(yù)處理
3.1.1 數(shù)據(jù)獲取及詞庫構(gòu)建
3.1.2 文本清洗
3.1.3 文本切分處理
3.2 特征工程
3.2.1 特征簡介
3.2.2 表層特征提取
3.2.3 評論情感傾向性特征提取
3.3 基于Stacking集成方法的虛假媒體內(nèi)容檢測模型
3.3.1 模型簡述
3.3.2 虛假媒體內(nèi)容檢測算法
3.4 實驗及結(jié)果分析
3.4.1 實驗環(huán)境及評估指標
3.4.2 相關(guān)特征的有效性驗證與結(jié)果分析
3.4.3 集成分類模型的有效性驗證及結(jié)果分析
3.5 本章小結(jié)
第四章 基于深度學(xué)習(xí)的虛假媒體內(nèi)容分類方法
4.1 獲取微博正文和評論文本的詞向量
4.2 基于集成學(xué)習(xí)的虛假媒體內(nèi)容檢測模型
4.2.1 模型描述
4.2.2 微博正文表示
4.2.3 評論文本表示
4.2.4 基于微博正文和評論文本的虛假媒體內(nèi)容檢測算法
4.3 實驗及結(jié)果分析
4.3.1 實驗環(huán)境及評價指標
4.3.2 對比方法介紹
4.3.3 各模型對比實驗
4.4 本章小結(jié)
第五章 社交網(wǎng)絡(luò)虛假媒體內(nèi)容檢測系統(tǒng)
5.1 需求分析
5.2 可行性分析
5.3 系統(tǒng)詳細設(shè)計
5.4 功能模塊設(shè)計
5.4.1 話題模塊
5.4.2 邏輯處理模塊
5.4.3 模型計算模塊
5.5 功能演示
5.5.1 系統(tǒng)開發(fā)環(huán)境
5.5.2 話題內(nèi)容的虛假性檢測
5.5.3 模型訓(xùn)練
5.6 本章小結(jié)
第六章 總結(jié)與展望
6.1 工作總結(jié)
6.2 未來工作展望
致謝
參考文獻
攻讀碩士學(xué)位期間取得的成果
本文編號:3748579
本文鏈接:http://www.sikaile.net/kejilunwen/shengwushengchang/3748579.html
最近更新
教材專著