基于集成分類器的微博謠言檢測算法研究
發(fā)布時間:2024-03-19 00:22
微博的信息多元化、言論自由、爆炸式地傳播速度等特點助長了謠言消息的生成和傳播,使得微博成為了虛假不實消息傳播的理想場所。因此,自動進行謠言檢測的相關研究應運而生,F(xiàn)有的謠言檢測算法取得了一些成果,但仍然還有待提升之處。首先,謠言檢測正確率尤其是謠言早期檢測正確率還有提升的空間;其次,現(xiàn)有謠言檢測算法并未考慮到訓練數據類別不平衡問題,會使得學習器不能充分學習到少數類樣本的分布。為了解決以上問題,本文開展相關研究工作,提出了基于集成分類器的GTB-RD謠言檢測算法和基于生成對抗訓練的GAN-SMOTE算法。本文的主要工作如下:1.提出了基于集成分類器的謠言檢測算法GTB-RD,F(xiàn)有微博謠言檢測算法大多是一個單一的檢測模型。為了提升謠言檢測算法的正確率,本文基于集成學習的思想,采用梯度提升方法將多個基礎檢測器的檢測結果結合,提出了一種新的謠言檢測算法GTB-RD。2.提出了適用于GTB-RD的特征選擇算法、構造了新的特征,并采用所提出的特性選擇算法進行特征選擇,將這些特征應用到GTB-RD謠言檢測算法中,提高了謠言早期檢測正確率,F(xiàn)有的謠言檢測算法過多依賴于微博傳播結構和微博評論等相關特征,...
【文章頁數】:73 頁
【學位級別】:碩士
【部分圖文】:
本文編號:3932041
【文章頁數】:73 頁
【學位級別】:碩士
【部分圖文】:
圖2-2RNN-based謠言檢測算法使用的幾種檢測算法的模型結構
4←Equipartition(L());5←{emptyintervals};6′←;7Find′suchthatcontainscontinuousintervalsthatcoverth....
圖2-3謠言和非謠言某特征隨時間的變化情況
圖2-3謠言和非謠言某特征隨時間的變化情況[12]STS(DynamicSeries-TimeStructure),用于描述例,E={E1,E2,…,En},其中E包含多個跟此微博、轉發(fā)內容等)。首先構造時間區(qū)間,區(qū)間長度I¢¨|a()....
圖2-4KNN確定噪聲點[23]
電子科技大學碩士學位論文樣本是噪聲樣本,噪聲樣本會在此階段被丟棄。算法的第二步驟為即進行多次欠采樣處理,每次從原始訓練數據集中隨機選擇N個本(假設少量類型的樣本的數量為N),生成多個平衡的訓練數據三步為,在得到的經過了欠采樣處理后類別平衡的多個訓練子集上器的訓練,最終構成一....
圖2-6GAN的應用領域示例
征選擇是提升學習器性能的關鍵所在。生成對抗網絡GAN(Generativeadversarialnetworks):生成對抗網絡是由Goodfellow[66]等在2014年提出的一種生成模型框架,目前已成為人工智能領域中的一個熱門研究方向。GAN是一種生成式模型,其....
本文編號:3932041
本文鏈接:http://www.sikaile.net/guanlilunwen/ydhl/3932041.html
最近更新
教材專著