天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 社科論文 > 圖書檔案論文 >

基于特征識別與實證分析的熱點事件識別技術研究

發(fā)布時間:2024-04-23 00:35
  網絡熱點事件反映了社會動態(tài)、民生意愿,受到社會各界廣泛關注,但是新聞門戶網站中存在大量冗余的信息,人工的方式難以有效獲取網絡熱點事件相關信息,且部分網絡熱點事件爆發(fā)迅速、影響巨大,人們需要及時了解事件發(fā)展態(tài)勢。因此人們需要計算機能夠在大量的新聞信息中自動發(fā)現(xiàn)網絡熱點事件,甚至在網絡事件的早期對熱點事件進行識別。網絡熱點事件識別技術受到研究者們的廣泛關注,很多研究者使用不同的文本表示模型提升了熱點事件識別的效果,根據已發(fā)生事件和新發(fā)生事件之間的相似性預測新發(fā)生事件的熱度。但是在新聞領域中,提升網絡熱點事件識別效率的研究較少,網絡熱點事件早期識別方法的研究還有所欠缺。本文實證分析網絡熱點事件特征及網絡事件早期特征,基于網絡熱點事件特征改進文本表示方法從而提升網絡熱點事件的識別效率,同時基于網絡事件早期特征提出網絡熱點事件早期識別方法。本文的研究內容及貢獻如下所示:(1)提出了KSSP網絡熱點事件識別方法。本文基于多源新聞爬蟲系統(tǒng)采集的新聞數(shù)據,實證分析了網絡熱點事件的特征。研究發(fā)現(xiàn)網絡熱點事件討論的話題不止一個,在話題偏移的過程中,新話題的部分文本會在文本的開頭對其他話題進行簡短的闡述。根...

【文章頁數(shù)】:93 頁

【學位級別】:碩士

【文章目錄】:
摘要
ABSTRACT
第一章 緒論
    1.1 研究背景與研究意義
    1.2 國內外研究現(xiàn)狀
        1.2.1 網絡熱點事件識別技術
        1.2.2 網絡熱點事件早期識別技術
    1.3 論文研究內容
    1.4 論文組織結構
第二章 相關理論和技術
    2.1 網絡爬蟲技術
        2.1.1 網絡爬蟲概述
        2.1.2 網絡爬蟲的分類
        2.1.3 網絡爬蟲原理
    2.2 文本預處理技術
        2.2.1 文本分詞
        2.2.2 文本表示
        2.2.3 常用向量距離計算公式
    2.3 機器學習聚類方法簡介
        2.3.1 K-Means
        2.3.2 Mini Batch KMeans
        2.3.3 DBSCAN
        2.3.4 Single-Pass
    2.4 網絡熱點事件定義
        2.4.1 二八定律
        2.4.2 網絡熱點事件
    2.5 機器學習分類方法簡介
        2.5.1 邏輯回歸
        2.5.2 決策樹
        2.5.3 SVM
        2.5.4 K近鄰
        2.5.5 樸素貝葉斯
    2.6 本章小結
第三章 KSSP網絡熱點事件識別方法
    3.1 網絡熱點事件特征
        3.1.1 網絡熱點事件話題數(shù)量
        3.1.2 網絡熱點事件話題間的聯(lián)系
    3.2 KSSP網絡熱點事件識別方法
        3.2.1 新聞文本表示及相似度計算方法
        3.2.2 KSSP網絡熱點事件識別方法描述
    3.3 實驗設計與結果分析
        3.3.1 實驗數(shù)據集與實驗設置
        3.3.2 實驗評價指標
        3.3.3 實驗平臺
        3.3.4 實驗結果與分析
    3.4 本章小結
第四章 基于網絡事件早期特征的熱點事件早期識別方法
    4.1 數(shù)據準備
        4.1.1 數(shù)據采集與篩選
        4.1.2 網絡事件熱度計算公式
    4.2 網絡事件早期定義
        4.2.1 網絡熱點事件生命周期
        4.2.2 網絡事件早期定義
    4.3 網絡事件熱度影響因素表現(xiàn)特征
        4.3.1 媒體發(fā)布的新聞數(shù)均值
        4.3.2 媒體關注度
        4.3.3 極端情緒占比
        4.3.4 用戶關注度
    4.4 網絡熱點事件特征有效性驗證
        4.4.1 網絡熱點事件特征中的異常值
        4.4.2 差異顯著性檢驗
    4.5 網絡事件早期特征
        4.5.1 網絡事件早期特征研究數(shù)據集
        4.5.2 網絡事件早期特征
    4.6 基于網絡事件早期特征的熱點事件早期識別方法
    4.7 實驗設置與實驗結果分析
        4.7.1 實驗數(shù)據集
        4.7.2 實驗對比方法
        4.7.3 實驗評估方法
        4.7.4 實驗結果與分析
    4.8 本章小結
第五章 網絡熱點事件識別技術的應用
    5.1 基于大規(guī)模新聞數(shù)據的輿情定制系統(tǒng)
        5.1.1 系統(tǒng)開發(fā)背景介紹
        5.1.2 輿情定制系統(tǒng)功能介紹
        5.1.3 系統(tǒng)難點
    5.2 成果應用及系統(tǒng)功能展示
        5.2.1 成果應用
        5.2.2 系統(tǒng)功能展示
    5.3 本章小結
第六章 總結和展望
    6.1 工作總結
    6.2 未來工作展望
致謝
參考文獻
附錄 作者在讀期間發(fā)表的學術論文及參加的科研項目
詳細摘要



本文編號:3962359

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/tushudanganlunwen/3962359.html


Copyright(c)文論論文網All Rights Reserved | 網站地圖 |

版權申明:資料由用戶ae938***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com