天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于知識圖譜的社會媒體中少數(shù)民族主題數(shù)據(jù)抽取方法

發(fā)布時間:2024-02-19 10:44
  隨著互聯(lián)網技術的發(fā)展,社會媒體在信息傳播中扮演著重要的角色,社會媒體平臺每天產生海量化的數(shù)據(jù),蘊含著各個領域與行業(yè)多種信息。從海量社會媒體數(shù)據(jù)中抽取出特定領域的數(shù)據(jù),是用已有的專家知識作為先驗知識,利用多種數(shù)據(jù)處理模型對數(shù)據(jù)進行分類、過濾篩選的過程?蓱糜谏鐣浾摷、新聞信息傳播、企業(yè)品牌推廣、商業(yè)營銷拓展等,具有重要的社會價值和商業(yè)價值。本文研究社會媒體中少數(shù)民族主題的數(shù)據(jù)抽取,如何解決非結構、多主題的社會媒體數(shù)據(jù)的分類困難,如何解決少數(shù)民族主題數(shù)據(jù)的稀疏、缺失和識別困難,以及如何利用已知有限的專家知識實現(xiàn)更準確、高效的數(shù)據(jù)抽取,成為本文需要解決的主要問題。為此,本文引入知識圖譜(Knowledge Graph,KG)和LDA模型(Latent Dirichlet Allocation),從社會媒體平臺獲取新聞數(shù)據(jù)與用戶數(shù)據(jù),以少數(shù)民族領域的專家知識作為先驗知識,進行社會媒體數(shù)據(jù)的主題分類與內容篩選,從中抽取得到少數(shù)民族主題的數(shù)據(jù)。本文研究工作主要包含以下幾個方面:1、利用已有的少數(shù)民族專家知識,從中讀取實體詞匯作為節(jié)點,詞匯對應的屬性作為節(jié)點與領域名的關系,并獲取實體屬性關系外...

【文章頁數(shù)】:60 頁

【學位級別】:碩士

【文章目錄】:
摘要
abstract
第1章 緒論
    1.1 研究背景及意義
    1.2 國內外研究現(xiàn)狀
        1.2.1 知識圖譜的構建與補全
        1.2.2 基于LDA模型的主題分類
        1.2.3 社會媒體數(shù)據(jù)抽取
    1.3 本文的主要研究內容
    1.4 本文的組織結構
第2章 基礎知識
    2.1 知識圖譜
    2.2 LDA主題模型
    2.3 知識表示學習
    2.4 本章小結
第3章 少數(shù)民族新聞知識圖譜的構建與補全
    3.1 少數(shù)民族新聞知識圖譜構建
    3.2 知識圖譜補全
        3.2.1 知識圖譜補全任務
        3.2.2 知識表示學習模型TransE的構建
        3.2.3 少數(shù)民族新聞知識圖譜關系預測
    3.3 本章小結
第4章 社會媒體中少數(shù)民族新聞數(shù)據(jù)的抽取
    4.1 少數(shù)民族新聞數(shù)據(jù)抽取基本思想
    4.2 社會媒體數(shù)據(jù)的定義
    4.3 數(shù)據(jù)的主題分類
    4.4 基于知識圖譜的數(shù)據(jù)抽取過程
    4.5 本章小結
第5章 實驗結果與分析
    5.1 實驗設置
        5.1.1 數(shù)據(jù)集
        5.1.2 實驗環(huán)境與平臺
        5.1.3 模型評估指標
    5.2 有效性測試
        5.2.1 知識圖譜補全有效性測試
        5.2.2 主題分類有效性測試
        5.2.3 數(shù)據(jù)抽取有效性測試
    5.3 效率測試
    5.4 實驗小結
第6章 總結與展望
    6.1 總結
    6.2 展望
參考文獻
攻讀碩士學位期間的科研成果
致謝



本文編號:3902563

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/shengwushengchang/3902563.html


Copyright(c)文論論文網All Rights Reserved | 網站地圖 |

版權申明:資料由用戶d472f***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com