天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于特征詞條本體進化的微博話題跟蹤研究

發(fā)布時間:2017-05-21 11:24

  本文關鍵詞:基于特征詞條本體進化的微博話題跟蹤研究,由筆耕文化傳播整理發(fā)布。


【摘要】:微博作為一種新的在線社交媒體平臺,近年來發(fā)展十分迅速,參與人數(shù)越來越多,已成為廣大民眾獲取信息、發(fā)表觀點的重要平臺,并日益成為社會輿論中最重要的信息來源,快速及時的獲取微博熱點信息成為了人們的迫切需要。因此需要在微博中引入話題跟蹤技術,讓用戶能夠快速準確的掌握微博中的熱點話題信息。傳統(tǒng)的話題跟蹤主要采用特征詞的模型,數(shù)據(jù)維度很大且噪音很多,因此本文通過抽取話題最相關的本體信息來對話題進行跟蹤,同時針對獨立的特征詞對話題語義表示上的缺陷,本文提出了特征詞條本體的概念,并應用于話題跟蹤之中。本文首先介紹了話題跟蹤的相關基礎理論,詳述了話題跟蹤過程及涉及的關鍵技術,分析了現(xiàn)有話題跟蹤方法的不足,同時介紹本體的知識,并分析了本體的特點和本體進化的概念;接下來針對現(xiàn)有話題跟蹤方法的不足,分析了微博報道的語義特征,提出了基于本體的話題表示方法,并自動構建出初始話題本體;初始本體中單一的特征項仍不能充分表達話題的語義信息,因此本體提出了特征詞條本體的概念,通過自動抽取出的話題相關特征詞條來描述話題中的事件信息,并且通過本體的不斷進化來進行微博話題的跟蹤;最后,本文設計了相應的實驗系統(tǒng),對本文提出的方法進行實驗驗證。本文的主要貢獻在于:①針對微博的語義特征,提出了微博話題的特征詞條本體表示方法,能夠自動構建特征詞條本體并實現(xiàn)本體的進化。②提出了基于本體進化的微博話題跟蹤算法,根據(jù)微博話題的特征設計了相應的權重和相似度計算方法。
【關鍵詞】:話題跟蹤 特征詞條本體 本體進化 信息抽取
【學位授予單位】:南京航空航天大學
【學位級別】:碩士
【學位授予年份】:2015
【分類號】:TP391.1;TP393.092
【目錄】:
  • 摘要4-5
  • ABSTRACT5-10
  • 第一章 緒論10-17
  • 1.1 選題背景及意義10-11
  • 1.1.1 選題背景10
  • 1.1.2 研究意義10-11
  • 1.2 國內外研究現(xiàn)狀11-14
  • 1.2.1 國外研究現(xiàn)狀11-12
  • 1.2.2 國內研究現(xiàn)狀12-13
  • 1.2.3 存在的問題13-14
  • 1.3 研究內容和技術路線14-16
  • 1.3.1 研究內容14-15
  • 1.3.2 技術路線15-16
  • 1.4 主要工作及創(chuàng)新點16-17
  • 第二章 相關基礎理論研究17-27
  • 2.1 話題跟蹤技術17-18
  • 2.1.1 相關概念17-18
  • 2.1.2 話題跟蹤特點18
  • 2.2 話題跟蹤關鍵技術18-23
  • 2.2.1 話題跟蹤一般流程18-19
  • 2.2.2 建立話題/報道模型19-20
  • 2.2.3 特征項提取20
  • 2.2.4 權重計算20-22
  • 2.2.5 計算模型相似度22
  • 2.2.6 閾值比較22-23
  • 2.3 本體及本體進化23-26
  • 2.3.1 本體簡介23-24
  • 2.3.2 本體的構建24-25
  • 2.3.3 本體的進化25-26
  • 2.4 本章小結26-27
  • 第三章 微博初始本體構建27-38
  • 3.1 微博數(shù)據(jù)獲取與處理27-32
  • 3.1.1 確定數(shù)據(jù)來源27-28
  • 3.1.2 微博數(shù)據(jù)采集28-30
  • 3.1.3 微博數(shù)據(jù)預處理30-32
  • 3.2 話題本體的自動構建32-37
  • 3.2.1 話題本體自動構建流程32-33
  • 3.2.2 時間本體的獲取33-34
  • 3.2.3 地點本體的獲取34-36
  • 3.2.4 對象本體的獲取36-37
  • 3.3 本章小結37-38
  • 第四章 特征詞條本體的自動構建及進化38-45
  • 4.1 特征詞條本體的提出38-39
  • 4.2 特征詞條本體的自動構建39-42
  • 4.2.1 特征詞的獲取39-40
  • 4.2.2 特征詞點互信息計算40
  • 4.2.3 初始特征詞條抽取算法40
  • 4.2.4 特征詞條本體獲取40-42
  • 4.3 特征詞條本體的進化42-44
  • 4.4 本章小結44-45
  • 第五章 基于特征詞條本體的微博話題跟蹤算法45-49
  • 5.1 話題跟蹤流程45-46
  • 5.2 本體權重的計算46-47
  • 5.3 話題本體與報道相似度計算47-48
  • 5.4 報道相關性判定48
  • 5.5 微博熱度計算48
  • 5.6 本章小結48-49
  • 第六章 實驗設計及分析49-59
  • 6.1 實驗系統(tǒng)設計49-56
  • 6.1.1 實驗系統(tǒng)功能49-50
  • 6.1.2 實驗數(shù)據(jù)50
  • 6.1.3 實驗過程展示50-56
  • 6.2 實驗結果分析與比較56-58
  • 6.2.1 評價標準56-57
  • 6.2.2 實驗結果及分析57-58
  • 6.3 本章小結58-59
  • 第七章 總結與展望59-60
  • 7.1 總結59
  • 7.2 展望59-60
  • 參考文獻60-63
  • 致謝63-64
  • 攻讀碩士期間發(fā)表的論文及科研成果64

【相似文獻】

中國期刊全文數(shù)據(jù)庫 前3條

1 劉宗田;黃美麗;周文;仲兆滿;付劍鋒;單建芳;智慧來;;面向事件的本體研究[J];計算機科學;2009年11期

2 范寬;吳朝暉;陳華鈞;;基于本體的網(wǎng)絡數(shù)據(jù)工作平臺NetData[J];計算機科學;2006年09期

3 ;[J];;年期

中國重要會議論文全文數(shù)據(jù)庫 前4條

1 楊保軍;;關于新聞本體的幾個基本問題[A];新聞學論集(第22輯)[C];2009年

2 王連誠;馬強;;基于概念權重的本體相似度計算[A];計算機技術與應用進展·2007——全國第18屆計算機技術與應用(CACIS)學術會議論文集[C];2007年

3 王文晶;李茹;宋小香;;基于漢語框架知識庫的旅游信息問答系統(tǒng)設計[A];第四屆全國學生計算語言學研討會會議論文集[C];2008年

4 汪政;曉華;;批評的本體相位[A];這就是我們的文學生活——《當代文壇》三十年評論精選(下)[C];2012年

中國重要報紙全文數(shù)據(jù)庫 前1條

1 清華大學計算機系知識工程組 仲茜邋李涓子;語義Web中的本體建立技術[N];計算機世界;2007年

中國博士學位論文全文數(shù)據(jù)庫 前1條

1 林松濤;模塊化本體建設研究[D];北京郵電大學;2006年

中國碩士學位論文全文數(shù)據(jù)庫 前3條

1 簡旭文;基于特征詞條本體進化的微博話題跟蹤研究[D];南京航空航天大學;2015年

2 蔣璐;基于變化管理的本體協(xié)同開發(fā)方法研究[D];江蘇科技大學;2013年

3 張志慧;UML類圖轉換到OWL DL本體的一種形式化方法的研究[D];東北大學;2008年


  本文關鍵詞:基于特征詞條本體進化的微博話題跟蹤研究,由筆耕文化傳播整理發(fā)布。

,

本文編號:383524

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/guanlilunwen/ydhl/383524.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶151b4***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com