基于特征詞條本體進化的微博話題跟蹤研究
本文關鍵詞:基于特征詞條本體進化的微博話題跟蹤研究,由筆耕文化傳播整理發(fā)布。
【摘要】:微博作為一種新的在線社交媒體平臺,近年來發(fā)展十分迅速,參與人數(shù)越來越多,已成為廣大民眾獲取信息、發(fā)表觀點的重要平臺,并日益成為社會輿論中最重要的信息來源,快速及時的獲取微博熱點信息成為了人們的迫切需要。因此需要在微博中引入話題跟蹤技術,讓用戶能夠快速準確的掌握微博中的熱點話題信息。傳統(tǒng)的話題跟蹤主要采用特征詞的模型,數(shù)據(jù)維度很大且噪音很多,因此本文通過抽取話題最相關的本體信息來對話題進行跟蹤,同時針對獨立的特征詞對話題語義表示上的缺陷,本文提出了特征詞條本體的概念,并應用于話題跟蹤之中。本文首先介紹了話題跟蹤的相關基礎理論,詳述了話題跟蹤過程及涉及的關鍵技術,分析了現(xiàn)有話題跟蹤方法的不足,同時介紹本體的知識,并分析了本體的特點和本體進化的概念;接下來針對現(xiàn)有話題跟蹤方法的不足,分析了微博報道的語義特征,提出了基于本體的話題表示方法,并自動構建出初始話題本體;初始本體中單一的特征項仍不能充分表達話題的語義信息,因此本體提出了特征詞條本體的概念,通過自動抽取出的話題相關特征詞條來描述話題中的事件信息,并且通過本體的不斷進化來進行微博話題的跟蹤;最后,本文設計了相應的實驗系統(tǒng),對本文提出的方法進行實驗驗證。本文的主要貢獻在于:①針對微博的語義特征,提出了微博話題的特征詞條本體表示方法,能夠自動構建特征詞條本體并實現(xiàn)本體的進化。②提出了基于本體進化的微博話題跟蹤算法,根據(jù)微博話題的特征設計了相應的權重和相似度計算方法。
【關鍵詞】:話題跟蹤 特征詞條本體 本體進化 信息抽取
【學位授予單位】:南京航空航天大學
【學位級別】:碩士
【學位授予年份】:2015
【分類號】:TP391.1;TP393.092
【目錄】:
- 摘要4-5
- ABSTRACT5-10
- 第一章 緒論10-17
- 1.1 選題背景及意義10-11
- 1.1.1 選題背景10
- 1.1.2 研究意義10-11
- 1.2 國內外研究現(xiàn)狀11-14
- 1.2.1 國外研究現(xiàn)狀11-12
- 1.2.2 國內研究現(xiàn)狀12-13
- 1.2.3 存在的問題13-14
- 1.3 研究內容和技術路線14-16
- 1.3.1 研究內容14-15
- 1.3.2 技術路線15-16
- 1.4 主要工作及創(chuàng)新點16-17
- 第二章 相關基礎理論研究17-27
- 2.1 話題跟蹤技術17-18
- 2.1.1 相關概念17-18
- 2.1.2 話題跟蹤特點18
- 2.2 話題跟蹤關鍵技術18-23
- 2.2.1 話題跟蹤一般流程18-19
- 2.2.2 建立話題/報道模型19-20
- 2.2.3 特征項提取20
- 2.2.4 權重計算20-22
- 2.2.5 計算模型相似度22
- 2.2.6 閾值比較22-23
- 2.3 本體及本體進化23-26
- 2.3.1 本體簡介23-24
- 2.3.2 本體的構建24-25
- 2.3.3 本體的進化25-26
- 2.4 本章小結26-27
- 第三章 微博初始本體構建27-38
- 3.1 微博數(shù)據(jù)獲取與處理27-32
- 3.1.1 確定數(shù)據(jù)來源27-28
- 3.1.2 微博數(shù)據(jù)采集28-30
- 3.1.3 微博數(shù)據(jù)預處理30-32
- 3.2 話題本體的自動構建32-37
- 3.2.1 話題本體自動構建流程32-33
- 3.2.2 時間本體的獲取33-34
- 3.2.3 地點本體的獲取34-36
- 3.2.4 對象本體的獲取36-37
- 3.3 本章小結37-38
- 第四章 特征詞條本體的自動構建及進化38-45
- 4.1 特征詞條本體的提出38-39
- 4.2 特征詞條本體的自動構建39-42
- 4.2.1 特征詞的獲取39-40
- 4.2.2 特征詞點互信息計算40
- 4.2.3 初始特征詞條抽取算法40
- 4.2.4 特征詞條本體獲取40-42
- 4.3 特征詞條本體的進化42-44
- 4.4 本章小結44-45
- 第五章 基于特征詞條本體的微博話題跟蹤算法45-49
- 5.1 話題跟蹤流程45-46
- 5.2 本體權重的計算46-47
- 5.3 話題本體與報道相似度計算47-48
- 5.4 報道相關性判定48
- 5.5 微博熱度計算48
- 5.6 本章小結48-49
- 第六章 實驗設計及分析49-59
- 6.1 實驗系統(tǒng)設計49-56
- 6.1.1 實驗系統(tǒng)功能49-50
- 6.1.2 實驗數(shù)據(jù)50
- 6.1.3 實驗過程展示50-56
- 6.2 實驗結果分析與比較56-58
- 6.2.1 評價標準56-57
- 6.2.2 實驗結果及分析57-58
- 6.3 本章小結58-59
- 第七章 總結與展望59-60
- 7.1 總結59
- 7.2 展望59-60
- 參考文獻60-63
- 致謝63-64
- 攻讀碩士期間發(fā)表的論文及科研成果64
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前3條
1 劉宗田;黃美麗;周文;仲兆滿;付劍鋒;單建芳;智慧來;;面向事件的本體研究[J];計算機科學;2009年11期
2 范寬;吳朝暉;陳華鈞;;基于本體的網(wǎng)絡數(shù)據(jù)工作平臺NetData[J];計算機科學;2006年09期
3 ;[J];;年期
中國重要會議論文全文數(shù)據(jù)庫 前4條
1 楊保軍;;關于新聞本體的幾個基本問題[A];新聞學論集(第22輯)[C];2009年
2 王連誠;馬強;;基于概念權重的本體相似度計算[A];計算機技術與應用進展·2007——全國第18屆計算機技術與應用(CACIS)學術會議論文集[C];2007年
3 王文晶;李茹;宋小香;;基于漢語框架知識庫的旅游信息問答系統(tǒng)設計[A];第四屆全國學生計算語言學研討會會議論文集[C];2008年
4 汪政;曉華;;批評的本體相位[A];這就是我們的文學生活——《當代文壇》三十年評論精選(下)[C];2012年
中國重要報紙全文數(shù)據(jù)庫 前1條
1 清華大學計算機系知識工程組 仲茜邋李涓子;語義Web中的本體建立技術[N];計算機世界;2007年
中國博士學位論文全文數(shù)據(jù)庫 前1條
1 林松濤;模塊化本體建設研究[D];北京郵電大學;2006年
中國碩士學位論文全文數(shù)據(jù)庫 前3條
1 簡旭文;基于特征詞條本體進化的微博話題跟蹤研究[D];南京航空航天大學;2015年
2 蔣璐;基于變化管理的本體協(xié)同開發(fā)方法研究[D];江蘇科技大學;2013年
3 張志慧;UML類圖轉換到OWL DL本體的一種形式化方法的研究[D];東北大學;2008年
本文關鍵詞:基于特征詞條本體進化的微博話題跟蹤研究,由筆耕文化傳播整理發(fā)布。
,本文編號:383524
本文鏈接:http://www.sikaile.net/guanlilunwen/ydhl/383524.html