面向微博熱門話題的主客觀分類方法研究
發(fā)布時間:2021-08-15 23:37
隨著Web2.0的快速發(fā)展,互聯(lián)網(wǎng)的載體已經(jīng)不僅僅是單一的電腦,手機、平板電腦等移動終端已經(jīng)悄然進入了人們的視野。人們獲取、分享信息也不單單通過社區(qū)、博客,而是能夠隨時隨地發(fā)表微博,實現(xiàn)即時分享。微博用戶的大幅度增長吸引了一大批學(xué)者對其發(fā)表言論進行研究,面向微博熱門話題的主客觀分類問題是其中的重要課題之一。到目前為止,國內(nèi)外學(xué)者主要針對無話題的微博文本進行研究,而面向熱門話題的微博文本研究尚處于起步階段。熱門話題下的微博言論文本具有話題分散性,即用戶發(fā)表的言論常常與當(dāng)前的熱門話題不相關(guān),這個現(xiàn)象會導(dǎo)致針對微博熱門話題的主客觀分類方法準(zhǔn)確率不高;诖,本文將面向微博熱門話題的主客觀分類問題看成是兩個子問題——話題相關(guān)性分類子問題和主客觀分類子問題,對兩個子問題獨立建模,再使用Logistic回歸對兩個結(jié)果集建模,得出當(dāng)前熱門話題下的主觀性觀點表達(dá)。本文的主要研究內(nèi)容如下:(1)研究了基于同義詞詞林的話題相關(guān)度計算方法。在話題相關(guān)性分類子問題中,主要研究當(dāng)前微博語料是否與所關(guān)注的熱門話題相關(guān),如何度量兩者之間的相關(guān)程度是此問題的關(guān)鍵之處。本文以同義詞詞林?jǐn)U展版作為資源,通過計算當(dāng)前詞與熱...
【文章來源】:山西大學(xué)山西省
【文章頁數(shù)】:55 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Contents
中文摘要
ABSTRACT
第一章 緒論
1.1 研究背景及意義
1.2 國內(nèi)外研究現(xiàn)狀
1.3 本文研究內(nèi)容
1.4 論文組織結(jié)構(gòu)
第二章 問題描述及相關(guān)資源
2.1 面向微博熱門話題的主客觀分類問題描述
2.1.1 話題相關(guān)性分類子問題描述
2.1.2 主客觀分類子問題描述
2.2 相關(guān)資源
2.2.1 同義詞詞林及擴展版
2.2.2 漢語框架語義網(wǎng)
2.3 本章小結(jié)
第三章 面向微博熱門話題的主客觀分類方法
3.1 條件隨機場模型
3.2 面向微博熱門話題主客觀分類建模
3.2.1 Logistic回歸模型
3.2.2 模型影響因素及判斷標(biāo)準(zhǔn)
3.3 話題相關(guān)性分類模型
3.3.1 詞與熱門話題詞最大相關(guān)度算法
3.3.2 話題相關(guān)性分類特征選擇
3.4 主客觀分類模型
3.4.1 漢語框架網(wǎng)框架距離
3.4.2 觀點詞集構(gòu)建方法
3.4.3 主客觀分類特征選擇
3.5 本章小結(jié)
第四章 實驗及結(jié)果分析
4.1 實驗語料來源及預(yù)處理
4.1.1 實驗語料來源
4.1.2 實驗語料預(yù)處理
4.2 實驗結(jié)果評價指標(biāo)
4.3 實驗結(jié)果及分析
4.3.1 話題相關(guān)性模型結(jié)果及分析
4.3.2 主客觀分類模型結(jié)果及分析
4.3.3 面向微博熱門話題主客觀分類模型結(jié)果及分析
4.4 Baseline及對比實驗分析
4.4.1 Baseline
4.4.2 對比實驗
4.5 本章小結(jié)
第五章 結(jié)論與展望
5.1 結(jié)論
5.2 展望
參考文獻(xiàn)
攻讀學(xué)位期間取得的研究成果
致謝
個人簡況及聯(lián)系方式
【參考文獻(xiàn)】:
期刊論文
[1]基于同義詞詞林的文本特征選擇方法[J]. 鄭艷紅,張東站. 廈門大學(xué)學(xué)報(自然科學(xué)版). 2012(02)
[2]基于層次結(jié)構(gòu)的多策略中文微博情感分析和特征抽取[J]. 謝麗星,周明,孫茂松. 中文信息學(xué)報. 2012(01)
[3]基于SVM的文本詞句情感分析[J]. 楊經(jīng),林世平. 計算機應(yīng)用與軟件. 2011(09)
[4]基于同義詞詞林的詞語相似度計算方法[J]. 田久樂,趙蔚. 吉林大學(xué)學(xué)報(信息科學(xué)版). 2010(06)
[5]漢語框架語義知識庫及軟件描述體系[J]. 郝曉燕,劉偉,李茹,劉開瑛. 中文信息學(xué)報. 2007(05)
[6]基于條件隨機場的漢語分詞系統(tǒng)[J]. 李雙龍,劉群,王成耀. 微計算機信息. 2006(28)
[7]Web文本情感分類研究綜述[J]. 王洪偉,劉勰,尹裴,廖雅國. 情報學(xué)報. 2010 (05)
博士論文
[1]漢語句子框架語義結(jié)構(gòu)分析技術(shù)研究[D]. 李茹.山西大學(xué) 2012
碩士論文
[1]基于依存特征的漢語框架語義角色自動標(biāo)注[D]. 王智強.山西大學(xué) 2012
[2]Logistic回歸模型分析綜述及應(yīng)用研究[D]. 尹建杰.黑龍江大學(xué) 2011
[3]情感主體識別與情感遷移分析[D]. 郭巍.大連理工大學(xué) 2009
本文編號:3345144
【文章來源】:山西大學(xué)山西省
【文章頁數(shù)】:55 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Contents
中文摘要
ABSTRACT
第一章 緒論
1.1 研究背景及意義
1.2 國內(nèi)外研究現(xiàn)狀
1.3 本文研究內(nèi)容
1.4 論文組織結(jié)構(gòu)
第二章 問題描述及相關(guān)資源
2.1 面向微博熱門話題的主客觀分類問題描述
2.1.1 話題相關(guān)性分類子問題描述
2.1.2 主客觀分類子問題描述
2.2 相關(guān)資源
2.2.1 同義詞詞林及擴展版
2.2.2 漢語框架語義網(wǎng)
2.3 本章小結(jié)
第三章 面向微博熱門話題的主客觀分類方法
3.1 條件隨機場模型
3.2 面向微博熱門話題主客觀分類建模
3.2.1 Logistic回歸模型
3.2.2 模型影響因素及判斷標(biāo)準(zhǔn)
3.3 話題相關(guān)性分類模型
3.3.1 詞與熱門話題詞最大相關(guān)度算法
3.3.2 話題相關(guān)性分類特征選擇
3.4 主客觀分類模型
3.4.1 漢語框架網(wǎng)框架距離
3.4.2 觀點詞集構(gòu)建方法
3.4.3 主客觀分類特征選擇
3.5 本章小結(jié)
第四章 實驗及結(jié)果分析
4.1 實驗語料來源及預(yù)處理
4.1.1 實驗語料來源
4.1.2 實驗語料預(yù)處理
4.2 實驗結(jié)果評價指標(biāo)
4.3 實驗結(jié)果及分析
4.3.1 話題相關(guān)性模型結(jié)果及分析
4.3.2 主客觀分類模型結(jié)果及分析
4.3.3 面向微博熱門話題主客觀分類模型結(jié)果及分析
4.4 Baseline及對比實驗分析
4.4.1 Baseline
4.4.2 對比實驗
4.5 本章小結(jié)
第五章 結(jié)論與展望
5.1 結(jié)論
5.2 展望
參考文獻(xiàn)
攻讀學(xué)位期間取得的研究成果
致謝
個人簡況及聯(lián)系方式
【參考文獻(xiàn)】:
期刊論文
[1]基于同義詞詞林的文本特征選擇方法[J]. 鄭艷紅,張東站. 廈門大學(xué)學(xué)報(自然科學(xué)版). 2012(02)
[2]基于層次結(jié)構(gòu)的多策略中文微博情感分析和特征抽取[J]. 謝麗星,周明,孫茂松. 中文信息學(xué)報. 2012(01)
[3]基于SVM的文本詞句情感分析[J]. 楊經(jīng),林世平. 計算機應(yīng)用與軟件. 2011(09)
[4]基于同義詞詞林的詞語相似度計算方法[J]. 田久樂,趙蔚. 吉林大學(xué)學(xué)報(信息科學(xué)版). 2010(06)
[5]漢語框架語義知識庫及軟件描述體系[J]. 郝曉燕,劉偉,李茹,劉開瑛. 中文信息學(xué)報. 2007(05)
[6]基于條件隨機場的漢語分詞系統(tǒng)[J]. 李雙龍,劉群,王成耀. 微計算機信息. 2006(28)
[7]Web文本情感分類研究綜述[J]. 王洪偉,劉勰,尹裴,廖雅國. 情報學(xué)報. 2010 (05)
博士論文
[1]漢語句子框架語義結(jié)構(gòu)分析技術(shù)研究[D]. 李茹.山西大學(xué) 2012
碩士論文
[1]基于依存特征的漢語框架語義角色自動標(biāo)注[D]. 王智強.山西大學(xué) 2012
[2]Logistic回歸模型分析綜述及應(yīng)用研究[D]. 尹建杰.黑龍江大學(xué) 2011
[3]情感主體識別與情感遷移分析[D]. 郭巍.大連理工大學(xué) 2009
本文編號:3345144
本文鏈接:http://www.sikaile.net/guanlilunwen/ydhl/3345144.html
最近更新
教材專著