基于電子商務(wù)的評論文本情感極性等級分析
發(fā)布時間:2017-03-28 16:05
本文關(guān)鍵詞:基于電子商務(wù)的評論文本情感極性等級分析,由筆耕文化傳播整理發(fā)布。
【摘要】:文本情感分析指研究分析人們對產(chǎn)品、服務(wù)、組織機構(gòu)、事件和話題等進行評價時表達的意見、情感、評價、態(tài)度和情緒的特殊自然語言處理研究領(lǐng)域。涉及到多項具有挑戰(zhàn)性研究任務(wù),根據(jù)研究任務(wù)的不同,文本情感分析可以分為情感分類、情感信息抽取、情感信息檢索和歸納。研究的過程包括預(yù)處理、情感信息抽取、分類器選擇、結(jié)果歸納展示。 隨著web2.0的發(fā)展,人們可以通過互聯(lián)網(wǎng)隨時隨地發(fā)表自己的觀點,如博客、論壇、門戶網(wǎng)站、電子商務(wù)平臺等,這些文本能直接或間接反映人的行為和思想,所以研究分析這些文本的情感有許多的用處。關(guān)注分析電子商務(wù)領(lǐng)域的評論文本情感,無論對消費者還是商家都有重要的意義。目前文本情感分析雖然取得了較大發(fā)展,但對情感極性等級分析研究還不足。文本情感存在固有模糊特性,由此可以利用模糊理論的隸屬度函數(shù),進行情感極性等級計算。 情感分析主要判斷評論文本的情感極性和極性等級,即屬于褒義、貶義的強度。根據(jù)電子商務(wù)領(lǐng)域評論文本的特點,,在已有傳統(tǒng)情感分析的基礎(chǔ)上,開展對評論句子的情感極性等級分析。首先,通過STEP算法標(biāo)注WordNet詞典中的形容詞情感,再用NOS隸屬度函數(shù)計算詞語情感極性等級,構(gòu)建NOS情感詞典。其次,利用整數(shù)線性規(guī)劃(ILP)改造NOS情感詞典,得到領(lǐng)域情感詞典,使詞典最大化適應(yīng)電子商務(wù)領(lǐng)域文本分析。然后,改進傳統(tǒng)的加權(quán)統(tǒng)計算法,即預(yù)先使用投票選舉法判斷句子極性,再計算情感極性等級,通過與未選舉法的極性等級求平均值,作為最終的句子極性值。最后,使用領(lǐng)域情感詞典抽取文本中的情感信息,包括情感詞典、否定詞、程度副詞,實現(xiàn)了一個面向電子商務(wù)領(lǐng)域的情感分類系統(tǒng)。 實驗語料庫為12000條評論句子,分別來自家電、酒店、圖書類電商網(wǎng)站,通過手工標(biāo)注語料的褒貶極性作為檢驗實驗結(jié)果的金標(biāo)準(zhǔn)。實驗結(jié)果顯示:領(lǐng)域情感詞典比NOS詞典平均準(zhǔn)確率提高了2.7%~6.1%;改進算法比加權(quán)統(tǒng)計算法提高了5.7%~9.1%,這說明對情感分析進行的初步嘗試有較好效果。
【關(guān)鍵詞】:文本情感分析 領(lǐng)域情感詞典 模糊理論 整數(shù)規(guī)劃 極性等級計算
【學(xué)位授予單位】:重慶交通大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2014
【分類號】:TP391.1
【目錄】:
- 摘要4-5
- ABSTRACT5-9
- 第一章 緒論9-18
- 1.1 研究背景9-11
- 1.2 國內(nèi)外研究現(xiàn)狀11-13
- 1.3 研究的目的和意義13-14
- 1.4 研究中的困難與不足14-16
- 1.4.1 研究中的困難14-15
- 1.4.2 發(fā)展中的不足15-16
- 1.5 研究內(nèi)容及組織結(jié)構(gòu)16-18
- 1.5.1 主要研究內(nèi)容16-17
- 1.5.2 論文組織結(jié)構(gòu)17-18
- 第二章 情感分析的研究方法及相關(guān)算法18-23
- 2.1 基于機器學(xué)習(xí)方法18-20
- 2.1.1 樸素貝葉斯算法(NB)18-19
- 2.1.2 最大熵算法(ME)19
- 2.1.3 支持向量機(SVMs)19-20
- 2.2 基于詞頻的方法20-21
- 2.2.1 語義相關(guān)場20
- 2.2.2 語義相似度20-21
- 2.3 基于規(guī)則的方法21
- 2.4 性能評估方法21-23
- 第三章 文本情感分析的流程及應(yīng)用23-31
- 3.1 文本預(yù)處理23-25
- 3.1.1 向量空間模型(VSM)23-24
- 3.1.2 降維操作24-25
- 3.2 情感信息抽取25-28
- 3.2.1 特征提取法25-26
- 3.2.2 情感詞典26-28
- 3.3 選擇分類器28
- 3.4 情感歸納28
- 3.5 情感分析的應(yīng)用28-31
- 3.5.1 機器人的情感計算29
- 3.5.2 提供決策支持29
- 3.5.3 網(wǎng)絡(luò)輿情與風(fēng)險分析29-30
- 3.5.4 信息預(yù)測30
- 3.5.5 產(chǎn)品推薦30-31
- 第四章 基于模糊理論的情感詞典建立方法31-43
- 4.1 模糊理論31-34
- 4.1.1 模糊理論的概述31-32
- 4.1.2 模糊理論使用注意事項32-33
- 4.1.3 模糊理論與文本情感分析的結(jié)合33-34
- 4.2 STEP 算法34-38
- 4.2.1 STEP 算法的提出35-36
- 4.2.2 算法的步驟36-37
- 4.2.3 STEP 算法標(biāo)注結(jié)果及分析37-38
- 4.3 詞語情感程度度量38-42
- 4.3.1 詞語的中心度38-39
- 4.3.2 度量方法39
- 4.3.3 實驗及結(jié)果分析39-41
- 4.3.4 NOS拓展41-42
- 4.4 本章小結(jié)42-43
- 第五章 電商網(wǎng)站評論文本的情感計算系統(tǒng)43-67
- 5.1 系統(tǒng)目標(biāo)43
- 5.2 系統(tǒng)架構(gòu)43-44
- 5.3 評價語料庫準(zhǔn)備44-46
- 5.4 語料預(yù)處理46-51
- 5.4.1 語料分詞46-47
- 5.4.2 詞性標(biāo)注47-50
- 5.4.3 去除停用詞50-51
- 5.5 領(lǐng)域情感詞典與情感信息抽取51-57
- 5.5.1 領(lǐng)域情感詞典51
- 5.5.2 適用電商領(lǐng)域的情感詞典改造51-55
- 5.5.3 情感信息抽取55-57
- 5.6 評論文本情感極性分類算法57-60
- 5.6.1 情感極性加權(quán)統(tǒng)計算法57-58
- 5.6.2 對加權(quán)統(tǒng)計算法的改進58-60
- 5.7 實驗及分析60-66
- 5.7.1 實驗環(huán)境60-61
- 5.7.2 數(shù)據(jù)庫設(shè)計61-63
- 5.7.3 實驗準(zhǔn)備63-64
- 5.7.4 對比實驗結(jié)果及分析64-66
- 5.8 本章小結(jié)66-67
- 第六章 總結(jié)和展望67-68
- 6.1 全文總結(jié)67
- 6.2 展望67-68
- 致謝68-69
- 參考文獻69-73
- 在學(xué)期間取得的學(xué)術(shù)成果73
【參考文獻】
中國期刊全文數(shù)據(jù)庫 前4條
1 婁德成;姚天f ;;漢語句子語義極性分析和觀點抽取方法的研究[J];計算機應(yīng)用;2006年11期
2 朱嫣嵐;閔錦;周雅倩;黃萱菁;吳立德;;基于HowNet的詞匯語義傾向計算[J];中文信息學(xué)報;2006年01期
3 姚天f ;程希文;徐飛玉;漢思·烏思克爾特;王睿;;文本意見挖掘綜述[J];中文信息學(xué)報;2008年03期
4 趙妍妍;秦兵;劉挺;;文本情感分析[J];軟件學(xué)報;2010年08期
本文關(guān)鍵詞:基于電子商務(wù)的評論文本情感極性等級分析,由筆耕文化傳播整理發(fā)布。
本文編號:272566
本文鏈接:http://www.sikaile.net/jingjilunwen/dianzishangwulunwen/272566.html
最近更新
教材專著