用戶評論情感分類的方法與實證研究
發(fā)布時間:2018-04-16 18:51
本文選題:詞向量 + 情感詞典; 參考:《蘭州大學》2017年碩士論文
【摘要】:文本情感分析,又被叫做情感極性計算,主要包括意見抽取,意見挖掘,情感挖掘,主客觀分析等研究方向,旨在對含有人類主觀性態(tài)度的文本數(shù)據進行分析,抽取,挖掘以研究用戶對篇章級,句子級或詞語級文本的情感態(tài)度,是近年來文本挖掘領域比較熱門的方向.本文主要研究評論文本的正負向情感分類并在真實評論數(shù)據的基礎上進行基于細粒度的意見挖掘.在情感分類方面,目前主要的研究方法有:基于情感詞典匹配的方法,基于機器學習的方法以及基于深度學習的方法,本文在前輩研究者提出算法的基礎上進行改進,考察了一種新的基于詞向量和詞典的情感分類算法以優(yōu)化在無標注數(shù)據集訓練模型情況下網站評論數(shù)據的情感分類效果,并將其與基于機器學習的方法如支持向量機,邏輯回歸,以及基于深度學習的方法如卷積神經網絡,長短期記憶網絡進行比較,分析不同模型方法的優(yōu)劣并提出在實際應用中的可行性建議.在基于細粒度的意見挖掘方面,我們的主要目的是進行基于細粒度的詞對(屬性詞,評價詞)抽取以收集并分析用戶對產品不同特征屬性的評價情況.本文使用的數(shù)據集為某品牌筆記本電腦真實評論數(shù)據,采用基于依存句法分析結合語法規(guī)則進行抽取和篩選的方法,并依據抽取結果進一步分析細粒度層面用戶評論的正負情感傾向.
[Abstract]:Text emotion analysis, also called affective polarity calculation, mainly includes opinion extraction, opinion mining, emotion mining, subjective and objective analysis and so on.Mining is a hot topic in the field of text mining in recent years to study users' emotional attitudes towards text at text level, sentence level or word level.This paper mainly studies the positive and negative emotion classification of comment text and carries out fine-grained opinion mining based on the real comment data.In the aspect of emotion classification, the main research methods are as follows: based on affective dictionary matching, machine learning and deep learning.A new affective classification algorithm based on word vectors and dictionaries is investigated to optimize the classification effect of website comment data without annotated dataset training model, and it is compared with machine learning-based methods such as support vector machine (SVM).Logical regression, as well as the methods based on deep learning, such as convolution neural network and long-term and short-term memory network, are compared to analyze the merits and demerits of different model methods and put forward some feasible suggestions in practical application.In the aspect of fine-grained opinion mining, our main purpose is to extract word pairs (attribute words, evaluation words) based on fine granularity to collect and analyze users' evaluation of different feature attributes of products.The data set used in this paper is the real comment data of a brand notebook computer, which is extracted and filtered based on dependency syntactic analysis and grammar rules.According to the extraction results, the positive and negative emotional tendency of fine-grained user comments is further analyzed.
【學位授予單位】:蘭州大學
【學位級別】:碩士
【學位授予年份】:2017
【分類號】:TP391.1;F274
【參考文獻】
相關期刊論文 前5條
1 蔡慧蘋;王麗丹;段書凱;;基于word embedding和CNN的情感分類模型[J];計算機應用研究;2016年10期
2 李綱;劉廣興;毛進;葉光輝;;一種基于句法分析的情感標簽抽取方法[J];圖書情報工作;2014年14期
3 殷國鵬;;消費者認為怎樣的在線評論更有用?——社會性因素的影響效應[J];管理世界;2012年12期
4 婁德成;姚天f ;;漢語句子語義極性分析和觀點抽取方法的研究[J];計算機應用;2006年11期
5 朱嫣嵐;閔錦;周雅倩;黃萱菁;吳立德;;基于HowNet的詞匯語義傾向計算[J];中文信息學報;2006年01期
相關碩士學位論文 前1條
1 王文然;基于依存句法分析的互聯(lián)網細粒度觀點挖掘研究[D];東北財經大學;2011年
,本文編號:1760166
本文鏈接:http://www.sikaile.net/jingjilunwen/xmjj/1760166.html
最近更新
教材專著