面向中文微博文本的情感極性判別方法研究
本文選題:微博 + 情感分析。 參考:《中國(guó)民航大學(xué)》2017年碩士論文
【摘要】:微博是一個(gè)分享實(shí)時(shí)短信息的社交媒體,為網(wǎng)民提供了一個(gè)溝通思想,交流看法的平臺(tái)。用戶既可以作為一個(gè)觀眾來(lái)瀏覽感興趣的話題信息,也可以作為一個(gè)內(nèi)容發(fā)布者提供內(nèi)容供其他人瀏覽。這種新的社交形式已經(jīng)被大眾廣泛接受,在近十年中取得了用戶數(shù)量和信息量的爆發(fā)式增長(zhǎng)。微博文本涉及到的話題廣泛,為情感分析研究提供了豐富的語(yǔ)料素材。情感極性判別是情感分析的一種具體任務(wù),通過(guò)對(duì)帶有情感色彩的文本進(jìn)行處理、分析,從而判斷它的情感是屬于積極的還是消極的。對(duì)微博進(jìn)行情感極性判別的目的在于識(shí)別出微博中的主觀信息,從而挖掘出用戶對(duì)熱點(diǎn)話題、新聞事件和產(chǎn)品服務(wù)等評(píng)價(jià)對(duì)象的觀點(diǎn)和態(tài)度,從而實(shí)現(xiàn)輿情監(jiān)控、市場(chǎng)營(yíng)銷等目的。本文選取包含民航輿情關(guān)鍵詞的微博進(jìn)行情感極性判別研究,分別給出了基于情感詞和語(yǔ)義規(guī)則、基于Adaboost和分類器加權(quán)投票的兩種方法。第一種方法結(jié)合現(xiàn)有情感詞典和語(yǔ)義相似度計(jì)算來(lái)提取情感詞,避免了情感詞典中詞語(yǔ)不全而導(dǎo)致情感詞遺漏的情況,然后利用句內(nèi)規(guī)則和句間規(guī)則計(jì)算出微博文本情感得分,與微博表情符號(hào)得分做加權(quán)求和,得到最終情感極性分值,從而判斷微博的情感極性。第二種方法基于機(jī)器學(xué)習(xí)判別情感極性,利用Adaboost集成學(xué)習(xí)對(duì)效果較差的單一分類器進(jìn)行提升后,將三種分類器進(jìn)行加權(quán)投票組合,得到最終分類器對(duì)測(cè)試微博文本進(jìn)行分類。本文所使用的微博語(yǔ)料是利用微博爬蟲抓取的,對(duì)其情感極性進(jìn)行人工標(biāo)注后用于實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果表明:兩種方法在情感極性分類的準(zhǔn)確度上均取得了較好的效果,第一種方法不依賴于領(lǐng)域知識(shí),對(duì)微博內(nèi)容的普適性較強(qiáng);第二種方法使弱分類器的性能得到提高,結(jié)合了不同分類器的優(yōu)勢(shì),克服了單一分類器的缺陷。
[Abstract]:Weibo is a social media that shares real-time short messages and provides a platform for Internet users to communicate ideas and ideas. Users can view topics of interest either as an audience member or as a content publisher for others to browse. This new form of social networking has been widely accepted, in the past decade has achieved explosive growth in the number of users and information. Weibo texts cover a wide range of topics and provide rich corpus material for affective analysis. Emotion polarity discrimination is a kind of concrete task of emotion analysis. By processing and analyzing the text with emotion color, we can judge whether its emotion is positive or negative. The purpose of judging the emotional polarity of Weibo is to identify the subjective information in the Weibo, so as to excavate the opinions and attitudes of the users on the hot topics, news events and products and services, so as to realize the monitoring of public opinion. Marketing, etc. In this paper, we select the Weibo which contains the key words of civil aviation public opinion to study the emotional polarity, and give two methods based on emotional words and semantic rules, Adaboost and classifier weighted voting. The first method combines the existing emotion dictionary and semantic similarity calculation to extract the emotion words, which avoids the omission of the words in the emotion dictionary, and then calculates the emotional score of the Weibo text by using intra-sentence rules and inter-sentence rules. The final emotional polarity score was obtained by weighted summation with the Weibo emoji score, and then the emotional polarity of Weibo was judged. The second method is based on machine learning to distinguish emotional polarity. After using Adaboost ensemble learning to improve a single classifier with poor effect, the three classifiers are weighted to vote together, and the final classifier is obtained to classify the test Weibo text. The Weibo corpus used in this paper is captured by Weibo crawler, and the affective polarity is labeled manually for experiment. The experimental results show that the two methods have achieved good results in the classification accuracy of affective polarity. The first method does not rely on domain knowledge and has a strong universality for Weibo content. The second method improves the performance of weak classifier and combines the advantages of different classifiers to overcome the shortcomings of single classifier.
【學(xué)位授予單位】:中國(guó)民航大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2017
【分類號(hào)】:TP391.1;TP393.092
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 郭紅玲;程顯毅;;多分類器選擇集成方法[J];計(jì)算機(jī)工程與應(yīng)用;2009年13期
2 呂岳,施鵬飛,趙宇明;多分類器組合的投票表決規(guī)則[J];上海交通大學(xué)學(xué)報(bào);2000年05期
3 韓宏;楊靜宇;;多分類器組合及其應(yīng)用[J];計(jì)算機(jī)科學(xué);2000年01期
4 陳剛,戚飛虎;多分類器結(jié)合的人臉識(shí)別[J];上海交通大學(xué)學(xué)報(bào);2001年02期
5 韓宏,楊靜宇,婁震;基于層次的分類器組合[J];南京理工大學(xué)學(xué)報(bào)(自然科學(xué)版);2002年01期
6 趙誼虹,程國(guó)華,史習(xí)智;多分類器融合中一種新的加權(quán)算法[J];上海交通大學(xué)學(xué)報(bào);2002年06期
7 王正群,葉暉,孫興華,楊靜宇;模糊多分類器組合[J];小型微型計(jì)算機(jī)系統(tǒng);2003年01期
8 楊利英,覃征,王向華;多分類器融合實(shí)現(xiàn)機(jī)型識(shí)別[J];計(jì)算機(jī)工程與應(yīng)用;2004年15期
9 楊利英,覃征,王衛(wèi)紅;多分類器融合系統(tǒng)設(shè)計(jì)與應(yīng)用[J];計(jì)算機(jī)工程;2005年05期
10 陳湘;;1-范數(shù)軟間隔分類器的風(fēng)險(xiǎn)[J];湖北大學(xué)學(xué)報(bào)(自然科學(xué)版);2006年02期
相關(guān)會(huì)議論文 前10條
1 王占一;徐蔚然;劉東鑫;郭軍;;一種基于兩級(jí)分類器的垃圾短信過(guò)濾方法[A];第五屆全國(guó)信息檢索學(xué)術(shù)會(huì)議論文集[C];2009年
2 翟靜;李海宏;唐常杰;陳敏敏;李智;;可驗(yàn)證對(duì)象集分類器的再訓(xùn)練演進(jìn)[A];第十九屆全國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2002年
3 陳繼航;劉家鋒;趙巍;唐降龍;;聯(lián)機(jī)手寫識(shí)別筆段特征分類器的學(xué)習(xí)方法[A];黑龍江省計(jì)算機(jī)學(xué)會(huì)2009年學(xué)術(shù)交流年會(huì)論文集[C];2010年
4 穆明生;;基于特征集的多種分類器模型的在線筆跡認(rèn)證[A];第十屆全國(guó)信號(hào)處理學(xué)術(shù)年會(huì)(CCSP-2001)論文集[C];2001年
5 彭濤;左萬(wàn)利;赫楓齡;;基于鏈接上下文的分類器主題爬行技術(shù)(英文)[A];第二十三屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2006年
6 王嵐;陳珂;遲惠生;;基于多特征組合多分類器的方法用于“與文本無(wú)關(guān)”的說(shuō)話人辨認(rèn)[A];第四屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C];1996年
7 謝秋玲;;應(yīng)用于心電圖分類的KNN-SVM分類器研究[A];2006中國(guó)控制與決策學(xué)術(shù)年會(huì)論文集[C];2006年
8 胡瓊;汪榮貴;胡韋偉;孫見青;;基于級(jí)聯(lián)分類器的快速人臉檢測(cè)方法[A];計(jì)算機(jī)技術(shù)與應(yīng)用進(jìn)展·2007——全國(guó)第18屆計(jì)算機(jī)技術(shù)與應(yīng)用(CACIS)學(xué)術(shù)會(huì)議論文集[C];2007年
9 李蘭春;王雙成;杜瑞杰;;認(rèn)知結(jié)構(gòu)評(píng)估的動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)分類器方法[A];2011年中國(guó)智能自動(dòng)化學(xué)術(shù)會(huì)議論文集(第一分冊(cè))[C];2011年
10 邵小健;段華;賀國(guó)平;;一種改進(jìn)的最少核分類器[A];中國(guó)運(yùn)籌學(xué)會(huì)第七屆學(xué)術(shù)交流會(huì)論文集(上卷)[C];2004年
相關(guān)重要報(bào)紙文章 前1條
1 黃明;精子分類器決定生男生女[N];廣東科技報(bào);2000年
相關(guān)博士學(xué)位論文 前10條
1 張非;對(duì)抗逃避攻擊的防守策略研究[D];華南理工大學(xué);2015年
2 張文博;多類別智能分類器方法研究[D];西安電子科技大學(xué);2014年
3 許勁松;智能交通中目標(biāo)檢測(cè)與分類關(guān)鍵技術(shù)研究[D];南京理工大學(xué);2014年
4 趙作林;基于圖像分析的北京地區(qū)楊樹種類識(shí)別研究[D];北京林業(yè)大學(xué);2015年
5 任亞峰;基于標(biāo)注和未標(biāo)注數(shù)椐的虛假評(píng)論識(shí)別研究[D];武漢大學(xué);2015年
6 曹鵬;不均衡數(shù)據(jù)分類方法的研究[D];東北大學(xué);2014年
7 劉明;分類器組合技術(shù)研究及其在人機(jī)交互系統(tǒng)中的應(yīng)用[D];北京交通大學(xué);2008年
8 嚴(yán)志永;在劃分?jǐn)?shù)據(jù)空間的視角下基于決策邊界的分類器研究[D];浙江大學(xué);2011年
9 王U,
本文編號(hào):1963207
本文鏈接:http://www.sikaile.net/guanlilunwen/ydhl/1963207.html