基于漸進(jìn)直推式支持向量機(jī)的Twitter文本情感分析研究
本文選題:Twitter 切入點(diǎn):情感分析 出處:《合肥工業(yè)大學(xué)》2015年碩士論文 論文類型:學(xué)位論文
【摘要】:近年來(lái),隨著互聯(lián)網(wǎng)技術(shù)的迅猛發(fā)展和移動(dòng)終端的進(jìn)一步普及,社交網(wǎng)絡(luò)(Social Network Service)己逐漸深入人們的日常生活。Twitter是一個(gè)典型的社交網(wǎng)絡(luò)及微博客服務(wù)網(wǎng)站,其訪問(wèn)量位列全球互聯(lián)網(wǎng)網(wǎng)站前十位。用戶可隨時(shí)隨地更新自己的狀態(tài),同時(shí)可以關(guān)注其他用戶的動(dòng)態(tài)。每天數(shù)以億計(jì)的推文記錄了用戶的所見(jiàn)、所聞、所為、所感,分享了他們的喜、怒、哀、樂(lè)。對(duì)表達(dá)于Tweets中的情感特征進(jìn)行深度挖掘在市場(chǎng)營(yíng)銷、輿情監(jiān)控、突發(fā)事件應(yīng)急等方面都有重要作用。情感計(jì)算是近年來(lái)人工智能領(lǐng)域的研究熱點(diǎn)。情感的主觀性、隱藏性、判定標(biāo)準(zhǔn)不統(tǒng)一性等特點(diǎn)致使文本情感分析有別于傳統(tǒng)的文本分析。而Tweets的短文本性、口語(yǔ)化、高噪聲等特性使得Twitter'情感分析更具挑戰(zhàn)性。針對(duì)Twitter的特點(diǎn),研究了Twitter情感分析的若干關(guān)鍵問(wèn)題,主要包括Tweets的文本預(yù)處理、特征分析、基于半監(jiān)督的情感分析算法等。為降低Tweets中噪聲對(duì)情感分析造成的影響,研究了一系列改良的Twitter文本預(yù)處理方法,重點(diǎn)對(duì)URLs、否定詞、重復(fù)字母等信息進(jìn)行預(yù)處理,并通過(guò)對(duì)比試驗(yàn)驗(yàn)證了預(yù)處理方法對(duì)Twitter情感分析的有效性。同時(shí),分析了不同選擇標(biāo)準(zhǔn)在特征選擇方面的能力,重點(diǎn)對(duì)比了文檔頻率、信息增益和卡方統(tǒng)計(jì)量特征選擇的效果。實(shí)驗(yàn)結(jié)果表明,預(yù)處理及特征選擇操作在提高了情感分類準(zhǔn)確率的同時(shí)有效降低了特征空間的維度。另外,為克服大量標(biāo)注數(shù)據(jù)的難獲取性,避免海量未標(biāo)注數(shù)據(jù)的資源浪費(fèi),研究了一種基于漸進(jìn)直推式支持向量機(jī)的半監(jiān)督Twitter情感分析算法。通過(guò)引入擾動(dòng)因子穩(wěn)步優(yōu)化了Twitter情感分析效果,并且可以自適應(yīng)數(shù)據(jù)分布,自動(dòng)控制學(xué)習(xí)進(jìn)度和訓(xùn)練時(shí)間。
[Abstract]:In recent years, with the rapid development of Internet technology and the further popularization of mobile terminals, Social Network Service has gradually penetrated into people's daily life. Twitter is a typical social network and Weibo guest service website. Users can update their status anytime, anywhere, and follow the movements of other users. Hundreds of millions of tweets every day record what they see, hear, do and feel. Sharing their joy, anger, sadness, joy, deep mining of emotional features expressed in Tweets in marketing, public opinion monitoring, Emotional computing has become a research hotspot in the field of artificial intelligence in recent years. The disunity of the judging standard makes the text emotional analysis different from the traditional text analysis. However, the characteristics of Tweets, such as short text nature, colloquialization and high noise, make it more challenging. This paper studies some key problems of Twitter affective analysis, including Tweets text preprocessing, feature analysis, semi-supervised affective analysis algorithm and so on. This paper studies a series of improved Twitter text preprocessing methods, focusing on the preprocessing of URLs, negative words and repeated letters, and validates the validity of the preprocessing method for Twitter affective analysis through comparative experiments. The ability of different selection criteria in feature selection is analyzed, and the effects of document frequency, information gain and chi-square statistics feature selection are compared. The experimental results show that, Preprocessing and feature selection not only improve the accuracy of emotion classification, but also reduce the dimension of feature space effectively. A semi-supervised Twitter affective analysis algorithm based on progressive direct push support vector machine (SVM) is studied. By introducing disturbance factor, the effect of Twitter affective analysis can be optimized steadily, and the data distribution can be adaptively distributed, and the learning schedule and training time can be automatically controlled.
【學(xué)位授予單位】:合肥工業(yè)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類號(hào)】:TP391.1
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 孔祥南;黎銘;姜遠(yuǎn);周志華;;一種針對(duì)弱標(biāo)記的直推式多標(biāo)記分類方法[J];計(jì)算機(jī)研究與發(fā)展;2010年08期
2 ;火爆的身材 iRiver T7 Volcano[J];汽車生活;2008年07期
3 陳毅松,汪國(guó)平,董士海;基于支持向量機(jī)的漸進(jìn)直推式分類學(xué)習(xí)算法[J];軟件學(xué)報(bào);2003年03期
4 彭新俊;王翼飛;;雙模糊漸進(jìn)直推式支持向量機(jī)算法[J];模式識(shí)別與人工智能;2009年04期
5 艾解清;高濟(jì);彭艷斌;鄭志軍;;基于直推式支持向量機(jī)的協(xié)商決策模型[J];浙江大學(xué)學(xué)報(bào)(工學(xué)版);2012年06期
6 張永錚;周勇林;杜飛;;網(wǎng)絡(luò)異常性指數(shù)的一種直推式定量計(jì)算方法[J];通信學(xué)報(bào);2013年08期
7 薛貞霞;劉三陽(yáng);劉萬(wàn)里;;基于可信度的漸進(jìn)直推式支持向量機(jī)算法[J];廈門大學(xué)學(xué)報(bào)(自然科學(xué)版);2008年06期
8 廖東平;魏璽章;黎湘;莊釗文;;一種改進(jìn)的漸進(jìn)直推式支持向量機(jī)分類學(xué)習(xí)算法[J];信號(hào)處理;2008年02期
9 李云飛;;近鄰漸進(jìn)直推式支持向量機(jī)算法[J];計(jì)算機(jī)工程;2008年17期
10 吳薇;胡靜濤;;基于代價(jià)敏感直推式學(xué)習(xí)的故障診斷方法[J];儀器儀表學(xué)報(bào);2010年05期
相關(guān)會(huì)議論文 前2條
1 江典林;李巍華;;基于直推式支持向量機(jī)的機(jī)械故障診斷方法[A];2008年全國(guó)振動(dòng)工程及應(yīng)用學(xué)術(shù)會(huì)議暨第十一屆全國(guó)設(shè)備故障診斷學(xué)術(shù)會(huì)議論文集[C];2008年
2 李巍華;劉雯;;基于主元分析和直推式支持向量機(jī)的齒輪早期故障診斷[A];第十二屆全國(guó)設(shè)備故障診斷學(xué)術(shù)會(huì)議論文集[C];2010年
相關(guān)碩士學(xué)位論文 前10條
1 鮑艷偉;基于漸進(jìn)直推式支持向量機(jī)的Twitter文本情感分析研究[D];合肥工業(yè)大學(xué);2015年
2 余力濤;直推式遷移分類算法與應(yīng)用研究[D];大連理工大學(xué);2012年
3 廖朝陽(yáng);基于直推式學(xué)習(xí)和遷移學(xué)習(xí)方法改進(jìn)的支持向量機(jī)分類方法及應(yīng)用研究[D];西安電子科技大學(xué);2012年
4 胡孔兵;基于自學(xué)習(xí)的直推式遷移學(xué)習(xí)方法研究[D];合肥工業(yè)大學(xué);2013年
5 汪旗;基于直推式多示例學(xué)習(xí)的圖像分類算法研究[D];安徽大學(xué);2013年
6 秦彥霞;直推式遷移學(xué)習(xí)及其應(yīng)用研究[D];哈爾濱工業(yè)大學(xué);2012年
7 方玉成;基于Logistic回歸的直推式遷移學(xué)習(xí)方法研究[D];合肥工業(yè)大學(xué);2010年
8 沈新宇;基于直推式支持向量機(jī)的圖像分類算法研究與應(yīng)用[D];北京交通大學(xué);2008年
9 王利文;直推式支持向量機(jī)的研究學(xué)習(xí)[D];重慶大學(xué);2014年
10 崔鵬;一種基于支持向量機(jī)的直推式WEB挖掘[D];大連海事大學(xué);2006年
,本文編號(hào):1614752
本文鏈接:http://www.sikaile.net/guanlilunwen/yingxiaoguanlilunwen/1614752.html