情感詞發(fā)現(xiàn)與極性權(quán)重自動計算算法研究
本文選題:情感詞 切入點(diǎn):情感權(quán)重 出處:《中文信息學(xué)報》2017年03期 論文類型:期刊論文
【摘要】:隨著互聯(lián)網(wǎng)電子商務(wù)和各種社交網(wǎng)絡(luò)應(yīng)用的快速發(fā)展,產(chǎn)生了大量的用戶評價信息。為滿足快速整理這些評價信息的需求,情感傾向性分析應(yīng)運(yùn)而生。情感詞典是各類情感傾向性識別算法的基礎(chǔ),收集一部全面且權(quán)重合理的情感詞典,往往可以簡單快速而有效地解決情感分析問題。但情感詞典規(guī)模有限,而網(wǎng)絡(luò)上新的情感詞層出不窮,語言使用不規(guī)范,人工整理耗時耗力。已有的情感詞收集方法較復(fù)雜,且領(lǐng)域性強(qiáng),收集的情感詞可擴(kuò)展性差。本文提出一種自動挖掘潛在情感詞并計算其極性權(quán)重的算法,該算法與應(yīng)用領(lǐng)域無關(guān),具有良好的擴(kuò)展性。該方法利用共現(xiàn)特性,基于樸素貝葉斯公式能檢測出未知的情感詞,并根據(jù)其情感權(quán)重值的大小判斷其情感極性,可有效地擴(kuò)展情感詞典,將已有的情感詞典進(jìn)一步量化。在理論研究的基礎(chǔ)上,本文分別針對京東、豆瓣及大眾點(diǎn)評網(wǎng)三組評論語料做了實(shí)驗(yàn),其結(jié)果的準(zhǔn)確率都基本在90%以上,驗(yàn)證了該方法的有效性和實(shí)用性,為情感傾向性分析提供了知識庫基礎(chǔ)。
[Abstract]:With the rapid development of Internet e-commerce and various social network applications, a large amount of user evaluation information has been generated. Emotion dictionaries are the basis of all kinds of affective orientation recognition algorithms. It is often possible to solve affective analysis problems simply, quickly and effectively. However, the scale of affective dictionary is limited, and new affective words appear in endlessly on the Internet, language usage is not standardized, manual sorting is time-consuming and time-consuming, and the existing methods of collecting affective words are more complicated. This paper presents an algorithm for automatically mining latent affective words and calculating their polar weights, which is independent of the application field and has good expansibility. Based on naive Bayes formula, unknown affective words can be detected, and their affective polarity can be judged according to their emotional weight, which can effectively expand the emotional dictionary and further quantify the existing affective lexicon. In this paper, three groups of comment corpus, JingDong, Douban and Dianping, are tested, and the accuracy of the results is above 90%, which verifies the validity and practicability of this method and provides a knowledge base for emotional orientation analysis.
【作者單位】: 北京理工大學(xué)計算機(jī)學(xué)院;北京市海量語言信息處理與云計算應(yīng)用工程研究中心;公安部第一研究所信安部;工業(yè)和信息化部電子科學(xué)技術(shù)情報研究所;
【基金】:國家重點(diǎn)基礎(chǔ)研究發(fā)展計劃(973計劃)(2013CB329601)
【分類號】:TP391.1
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 孫艷;周學(xué)廣;付偉;;基于依存關(guān)聯(lián)分析的情感詞擴(kuò)展[J];北京郵電大學(xué)學(xué)報;2012年05期
2 肖健;徐建;朱姝;萬纓;許亮;;基于翻譯和語義方法的情感詞挖掘研究[J];計算機(jī)工程與應(yīng)用;2011年32期
3 趙鵬;趙志偉;卓景文;;一種情感詞語義加權(quán)的句子傾向性識別方法[J];計算機(jī)工程與應(yīng)用;2011年35期
4 代大明;李壽山;李培峰;朱巧明;;基于情緒詞與情感詞協(xié)作學(xué)習(xí)的情感分類方法研究[J];計算機(jī)科學(xué);2012年12期
5 李勇敢;周學(xué)廣;孫艷;張煥國;;結(jié)合依存關(guān)聯(lián)分析和規(guī)則統(tǒng)計分析的情感詞庫構(gòu)建方法[J];武漢大學(xué)學(xué)報(理學(xué)版);2013年05期
6 彭慶喜;錢鐵云;;基于量化情感的網(wǎng)店垃圾評論檢測[J];山東大學(xué)學(xué)報(理學(xué)版);2013年11期
7 黃俊;田生偉;禹龍;馮冠軍;;基于維吾爾語情感詞的句子情感分析[J];計算機(jī)工程;2012年09期
8 孫勁光;馬志芳;孟祥福;;基于情感詞屬性和云模型的文本情感分類方法[J];計算機(jī)工程;2013年12期
9 柳位平;朱艷輝;栗春亮;向華政;文志強(qiáng);;中文基礎(chǔ)情感詞詞典構(gòu)建方法研究[J];計算機(jī)應(yīng)用;2009年10期
10 魏志生;吉陽生;羅春勇;陳家駿;;加入領(lǐng)域先驗(yàn)知識的產(chǎn)生式情感分類模型[J];計算機(jī)科學(xué)與探索;2011年12期
相關(guān)會議論文 前5條
1 陳奇哲;劉全升;姚天f ;;漢語意見型語句主題與情感關(guān)系抽取的研究[A];第五屆全國信息檢索學(xué)術(shù)會議論文集[C];2009年
2 孫慧;關(guān)毅;董喜雙;;中文情感詞傾向消歧[A];第六屆全國信息檢索學(xué)術(shù)會議論文集[C];2010年
3 段秀婷;何婷婷;宋樂;;基于PMI-IR算法的Blog情感分類研究[A];第五屆全國青年計算語言學(xué)研討會論文集[C];2010年
4 李先斌;袁平波;俞能海;;基于局部最優(yōu)的情感標(biāo)簽圖像自動標(biāo)注算法[A];第六屆和諧人機(jī)環(huán)境聯(lián)合學(xué)術(shù)會議(HHME2010)、第19屆全國多媒體學(xué)術(shù)會議(NCMT2010)、第6屆全國人機(jī)交互學(xué)術(shù)會議(CHCI2010)、第5屆全國普適計算學(xué)術(shù)會議(PCC2010)論文集[C];2010年
5 王樅;涂序彥;劉嘉;;注意-情緒協(xié)調(diào)的個性化信息推薦模型[A];2006年首屆ICT大會信息、知識、智能及其轉(zhuǎn)換理論第一次高峰論壇會議論文集[C];2006年
相關(guān)博士學(xué)位論文 前9條
1 劉全超;面向中文微博的觀點(diǎn)挖掘與傾向性分析研究[D];北京理工大學(xué);2015年
2 江騰蛟;基于句法和語義挖掘的Web金融評論情感分析[D];江西財經(jīng)大學(xué);2015年
3 楊亮;面向社交媒體的文本情感分析關(guān)鍵技術(shù)研究[D];大連理工大學(xué);2016年
4 董喜雙;基于免疫多詞主體自治學(xué)習(xí)的情感分析研究[D];哈爾濱工業(yè)大學(xué);2013年
5 楊玉珍;基于Web評論信息的傾向性分析關(guān)鍵技術(shù)研究[D];山東師范大學(xué);2014年
6 黃勝;Web評論文本的細(xì)粒度意見挖掘技術(shù)研究[D];北京理工大學(xué);2014年
7 施寒瀟;細(xì)粒度情感分析研究[D];蘇州大學(xué);2013年
8 李榮軍;中文商品評論傾向性分析研究[D];北京郵電大學(xué);2011年
9 李芳;面向中文Web評論的觀點(diǎn)挖掘關(guān)鍵技術(shù)研究[D];華中師范大學(xué);2013年
相關(guān)碩士學(xué)位論文 前10條
1 王銀;中文微博情感分析方法研究[D];廣東技術(shù)師范學(xué)院;2015年
2 崔連超;互聯(lián)網(wǎng)評論文本情感分析研究[D];山東大學(xué);2015年
3 杜雪峰;藏文句子傾向性分析研究[D];中央民族大學(xué);2015年
4 孫建超;微博輿情挖掘技術(shù)的研究與應(yīng)用[D];電子科技大學(xué);2015年
5 何天翔;基于情感詞網(wǎng)的短文本情感分類方法研究[D];西南科技大學(xué);2015年
6 丁星;基于文本傾向性分析技術(shù)的微博監(jiān)控系統(tǒng)[D];江蘇科技大學(xué);2015年
7 李茜;博客意見檢索關(guān)鍵問題研究[D];北京理工大學(xué);2015年
8 李瑞靜;漢語情感詞模糊語義的量化分析及應(yīng)用研究[D];北京理工大學(xué);2015年
9 劉沙;電商網(wǎng)站的產(chǎn)品評價對象抽取研究[D];北京理工大學(xué);2015年
10 佟鐵;醫(yī)患問答社區(qū)文本挖掘研究[D];遼寧科技大學(xué);2015年
,本文編號:1598308
本文鏈接:http://www.sikaile.net/jingjilunwen/dianzishangwulunwen/1598308.html