基于詞語(yǔ)相關(guān)度的微博新情感詞自動(dòng)識(shí)別
[Abstract]:In order to solve the problem of recognition of new emotional words in Weibo, an automatic recognition method of Weibo new emotional words based on word correlation degree is proposed. First of all, for the problem that a new word is misdivided into several words by word segmentation software, the adjacent words are merged as candidates for new words by using the combination idea. Secondly, in order to make full use of the semantic information of word context, neural network is used to train the corpus to obtain the spatial representation vector of candidate new words. Finally, using the existing emotion dictionary as the guide, the correlation degree sorting and the maximum correlation degree sorting algorithm based on thesaurus set are combined to screen the candidate words and obtain the final emotional new words. Based on the task 3 corpus of COAE2014 (sixth Chinese tendency Analysis and Evaluation), the proposed fusion algorithm and point mutual information (PMI), enhance the distance (MED), of (EMI), multi-word expression with mutual information. Compared with the new word probability (NWP) and the new word recognition method based on word vector, the accuracy of the new word recognition method is improved by at least 22%, which shows that this method is better than the other five methods in automatically recognizing Weibo new emotional words.
【作者單位】: 山西大學(xué)計(jì)算機(jī)與信息技術(shù)學(xué)院;計(jì)算智能與中文信息處理教育部重點(diǎn)實(shí)驗(yàn)室(山西大學(xué));
【基金】:國(guó)家863計(jì)劃項(xiàng)目(2015AA015407) 國(guó)家自然科學(xué)基金資助項(xiàng)目(61175067,61272095,61432011,61573231,U1435212) 山西省科技基礎(chǔ)條件平臺(tái)計(jì)劃項(xiàng)目(2015091001-0102) 山西省回國(guó)留學(xué)人員科研項(xiàng)目(2013-014)~~
【分類(lèi)號(hào)】:TP391.1
【參考文獻(xiàn)】
相關(guān)期刊論文 前1條
1 鄭家恒,李文花;基于構(gòu)詞法的網(wǎng)絡(luò)新詞自動(dòng)識(shí)別初探[J];山西大學(xué)學(xué)報(bào)(自然科學(xué)版);2002年02期
【共引文獻(xiàn)】
相關(guān)期刊論文 前10條
1 羅智勇;宋柔;;基于多特征的自適應(yīng)新詞識(shí)別[J];北京工業(yè)大學(xué)學(xué)報(bào);2007年07期
2 林自芳;蔣秀鳳;;基于改進(jìn)位置成詞概率的新詞識(shí)別[J];福州大學(xué)學(xué)報(bào)(自然科學(xué)版);2011年01期
3 梁韜;張瑞;;基于詞語(yǔ)條件信息量的新詞發(fā)現(xiàn)[J];電子技術(shù)與軟件工程;2014年11期
4 車(chē)飛;;近十余年來(lái)漢語(yǔ)網(wǎng)絡(luò)新詞語(yǔ)研究述略[J];重慶工商大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版);2015年03期
5 李新福;趙杰;梁巍;;基于互信息的宋史語(yǔ)料庫(kù)詞表的提取[J];河北大學(xué)學(xué)報(bào)(自然科學(xué)版);2006年05期
6 黃東平,田芳;BBS信息過(guò)濾技術(shù)研究[J];長(zhǎng)江大學(xué)學(xué)報(bào)(自科版);2004年01期
7 張海軍;史樹(shù)敏;朱朝勇;黃河燕;;中文新詞識(shí)別技術(shù)綜述[J];計(jì)算機(jī)科學(xué);2010年03期
8 丁建立;慈祥;黃劍雄;;一種基于免疫遺傳算法的網(wǎng)絡(luò)新詞識(shí)別方法[J];計(jì)算機(jī)科學(xué);2011年01期
9 張海軍;欒靜;李勇;齊向偉;;基于統(tǒng)計(jì)學(xué)習(xí)框架的中文新詞檢測(cè)方法[J];計(jì)算機(jī)科學(xué);2012年02期
10 廖豪;陳潔;譚建龍;;大規(guī)模語(yǔ)料中頻繁模式增量發(fā)現(xiàn)算法[J];計(jì)算機(jī)工程;2011年23期
相關(guān)博士學(xué)位論文 前5條
1 張海軍;基于大規(guī)模語(yǔ)料的中文新詞識(shí)別技術(shù)研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2011年
2 高紅;基于統(tǒng)計(jì)語(yǔ)言模型的漢語(yǔ)淺層分析研究[D];大連理工大學(xué);2007年
3 孫凌云;面向產(chǎn)品概念設(shè)計(jì)的專(zhuān)利地圖技術(shù)研究[D];浙江大學(xué);2008年
4 龔才春;短文本語(yǔ)言計(jì)算的關(guān)鍵技術(shù)研究[D];中國(guó)科學(xué)院研究生院(計(jì)算技術(shù)研究所);2008年
5 孫曉;中文詞法分析的研究及其應(yīng)用[D];大連理工大學(xué);2010年
相關(guān)碩士學(xué)位論文 前10條
1 史迎馨;建筑圖中有限自然語(yǔ)言的分析與理解的研究[D];長(zhǎng)春工業(yè)大學(xué);2010年
2 魏莎莎;一種中文未登錄詞識(shí)別及詞典設(shè)計(jì)新方法[D];西南大學(xué);2011年
3 丁溪源;基于大規(guī)模語(yǔ)料的中文新詞抽取算法的設(shè)計(jì)與實(shí)現(xiàn)[D];南京理工大學(xué);2011年
4 劉衛(wèi)秋;專(zhuān)利信息檢索系統(tǒng)的研究與實(shí)現(xiàn)[D];中南大學(xué);2010年
5 高超;一種基于綜合背景概念格的中文自動(dòng)文摘方法[D];中南大學(xué);2011年
6 李婷婷;網(wǎng)絡(luò)詞語(yǔ)造詞法及語(yǔ)用義研究[D];安徽大學(xué);2011年
7 周春波;面向WI輸入法的新詞發(fā)現(xiàn)技術(shù)研究與實(shí)現(xiàn)[D];哈爾濱工業(yè)大學(xué);2011年
8 陳浩;網(wǎng)絡(luò)信息采集技術(shù)及中文未登錄詞算法研究[D];北京郵電大學(xué);2012年
9 崔世起;中文新詞檢測(cè)與分析[D];中國(guó)科學(xué)院研究生院(計(jì)算技術(shù)研究所);2006年
10 鄒綱;中文新詞語(yǔ)自動(dòng)檢測(cè)研究[D];中國(guó)科學(xué)院研究生院(計(jì)算技術(shù)研究所);2004年
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 許璐蕾;;網(wǎng)絡(luò)評(píng)論中情感詞的獲取及極性判斷方法比較[J];電腦與電信;2011年01期
2 肖健;徐建;朱姝;萬(wàn)纓;許亮;;基于翻譯和語(yǔ)義方法的情感詞挖掘研究[J];計(jì)算機(jī)工程與應(yīng)用;2011年32期
3 趙鵬;趙志偉;卓景文;;一種情感詞語(yǔ)義加權(quán)的句子傾向性識(shí)別方法[J];計(jì)算機(jī)工程與應(yīng)用;2011年35期
4 代大明;李壽山;李培峰;朱巧明;;基于情緒詞與情感詞協(xié)作學(xué)習(xí)的情感分類(lèi)方法研究[J];計(jì)算機(jī)科學(xué);2012年12期
5 李勇敢;周學(xué)廣;孫艷;張煥國(guó);;結(jié)合依存關(guān)聯(lián)分析和規(guī)則統(tǒng)計(jì)分析的情感詞庫(kù)構(gòu)建方法[J];武漢大學(xué)學(xué)報(bào)(理學(xué)版);2013年05期
6 彭慶喜;錢(qián)鐵云;;基于量化情感的網(wǎng)店垃圾評(píng)論檢測(cè)[J];山東大學(xué)學(xué)報(bào)(理學(xué)版);2013年11期
7 杜嘉忠;徐健;劉穎;;網(wǎng)絡(luò)商品評(píng)論的特征 情感詞本體構(gòu)建與情感分析方法研究[J];現(xiàn)代圖書(shū)情報(bào)技術(shù);2014年05期
8 張清亮;徐健;;網(wǎng)絡(luò)情感詞自動(dòng)識(shí)別方法研究[J];現(xiàn)代圖書(shū)情報(bào)技術(shù);2011年10期
9 黃俊;田生偉;禹龍;馮冠軍;;基于維吾爾語(yǔ)情感詞的句子情感分析[J];計(jì)算機(jī)工程;2012年09期
10 孫勁光;馬志芳;孟祥福;;基于情感詞屬性和云模型的文本情感分類(lèi)方法[J];計(jì)算機(jī)工程;2013年12期
相關(guān)會(huì)議論文 前5條
1 陳奇哲;劉全升;姚天f ;;漢語(yǔ)意見(jiàn)型語(yǔ)句主題與情感關(guān)系抽取的研究[A];第五屆全國(guó)信息檢索學(xué)術(shù)會(huì)議論文集[C];2009年
2 孫慧;關(guān)毅;董喜雙;;中文情感詞傾向消歧[A];第六屆全國(guó)信息檢索學(xué)術(shù)會(huì)議論文集[C];2010年
3 段秀婷;何婷婷;宋樂(lè);;基于PMI-IR算法的Blog情感分類(lèi)研究[A];第五屆全國(guó)青年計(jì)算語(yǔ)言學(xué)研討會(huì)論文集[C];2010年
4 李先斌;袁平波;俞能海;;基于局部最優(yōu)的情感標(biāo)簽圖像自動(dòng)標(biāo)注算法[A];第六屆和諧人機(jī)環(huán)境聯(lián)合學(xué)術(shù)會(huì)議(HHME2010)、第19屆全國(guó)多媒體學(xué)術(shù)會(huì)議(NCMT2010)、第6屆全國(guó)人機(jī)交互學(xué)術(shù)會(huì)議(CHCI2010)、第5屆全國(guó)普適計(jì)算學(xué)術(shù)會(huì)議(PCC2010)論文集[C];2010年
5 王樅;涂序彥;劉嘉;;注意-情緒協(xié)調(diào)的個(gè)性化信息推薦模型[A];2006年首屆ICT大會(huì)信息、知識(shí)、智能及其轉(zhuǎn)換理論第一次高峰論壇會(huì)議論文集[C];2006年
相關(guān)博士學(xué)位論文 前7條
1 董喜雙;基于免疫多詞主體自治學(xué)習(xí)的情感分析研究[D];哈爾濱工業(yè)大學(xué);2013年
2 寇廣增;基于意見(jiàn)挖掘通用框架的情感極性強(qiáng)度模糊性研究[D];武漢大學(xué);2010年
3 楊玉珍;基于Web評(píng)論信息的傾向性分析關(guān)鍵技術(shù)研究[D];山東師范大學(xué);2014年
4 黃勝;Web評(píng)論文本的細(xì)粒度意見(jiàn)挖掘技術(shù)研究[D];北京理工大學(xué);2014年
5 施寒瀟;細(xì)粒度情感分析研究[D];蘇州大學(xué);2013年
6 李榮軍;中文商品評(píng)論傾向性分析研究[D];北京郵電大學(xué);2011年
7 李芳;面向中文Web評(píng)論的觀點(diǎn)挖掘關(guān)鍵技術(shù)研究[D];華中師范大學(xué);2013年
相關(guān)碩士學(xué)位論文 前10條
1 孫博;關(guān)于情感詞的意義用法[D];遼寧大學(xué);2012年
2 王銀;中文微博情感分析方法研究[D];廣東技術(shù)師范學(xué)院;2015年
3 崔連超;互聯(lián)網(wǎng)評(píng)論文本情感分析研究[D];山東大學(xué);2015年
4 杜雪峰;藏文句子傾向性分析研究[D];中央民族大學(xué);2015年
5 孫建超;微博輿情挖掘技術(shù)的研究與應(yīng)用[D];電子科技大學(xué);2015年
6 張圣聲;基于微博平臺(tái)的產(chǎn)品評(píng)論情感分類(lèi)研究[D];廣東外語(yǔ)外貿(mào)大學(xué);2015年
7 何天翔;基于情感詞網(wǎng)的短文本情感分類(lèi)方法研究[D];西南科技大學(xué);2015年
8 丁星;基于文本傾向性分析技術(shù)的微博監(jiān)控系統(tǒng)[D];江蘇科技大學(xué);2015年
9 李茜;博客意見(jiàn)檢索關(guān)鍵問(wèn)題研究[D];北京理工大學(xué);2015年
10 李瑞靜;漢語(yǔ)情感詞模糊語(yǔ)義的量化分析及應(yīng)用研究[D];北京理工大學(xué);2015年
,本文編號(hào):2494395
本文鏈接:http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/2494395.html