天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 軟件論文 >

社交網(wǎng)絡(luò)評論中的反語識別研究

發(fā)布時間:2018-04-17 04:33

  本文選題:反語識別 + 文本分類; 參考:《云南財(cái)經(jīng)大學(xué)》2017年碩士論文


【摘要】:隨著信息技術(shù)的蓬勃發(fā)展,網(wǎng)絡(luò)中的文檔成為主要的信息載體,是人們生活中主要信息來源。隨著互聯(lián)網(wǎng)Web2.0時代的到來,人們從被動接受門戶網(wǎng)站的信息,轉(zhuǎn)為主動在社交媒體上發(fā)布、共享、傳播信息。由于用戶參與信息產(chǎn)生過程中,網(wǎng)絡(luò)信息的內(nèi)容形式也變得多種多樣。這些關(guān)于觀點(diǎn)性的內(nèi)容對社會輿情分析、電子商務(wù)等方面都有著重要的意義和實(shí)用價(jià)值。針對這種觀點(diǎn)性文本的情感分類逐漸演變?yōu)橐粋熱點(diǎn)問題。在網(wǎng)絡(luò)文本中經(jīng)常出現(xiàn)反語,他們利用反語來表達(dá)主觀的以及深層次的觀點(diǎn),反語的使用將大大增加情感分析的難度。為了提高情感分類的準(zhǔn)確度,需要探討反語識別,因此本文研究的是反語識別。本文主要從兩個方面研究反語的識別:一是基于規(guī)則的反語識別方法;二是基于機(jī)器學(xué)習(xí)反語識別方法。對于基于規(guī)則的反語識別方法,本文中提出了兩種反語識別的規(guī)則——歇后語規(guī)則、違反常識規(guī)則,這也是本文的創(chuàng)新之處。對違反常識規(guī)則部分引入了矛盾關(guān)系檢測,通過矛盾關(guān)系中的反義詞規(guī)則和否定詞規(guī)則,來判斷文本是否是違反了常識規(guī)則。滿足上述兩種規(guī)則中的其中一種的文本則判定為反語,對于不滿足規(guī)則的文本,使用機(jī)器學(xué)習(xí)方法訓(xùn)練分類器,識別出反語。訓(xùn)練分類器過程中,構(gòu)建特征體系——英文詞、特定的語氣詞、文本中特定的詞匯、網(wǎng)絡(luò)詞匯、諧音字、連續(xù)的標(biāo)點(diǎn)符號,將分詞后并刪除停用詞后的所有不重復(fù)詞也納入特征體系。計(jì)算只使用機(jī)器學(xué)習(xí)方法進(jìn)行反語識別的性能,同時也計(jì)算規(guī)則結(jié)合機(jī)器學(xué)習(xí)方法進(jìn)行反語識別的性能,并比較這兩種方法的性能。本文發(fā)現(xiàn)本文中提出的規(guī)則結(jié)合機(jī)器學(xué)習(xí)方法對反語識別相對只使用機(jī)器學(xué)習(xí)方法是更有效的。
[Abstract]:With the rapid development of information technology, network documents become the main carrier of information, is the main source of information in people's life. With the advent of the Internet Web2.0 era, people accept the information portal from passive to active in social media release, sharing and dissemination of information. Because the user participation in the information network process. The content of the information form has become diverse. These views about the content analysis of social public opinion, e-commerce and other aspects are of great significance and practical value. In this view the text sentiment classification has gradually evolved into a hot issue. Irony often appear in the network text, they use the language to express subjective and deep view of irony use will greatly increase the difficulty of sentiment analysis. In order to improve the accuracy of sentiment classification, to explore irony recognition, because This paper is the study of irony recognition. This article mainly from the two aspects of irony recognition: one is the irony recognition method based on rules; two is the irony recognition method based on machine learning. The irony recognition method based on rules, this paper puts forward two kinds of irony recognition rules of Xiehouyu rules, in violation of common sense rules. This is also the innovation of this paper. Any violation of common sense rules introduced by the contradiction between detection, the contradiction between the opposite rule and negation rules, to determine whether the text is in violation of common sense rules. Meet the above two kinds of rules in which a text is judged for irony, does not meet the rules of the text. The use of machine learning methods to train the classifier, recognize the irony. The process of training classifier, feature construction system -- English specific words, modal words, vocabulary specific text in network Vocabulary, homophonic words, punctuation, continuous, word and delete the stop words after all words are included in the feature system. Calculation only using machine learning methods for performance of irony recognition, but also the calculation rules combined with machine learning method for recognition of irony, and compare the performance of these two methods. We find that the proposed rule learning method with the machine of irony recognition relative only use the machine learning method is more effective.

【學(xué)位授予單位】:云南財(cái)經(jīng)大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2017
【分類號】:TP391.1

【參考文獻(xiàn)】

相關(guān)期刊論文 前3條

1 鄧釗;賈修一;陳家駿;;面向微博的中文反語識別研究[J];計(jì)算機(jī)工程與科學(xué);2015年12期

2 劉茂福;王月;顧進(jìn)廣;;基于語義規(guī)則的中文矛盾關(guān)系識別方法[J];計(jì)算機(jī)工程與科學(xué);2015年04期

3 劉正光;反語理論綜述[J];解放軍外國語學(xué)院學(xué)報(bào);2002年04期

相關(guān)博士學(xué)位論文 前3條

1 張冬梅;文本情感分類及觀點(diǎn)摘要關(guān)鍵問題研究[D];山東大學(xué);2012年

2 代印唐;基于語義網(wǎng)絡(luò)的知識協(xié)作關(guān)鍵技術(shù)研究[D];復(fù)旦大學(xué);2009年

3 陳博;WEB文本情感分類中關(guān)鍵問題的研究[D];北京郵電大學(xué);2008年

相關(guān)碩士學(xué)位論文 前9條

1 李曉笛;Web文本挖掘技術(shù)研究及應(yīng)用[D];北京交通大學(xué);2015年

2 李偉;網(wǎng)絡(luò)語言中的反語研究[D];新疆師范大學(xué);2012年

3 王楷翔;基于蘊(yùn)涵推理的知識語義沖突識別方法及其實(shí)現(xiàn)[D];上海交通大學(xué);2011年

4 張鑫華;基于語義推理的知識相似性與沖突檢測研究[D];上海交通大學(xué);2011年

5 湯羅浩;基于STN的行動計(jì)劃時間表示和沖突處理研究[D];國防科學(xué)技術(shù)大學(xué);2010年

6 尚愛華;從圖形—背景理論看反語[D];河南大學(xué);2010年

7 馬春榮;關(guān)聯(lián)理論框架下的言語反語研究[D];南京師范大學(xué);2007年

8 陳晶晶;反語生成和理解機(jī)制研究[D];河南大學(xué);2007年

9 謝騁超;基于語義的數(shù)據(jù)庫全文檢索系統(tǒng)[D];浙江大學(xué);2006年

,

本文編號:1762105

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/1762105.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶ec760***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com