天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 軟件論文 >

基于文本分類的微博情感傾向研究

發(fā)布時間:2018-03-28 22:18

  本文選題:微博 切入點:情感傾向 出處:《重慶師范大學》2016年碩士論文


【摘要】:近年來,人們越來越依賴于社交軟件來表達自己的觀點,如使用微博、論壇、貼吧等渠道發(fā)表意見,表達情感。而人們對于熱點事件和話題的各種各樣的情感信息,則通過上述方式直觀的反映了出來。因此,通過挖掘和研究大眾對各類事件的情感傾向,可以達到對熱點輿論的監(jiān)控和大眾看法的感知,為國家、企業(yè)等作出決策提供著重要依據(jù)。以往的信息檢索及采集技術,多數(shù)是以關鍵詞為基礎,難以支持情感傾向的挖掘,信息提取和文本分類通常沒有進行深層次的語義挖掘,因而對文本中所表達出的情感傾向無法進行深層次的挖掘。因此在大數(shù)據(jù)時代,有效地利用數(shù)據(jù)挖掘及文本挖掘的相關知識,挖掘微博熱點信息以及評論中的情感傾向,將在商品智能推薦、政府輿情監(jiān)控、文本自動分類等方面有廣闊的發(fā)展前景。本論文的主要研究內(nèi)容如下:(1)對情感傾向分析和文本分類的相關概念和技術做了分析,包括微博短文本情感傾向分類以及文本分類的國內(nèi)外研究現(xiàn)狀、文本分類常用的幾種算法:支持向量機(SVM),最大熵、決策樹、人工神經(jīng)網(wǎng)絡算法等,并重點分析了傳統(tǒng)的k最近鄰算法,研究算法的基本思路以及該算法在文本分類當中的應用。(2)基于傳統(tǒng)的k最近鄰算法,并結合一定的關聯(lián)規(guī)則,本文提出了一種對于k最近鄰算法的改進:基于主題--情感相關聯(lián)的k最近鄰算法,在文本分類時主題與情感相關聯(lián),進行特征值的組合,能夠更好的確定k值,提高分類效率。(3)將改進后的基于主題--情感的k最近鄰算法在微博熱點信息數(shù)據(jù)集中加以應用,進行情感傾向正向、負向、中性三種分類實驗,同時也利用傳統(tǒng)的k最近鄰算法進行對比實驗。在實驗前完成微博短文本預處理、特征頻繁項集建立等工作。實驗結果表明,較傳統(tǒng)的k最近鄰算法,本文改進的算法在查準率、查準率以及F1值等各項測評指標中都有所提高,降低了算法的時間復雜度,提高了情感分類的效率,有利于更加準確的挖掘微博熱點信息中的情感傾向,在處理海量包含主題的中文熱門微博時具有一定的可行性。
[Abstract]:In recent years, people have become increasingly dependent on social software to express their views, such as using Weibo, forums, posts and other channels to express their opinions and feelings. And people on hot events and topics of all kinds of emotional information, Thus, by digging and studying the emotional tendencies of the public on various events, we can achieve the monitoring of hot public opinion and the perception of public opinion, for the country, In the past, most of the information retrieval and collection techniques are based on keywords, so it is difficult to support the mining of emotional tendency, and the information extraction and text classification usually do not carry out deep semantic mining. Therefore, in big data's time, the relevant knowledge of data mining and text mining can be effectively used to mine the hot information and the emotional tendency in commentaries. There will be broad prospects in the fields of intelligent recommendation of commodities, monitoring of government public opinion, automatic text classification, etc. The main contents of this paper are as follows: 1) the related concepts and techniques of affective tendency analysis and text categorization are analyzed. Including the current research situation of Weibo short text text classification and text classification at home and abroad, and several commonly used text classification algorithms: support vector machine (SVM), maximum entropy, decision tree, artificial neural network algorithm, etc. The basic idea of the algorithm and its application in text categorization are studied. (2) based on the traditional k-nearest neighbor algorithm and some association rules. In this paper, an improved k-nearest neighbor algorithm is proposed, which is based on subject-affective association algorithm. When text is classified, the topic is associated with emotion, and the combination of feature values can better determine the value of k. To improve the classification efficiency. (3) the improved subject-based k-nearest neighbor algorithm is applied to Weibo hot spot information data set to carry out three classification experiments: positive, negative and neutral emotional tendency. At the same time, the traditional k-nearest neighbor algorithm is used to carry out comparative experiments. Before the experiment, Weibo short text preprocessing and feature frequent itemsets are completed. The experimental results show that the k-nearest neighbor algorithm is more efficient than the traditional k-nearest neighbor algorithm. In this paper, the improved algorithm improves the precision rate, precision rate and F1 value, which reduces the time complexity of the algorithm and improves the efficiency of emotion classification. It is helpful to excavate the emotion tendency of Weibo hot spot information more accurately, and has certain feasibility when dealing with the massive Chinese hot topic Weibo.
【學位授予單位】:重慶師范大學
【學位級別】:碩士
【學位授予年份】:2016
【分類號】:TP391.1

【相似文獻】

相關期刊論文 前10條

1 呂國防;;注意新聞表述中的情感傾向[J];新聞實踐;2011年06期

2 傅向華;劉國;郭巖巖;郭武彪;;中文博客多方面話題情感分析研究[J];中文信息學報;2013年01期

3 魏晶晶;吳曉吟;;電子商務產(chǎn)品評論多級情感分析的研究與實現(xiàn)[J];軟件;2013年09期

4 于瀟;萬軍;何翔;左尾歡;;校園微博情感分析系統(tǒng)的設計與實現(xiàn)[J];河北工業(yè)大學學報;2013年06期

5 封二英;龐靈;;基于弱監(jiān)督迭代法的情感傾向分析[J];無線互聯(lián)科技;2014年03期

6 龐磊;李壽山;張慧;周國棟;;基于微博的股票投資者未來情感傾向識別研究[J];計算機科學;2012年S1期

7 徐鵬;;基于直覺模糊推理的網(wǎng)頁在線評論情感傾向分類[J];計算機應用與軟件;2013年06期

8 楊偉杰;馬博淵;劉雯;;基于意見目標句抽取的中文股評情感分析方法[J];計算機仿真;2014年03期

9 楊江;彭石玉;侯敏;;基于主題情感句的漢語評論文傾向性分析[J];計算機應用研究;2011年02期

10 張素智;樊得強;李寶燕;;基于網(wǎng)絡評論語言學結構的情感傾向識別模型[J];鄭州大學學報(理學版);2011年01期

相關會議論文 前4條

1 楊江;侯敏;王寧;;基于主題情感句的漢語評論文傾向性分析[A];第五屆全國青年計算語言學研討會論文集[C];2010年

2 林慧恩;林世平;;中文情感傾向分析中主觀句子抽取方法的研究[A];全國第20屆計算機技術與應用學術會議(CACIS·2009)暨全國第1屆安全關鍵技術與應用學術會議論文集(上冊)[C];2009年

3 王素格;楊安娜;;一種混合語言信息的詞語搭配傾向判別方法[A];第五屆全國信息檢索學術會議論文集[C];2009年

4 宋曉雷;王素格;李紅霞;;基于概率潛在語義分析的詞匯情感傾向判別[A];第五屆全國青年計算語言學研討會論文集[C];2010年

相關重要報紙文章 前3條

1 唐楠;新聞應避免情感傾向[N];中國新聞出版報;2005年

2 魯東;不盡鄉(xiāng)情入畫來[N];中國文化報;2001年

3 楊勇濤;讓攝影喚起心靈的本真[N];中國攝影報;2005年

相關博士學位論文 前6條

1 房磊;融合知識的情感分析研究[D];清華大學;2015年

2 張奇;細顆粒度情感傾向分析若干關鍵問題研究[D];復旦大學;2008年

3 王素格;基于Web的評論文本情感分類問題研究[D];上海大學;2008年

4 楊卉;Web文本觀點挖掘及隱含情感傾向的研究[D];吉林大學;2011年

5 李思;WEB觀點挖掘中關鍵問題的研究[D];北京郵電大學;2012年

6 李方濤;基于產(chǎn)品評論的情感分析研究[D];清華大學;2011年

相關碩士學位論文 前10條

1 王帥;情感分析的特征提取算法與觀點的聚類算法研究[D];昆明理工大學;2015年

2 馮金剛;網(wǎng)絡輿情中文信息情感傾向分析研究[D];華北電力大學;2015年

3 魏從源;網(wǎng)絡信息的情感傾向分類技術研究[D];國防科學技術大學;2013年

4 周冬衛(wèi);中文微博評論的情感傾向分析[D];華東交通大學;2015年

5 吳斐;跨領域條件下詞匯情感傾向判別方法研究[D];合肥工業(yè)大學;2015年

6 徐凱;基于產(chǎn)品特征的用戶評論情感傾向分析研究[D];合肥工業(yè)大學;2015年

7 王格;網(wǎng)絡評論的情感傾向分析[D];武漢工程大學;2015年

8 劉其;基于用戶評論的群體情緒識別與演化研究[D];東華大學;2015年

9 張佳明;微博話題的公眾情感分析技術研究[D];解放軍信息工程大學;2015年

10 唐浩浩;面向事件的微博情感傾向性分析技術研究[D];解放軍信息工程大學;2014年

,

本文編號:1678321

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/1678321.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶e74ca***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com