天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 搜索引擎論文 >

基于條件隨機場的網(wǎng)絡短評論挖掘系統(tǒng)研究與實現(xiàn)

發(fā)布時間:2018-05-21 12:38

  本文選題:評論挖掘 + 情感分析。 參考:《華南理工大學》2012年碩士論文


【摘要】:伴隨著WEB2.0時代的發(fā)展,互聯(lián)網(wǎng)上的信息內(nèi)容不斷增多,,人們獲得準確信息的難度也隨著增大;ヂ(lián)網(wǎng)的信息主要是兩種:事實信息和觀點信息,我們可以通過搜索引擎去獲得事實信息卻難以有途徑去獲得互聯(lián)網(wǎng)上人們對某一事物的觀點。因此對評論的挖掘能夠為互聯(lián)網(wǎng)用戶提供發(fā)現(xiàn)觀點信息的途徑。 評論挖掘是當前自然語言處理領域研究的熱點,主要任務是對評論進行主客觀識別和褒貶義分析。當前在評論挖掘領域的研究主要是針對通用領域的,效果不佳,對于特定領域的評論挖掘研究則是過多依賴于人工構建的領域詞典。相對于評論文章來說,短評論文本的主要特點是文本短小、內(nèi)容稀疏、主觀性強、構詞不規(guī)律、領域依賴性強,本文針對短評論的特點采用條件隨機場模型和自動構建的領域詞典來進行短評論評價對象和情感詞信息的提取。 本論文研究并實現(xiàn)了基于條件隨機場的網(wǎng)絡短評論挖掘系統(tǒng),主要工作如下: 第一、提取出短評論中的特征對象組合詞,然后結合半自動化構建的情感詞集構建自定義領域詞典; 第二、設計符合評論內(nèi)容結構特征的條件隨機場模型,針對評論的內(nèi)容規(guī)律設計了條件隨機場的特征函數(shù),使得條件隨機場能夠準確地挖掘出評論的特征對象和情感詞; 第三、研究了特征對象和情感詞的匹配算法,提取出評論中的評價對象與情感詞對; 第四、識別出情感詞的情感傾向性。 本文將基于條件隨機場的網(wǎng)絡短評論挖掘系統(tǒng)應用到挖掘點評網(wǎng)站的餐飲評論的服務評價信息,實驗結果證明基于條件隨機場模型確實可以有效提取出短評論的特征對象和情感詞信息,在加入自動構建的領域詞典的情況下能夠?qū)⒛P蛿U展到其它領域的評論中,用戶可以通過挖掘的結果了解到該主題的所有評論的有價值觀點信息。
[Abstract]:With the development of the WEB2.0 era, the content of information on the Internet is increasing, and the difficulty of obtaining accurate information is also increasing. There are two kinds of information on the Internet: factual information and opinion information. We can obtain factual information through search engine, but it is difficult to obtain people's views on a certain thing on the Internet. Therefore, the mining of comments can provide Internet users with a way to discover viewpoint information. Comment mining is a hot topic in the field of natural language processing. The main task is to identify comments objectively and subjectively. The current research in the field of comment mining is mainly aimed at the general field, and the effect is not good. The research of comment mining in specific fields is too dependent on artificial domain dictionaries. Compared with the comment articles, the main features of the short commentary texts are short text, sparse content, strong subjectivity, irregular word-formation, strong domain dependence. According to the characteristics of short comment, this paper uses conditional random field model and automatic domain dictionary to extract the information of evaluation object and emotion word of short comment. This paper studies and implements a conditional random field based network short comment mining system. The main work is as follows: First, the feature object combination words in short comments are extracted, and then the custom domain dictionary is constructed with the semi-automatic set of emotion words. Secondly, the conditional random field model which accords with the structural features of comment content is designed, and the feature function of conditional random field is designed according to the rule of content of comment, so that the conditional random field can accurately excavate the feature object and emotion word of comment. Thirdly, the matching algorithm of feature objects and affective words is studied, and the evaluation objects and affective word pairs in comments are extracted. Fourth, identify the emotional tendency of emotional words. In this paper, the conditional random field based network short comment mining system is applied to the service evaluation information of the restaurant comment mining site. The experimental results show that the conditional random field model can effectively extract the feature object and affective word information of the short comment, and the model can be extended to the comments in other fields by adding the automatically constructed domain dictionary. Users can get valuable opinion information about all comments on the subject through the results of the mining.
【學位授予單位】:華南理工大學
【學位級別】:碩士
【學位授予年份】:2012
【分類號】:TP391.3

【參考文獻】

相關期刊論文 前10條

1 田久樂;趙蔚;;基于同義詞詞林的詞語相似度計算方法[J];吉林大學學報(信息科學版);2010年06期

2 傅賽香,袁鼎榮,黃柏雄,鐘智;基于統(tǒng)計的無詞典分詞方法[J];廣西科學院學報;2002年04期

3 程濤;施水才;王霞;呂學強;;基于同義詞詞林的中文文本主題詞提取[J];廣西師范大學學報(自然科學版);2007年02期

4 趙偉,戴新宇,尹存燕,陳家駿;一種規(guī)則與統(tǒng)計相結合的漢語分詞方法[J];計算機應用研究;2004年03期

5 張玉芳;莫凌琳;熊忠陽;耿曉斐;;基于條件隨機場的科研論文信息分層抽取[J];計算機應用研究;2009年10期

6 梅立軍,周強,臧路,陳祖舜;知網(wǎng)與同義詞詞林的信息融合研究[J];中文信息學報;2005年01期

7 黃昌寧;趙海;;中文分詞十年回顧[J];中文信息學報;2007年03期

8 唐慧豐;譚松波;程學旗;;基于監(jiān)督學習的中文情感分類技術比較研究[J];中文信息學報;2007年06期

9 徐軍;丁宇新;王曉龍;;使用機器學習方法進行新聞的情感自動分類[J];中文信息學報;2007年06期

10 劉康;趙軍;;基于層疊CRFs模型的句子褒貶度分析研究[J];中文信息學報;2008年01期

相關會議論文 前1條

1 倪茂樹;林鴻飛;;基于關聯(lián)規(guī)則和極性分析的商品評論挖掘[A];第三屆全國信息檢索與內(nèi)容安全學術會議論文集[C];2007年

相關碩士學位論文 前2條

1 楊樂;基于同義詞詞林的自動文摘系統(tǒng)的研究[D];天津大學;2007年

2 陳建美;中文情感詞匯本體的構建及其應用[D];大連理工大學;2009年



本文編號:1919223

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/sousuoyinqinglunwen/1919223.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶b05b6***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com