天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 軟件論文 >

跨語言文本情感分類技術研究

發(fā)布時間:2018-08-06 08:19
【摘要】:文本情感分類旨在通過計算機技術,對文本中表達的主觀情感傾向性進行判斷,通過充分挖掘和分析文本生產(chǎn)者的興趣傾向和情感態(tài)度,為決策者提供有價值的重要參考信息。由于國內外有效的高質量分析語料、情感詞典等分布不均,使得跨語言文本情感分類研究應運而生?缯Z言文本情感分類是利用源語言的有標注語料,輔助目標語言進行情感傾向性分析,其核心問題是解決如何將源語言和目標語言轉換到同一語言空間中。根據(jù)國內外不同語言空間的轉換手段不同,可將其分為三類:利用雙語詞典、平行語料庫建立兩種語言的對應關系以及利用機器翻譯技術等三種研究方案。本文對上述三種方案分別作了相應嘗試,主要貢獻包括以下幾個方面:(1)提出了一種在主動學習框架下的單語言文本情感分析方法SLAB。該方法中的采樣策略是在不確定性采樣策略的基礎上,使用情感詞典,在選擇最不確定的樣本的同時,也選擇情感分數(shù)較大的樣本,彌補了不確定性采樣策略的不足,從而達到提高分類器準確率的目的。應用上述主動學習中提出的采樣策略實現(xiàn)一種跨語言文本情感分類方法AL-CLSC。該方法首先利用機器翻譯技術,將英文文本翻譯為中文,然后通過主動學習方法,主動選擇“好的”訓練樣本,通過循環(huán)訓練,最終實現(xiàn)一個較好的中文文本情感分類器。進一步地,本文結合圖結構模型對所提出的方法AL-CLSC進行改進,提出GAL-CLSC方法,以期解決機器翻譯訓練語料時,可能造成的信息丟失、重復及偏差等問題。實驗結果顯示,在不同的訓練集中,該改進方法對分類器的準確率確有明顯提高。(2)考慮到近年來神經(jīng)網(wǎng)絡在文本情感分類任務中的突出表現(xiàn),本文提出兩種分別結合RNN和CNN的深度典型相關性跨語言文本情感分類方法DCCA-RNN和DCCA-CNN。該兩種方法是利用平行語料,在深度典型相關性的理論基礎上,通過RNN和CNN學習兩種語言空間的非線性關系,在映射的共享特征空間中利用典型性相關實現(xiàn)跨語言文本情感分類。
[Abstract]:The purpose of text emotion classification is to judge the tendency of subjective emotion expressed in text by computer technology, and to provide valuable reference information for decision makers by fully mining and analyzing the interest tendency and emotional attitude of text producers. Due to the uneven distribution of effective high quality analytical corpus and emotion dictionary at home and abroad, cross-language text emotion classification research emerges as the times require. Cross-language text affective classification is to use tagged corpus of source language to assist target language in emotional orientation analysis. Its core problem is how to transform source language and target language into the same language space. It can be divided into three categories according to the different methods of language space conversion at home and abroad: making use of bilingual dictionaries, establishing the corresponding relations between two languages in parallel corpus, and using machine translation technology. The main contributions are as follows: (1) A single language text affective analysis method, SLAB, is proposed under the framework of active learning. In this method, the sampling strategy is based on the uncertain sampling strategy, using the emotion dictionary to select the most uncertain samples, and at the same time to select the samples with high emotional score, which makes up for the lack of the uncertain sampling strategy. In order to improve the accuracy of the classifier. A cross-language text affective classification method, AL-CLSCC, is implemented using the sampling strategy proposed in the above active learning. The method first uses machine translation technology to translate the English text into Chinese, then through the active learning method, chooses the "good" training sample actively, and finally realizes a better Chinese text emotion classifier by cyclic training. Furthermore, this paper improves the proposed method AL-CLSC by using graph structure model, and proposes a GAL-CLSC method to solve the problems of information loss, repetition and deviation caused by machine translation training corpus. The experimental results show that the improved method does improve the accuracy of classifier in different training concentration. (2) considering the prominent performance of neural network in text emotion classification task in recent years, In this paper, we propose two cross-language affective classification methods, DCCA-RNN and DCCA-CNN, which combine with RNN and CNN, respectively. The two methods are based on the theory of depth canonical correlation, using parallel corpus to learn the nonlinear relationship between the two languages by RNN and CNN. In the shared feature space of mapping, canonical correlation is used to achieve cross-language text affective classification.
【學位授予單位】:華僑大學
【學位級別】:碩士
【學位授予年份】:2017
【分類號】:TP391.1

【相似文獻】

相關期刊論文 前10條

1 劉颯;章成志;;多語言文本表示研究綜述[J];現(xiàn)代圖書情報技術;2010年06期

2 張廷遠;;河南省紅色旅游景區(qū)語言文本現(xiàn)狀的調查及思考[J];開封大學學報;2010年04期

3 高影繁;徐紅姣;于薇;王惠臨;;基于跨語言文本分類的多語資源組織方法研究[J];情報理論與實踐;2011年10期

4 熊超;王明文;吳福英;吳世勇;沈陽;;基于潛在語義對偶空間的跨語言文本分類研究[J];廣西師范大學學報(自然科學版);2010年01期

5 杜家利;于屏方;;自然語言文本語義接受度的在線系統(tǒng)評價研究[J];計算機工程與應用;2008年26期

6 章成志;王惠臨;;多語言文本聚類研究綜述[J];現(xiàn)代圖書情報技術;2009年06期

7 史樹敏;黃河燕;劉東升;;自然語言文本指代消解技術研究[J];計算機科學;2007年12期

8 彭靜;羅偉;;一種從自然語言文本到本體模型的轉換方法[J];電大理工;2011年02期

9 馮志偉;;漢字的極限熵[J];中文信息;1996年02期

10 陳啟泉;吳揚揚;鄭躍斌;;CTDPS查詢語言文本與實現(xiàn)[J];華僑大學學報(自然科學版);1985年02期

相關會議論文 前4條

1 伊·達瓦;井佐原均;;蒙古語多文種-多語言文本-口語語料庫的建設[A];第十屆全國少數(shù)民族語言文字信息處理學術研討會論文集[C];2005年

2 盧衛(wèi)雄;;一種基于支持向量機的多國語言文本分類平臺[A];第十六屆全國青年通信學術會議論文集(上)[C];2011年

3 俞榮華;田增平;周傲英;;一種基于聚類的多語言文本相似記錄檢測算法[A];第十八屆全國數(shù)據(jù)庫學術會議論文集(技術報告篇)[C];2001年

4 曹暉;于洪志;;OpenOffice的國際化與本地化機制[A];第十屆全國少數(shù)民族語言文字信息處理學術研討會論文集[C];2005年

相關博士學位論文 前2條

1 鄒博偉;面向自然語言文本的否定性與不確定性識別研究[D];蘇州大學;2015年

2 朱澤德;網(wǎng)絡雙語語料挖掘關鍵技術研究[D];中國科學技術大學;2014年

相關碩士學位論文 前10條

1 石杰;中泰跨語言話題檢測方法與技術研究[D];昆明理工大學;2015年

2 楊文敏;自然語言文本中不確定性信息的識別研究[D];河南工業(yè)大學;2015年

3 畢文霞;基于中間語義的跨語言文本分類模型研究[D];江西師范大學;2008年

4 劉越;跨語言文本分類的研究[D];北京理工大學;2011年

5 熊超;基于潛在語義對偶空間的跨語言文本分類研究[D];江西師范大學;2010年

6 彭哲;跨語言文本相關性檢測技術研究[D];中南大學;2014年

7 萬接喜;多語言文本聚類研究[D];南京大學;2013年

8 趙江;單語言與跨語言文本蘊含關系識別的研究[D];華東師范大學;2015年

9 何文壘;基于WordNet的中英文跨語言文本相似度研究[D];上海交通大學;2011年

10 甘燦;基于同義詞替換的自然語言文本信息隱藏技術研究[D];湖南大學;2008年



本文編號:2167108

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/2167108.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶9a44f***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com