基于深度學(xué)習(xí)的可解釋性情感分析模型研究
發(fā)布時(shí)間:2021-11-14 16:41
社交網(wǎng)絡(luò)的迅猛發(fā)展為人們提供了發(fā)表和分享個(gè)人言論的廣闊平臺(tái),各種網(wǎng)絡(luò)數(shù)據(jù)迅速膨脹,越來(lái)越多的人在網(wǎng)絡(luò)上發(fā)表意見和表達(dá)情感,潛在用戶可以通過(guò)瀏覽這些主觀色彩的評(píng)論來(lái)了解大眾輿論對(duì)于某一事物或產(chǎn)品的看法,因此,如何利用自然語(yǔ)言處理(Natural Language Processing,NLP)技術(shù)分析社交網(wǎng)絡(luò)短文本的情感傾向,已經(jīng)成為研究人員關(guān)注的熱點(diǎn)。目前,深度學(xué)習(xí)方法已經(jīng)在很多情感分析任務(wù)中取得了先進(jìn)的成果,這些研究多數(shù)使用卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)和循環(huán)神經(jīng)網(wǎng)路(Recurrent Neural Networks,RNN),尤其是LSTM(Long Short-Term Memory)和GRU(Gated Recurrent Unit)等RNN衍生網(wǎng)絡(luò),不僅可以更好的解決文本序列問(wèn)題,還可以一定程度上避免梯度消失,得到更好的分類效果。然而,深度學(xué)習(xí)模型通常作為“黑盒”使用,即模型只給出最后的分類結(jié)果,并未對(duì)模型的分類結(jié)果和決策做出可以理解的解釋,這使得用戶無(wú)法完全信任模型給出的結(jié)果從而無(wú)法幫助用戶進(jìn)行合理的決策。同時(shí),研究表明...
【文章來(lái)源】:吉林大學(xué)吉林省 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:62 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
商品評(píng)論摘要
第1章緒論2根據(jù)已有經(jīng)驗(yàn),當(dāng)人類對(duì)于某事物做出分析和判斷時(shí),不僅僅基于該事物所給出的原有信息,而更多的是結(jié)合已有的知識(shí),如常識(shí)、定理等進(jìn)行思考。目前,現(xiàn)有的情感分析模型中多數(shù)只著眼于文本上下文特征間的關(guān)系挖掘,缺乏對(duì)深層神經(jīng)網(wǎng)絡(luò)外部知識(shí)的有效整合,如何利用已有的知識(shí)指導(dǎo)分類器決策,也成為本文研究的重點(diǎn)之一。1.2國(guó)內(nèi)外研究現(xiàn)狀如圖1.2所示,情感分析任務(wù)從層次上可分為:文檔級(jí)別情感分析、句子級(jí)別情感分析、特定方面級(jí)別情感分析[3]。例如一段評(píng)論文本“①Thisphonewasgiventomywifeasabirthdaygift,andshelikeditverymuch.②Theappearanceofthephoneisverycute,thepinkbodyisverysuitableforgirlstouse,thecameraisveryhighandhasautomaticbeautyfunction.③Thestandbytimeofmobileisaverage,butthisisacommonproblemwithsmartphones.④Thescreenislargeandclear,butthepriceisreallyexpensive.”針對(duì)此文本評(píng)論,文檔級(jí)別情感分析的任務(wù)是預(yù)測(cè)整段文本的情感傾向,句子級(jí)別情感分析的任務(wù)為分別預(yù)測(cè)句子①-⑤每一句的情感極性,而方面級(jí)別的情感分析任務(wù)是識(shí)別句子中不同特定方面“appearance”、“body”、“camera”、“standbytime”、“screen”和“price”的情感極性。圖1.2情感分析按層次分類目前,主流的情感分析方法按技術(shù)路線主要可分為3類[4]:1)基于詞典的方法;2)基于機(jī)器學(xué)習(xí)的方法;3)基于深度學(xué)習(xí)的方法:
第2章相關(guān)技術(shù)概述7第2章相關(guān)技術(shù)概述根據(jù)本文的研究?jī)?nèi)容,在本章將就相關(guān)技術(shù)進(jìn)行概述,首先介紹當(dāng)下常用的word2vec技術(shù),然后對(duì)注意力機(jī)制、Apriori算法、外部情感知識(shí)庫(kù)SenticNet進(jìn)行介紹,最后對(duì)實(shí)驗(yàn)涉及的3種深度神經(jīng)網(wǎng)絡(luò)進(jìn)行描述,分別為CNN、LSTM和Transformer。2.1word2vec在自然語(yǔ)言處理任務(wù)中,文本單詞向量化是解決各類問(wèn)題的重要前提。傳統(tǒng)的向量化方法,例如,one-hot表示、詞袋(BagofWords)和N-gram等模型,在當(dāng)下深度學(xué)習(xí)迅速發(fā)展的背景下其存在的弱點(diǎn)和缺陷也越來(lái)越明顯,主要表現(xiàn)在:1)隨著詞典的不斷增大,向量維度也會(huì)不斷增長(zhǎng);2)字典的存儲(chǔ)會(huì)消耗非常大的空間資源;3)在一些模型中會(huì)出現(xiàn)稀疏性問(wèn)題;4)穩(wěn)定性較差。為解決上述問(wèn)題,近年來(lái),word2vec技術(shù)[23]在自然語(yǔ)言處理任務(wù)中得到廣泛應(yīng)用,如圖2.1所示,其利用簡(jiǎn)單化的神經(jīng)網(wǎng)絡(luò)訓(xùn)練詞向量,其中,輸入層的輸入為單詞的One-Hot向量,經(jīng)過(guò)沒(méi)有激活函數(shù)的隱藏層進(jìn)行線性映射,最后通過(guò)softmax函數(shù)得到與輸入維度一致的輸出。目前,CBOW(ContinuousBag-of-Words)和Skip-Gram是word2vec技術(shù)最常用的兩種模型,在本節(jié)中將對(duì)這兩種模型進(jìn)行詳細(xì)介紹。圖2.1word2vec工作流程
【參考文獻(xiàn)】:
期刊論文
[1]面向雙注意力網(wǎng)絡(luò)的特定方面情感分析模型[J]. 孫小婉,王英,王鑫,孫玉東. 計(jì)算機(jī)研究與發(fā)展. 2019(11)
[2]情感分類研究進(jìn)展[J]. 陳龍,管子玉,何金紅,彭進(jìn)業(yè). 計(jì)算機(jī)研究與發(fā)展. 2017(06)
本文編號(hào):3494986
【文章來(lái)源】:吉林大學(xué)吉林省 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:62 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
商品評(píng)論摘要
第1章緒論2根據(jù)已有經(jīng)驗(yàn),當(dāng)人類對(duì)于某事物做出分析和判斷時(shí),不僅僅基于該事物所給出的原有信息,而更多的是結(jié)合已有的知識(shí),如常識(shí)、定理等進(jìn)行思考。目前,現(xiàn)有的情感分析模型中多數(shù)只著眼于文本上下文特征間的關(guān)系挖掘,缺乏對(duì)深層神經(jīng)網(wǎng)絡(luò)外部知識(shí)的有效整合,如何利用已有的知識(shí)指導(dǎo)分類器決策,也成為本文研究的重點(diǎn)之一。1.2國(guó)內(nèi)外研究現(xiàn)狀如圖1.2所示,情感分析任務(wù)從層次上可分為:文檔級(jí)別情感分析、句子級(jí)別情感分析、特定方面級(jí)別情感分析[3]。例如一段評(píng)論文本“①Thisphonewasgiventomywifeasabirthdaygift,andshelikeditverymuch.②Theappearanceofthephoneisverycute,thepinkbodyisverysuitableforgirlstouse,thecameraisveryhighandhasautomaticbeautyfunction.③Thestandbytimeofmobileisaverage,butthisisacommonproblemwithsmartphones.④Thescreenislargeandclear,butthepriceisreallyexpensive.”針對(duì)此文本評(píng)論,文檔級(jí)別情感分析的任務(wù)是預(yù)測(cè)整段文本的情感傾向,句子級(jí)別情感分析的任務(wù)為分別預(yù)測(cè)句子①-⑤每一句的情感極性,而方面級(jí)別的情感分析任務(wù)是識(shí)別句子中不同特定方面“appearance”、“body”、“camera”、“standbytime”、“screen”和“price”的情感極性。圖1.2情感分析按層次分類目前,主流的情感分析方法按技術(shù)路線主要可分為3類[4]:1)基于詞典的方法;2)基于機(jī)器學(xué)習(xí)的方法;3)基于深度學(xué)習(xí)的方法:
第2章相關(guān)技術(shù)概述7第2章相關(guān)技術(shù)概述根據(jù)本文的研究?jī)?nèi)容,在本章將就相關(guān)技術(shù)進(jìn)行概述,首先介紹當(dāng)下常用的word2vec技術(shù),然后對(duì)注意力機(jī)制、Apriori算法、外部情感知識(shí)庫(kù)SenticNet進(jìn)行介紹,最后對(duì)實(shí)驗(yàn)涉及的3種深度神經(jīng)網(wǎng)絡(luò)進(jìn)行描述,分別為CNN、LSTM和Transformer。2.1word2vec在自然語(yǔ)言處理任務(wù)中,文本單詞向量化是解決各類問(wèn)題的重要前提。傳統(tǒng)的向量化方法,例如,one-hot表示、詞袋(BagofWords)和N-gram等模型,在當(dāng)下深度學(xué)習(xí)迅速發(fā)展的背景下其存在的弱點(diǎn)和缺陷也越來(lái)越明顯,主要表現(xiàn)在:1)隨著詞典的不斷增大,向量維度也會(huì)不斷增長(zhǎng);2)字典的存儲(chǔ)會(huì)消耗非常大的空間資源;3)在一些模型中會(huì)出現(xiàn)稀疏性問(wèn)題;4)穩(wěn)定性較差。為解決上述問(wèn)題,近年來(lái),word2vec技術(shù)[23]在自然語(yǔ)言處理任務(wù)中得到廣泛應(yīng)用,如圖2.1所示,其利用簡(jiǎn)單化的神經(jīng)網(wǎng)絡(luò)訓(xùn)練詞向量,其中,輸入層的輸入為單詞的One-Hot向量,經(jīng)過(guò)沒(méi)有激活函數(shù)的隱藏層進(jìn)行線性映射,最后通過(guò)softmax函數(shù)得到與輸入維度一致的輸出。目前,CBOW(ContinuousBag-of-Words)和Skip-Gram是word2vec技術(shù)最常用的兩種模型,在本節(jié)中將對(duì)這兩種模型進(jìn)行詳細(xì)介紹。圖2.1word2vec工作流程
【參考文獻(xiàn)】:
期刊論文
[1]面向雙注意力網(wǎng)絡(luò)的特定方面情感分析模型[J]. 孫小婉,王英,王鑫,孫玉東. 計(jì)算機(jī)研究與發(fā)展. 2019(11)
[2]情感分類研究進(jìn)展[J]. 陳龍,管子玉,何金紅,彭進(jìn)業(yè). 計(jì)算機(jī)研究與發(fā)展. 2017(06)
本文編號(hào):3494986
本文鏈接:http://www.sikaile.net/kejilunwen/shengwushengchang/3494986.html
最近更新
教材專著