結(jié)合原因發(fā)現(xiàn)的文本情緒分類研究
發(fā)布時間:2021-07-08 21:10
社交媒體正在成為用戶觀點(diǎn)交流和情感表達(dá)的主要平臺。用戶在表達(dá)自身情感的同時,其相互作用也在不斷影響現(xiàn)實(shí)社會。因此,基于自然語言處理技術(shù)的情緒分析、意圖識別等研究的重要性不斷提高。現(xiàn)有的文本情緒計算研究集中在利用文本中與情緒表達(dá)相關(guān)的表層特征對文本中包含的情緒進(jìn)行識別和分類,但忽略了發(fā)掘情緒產(chǎn)生的原因以及對其的利用,因而缺乏對情緒相關(guān)信息的完整理解和應(yīng)用,F(xiàn)有文本情緒原因發(fā)現(xiàn)方法主要分為基于規(guī)則、基于機(jī)器學(xué)習(xí)以及基于深度學(xué)習(xí)的方法。這三類方法分別存在人工規(guī)則構(gòu)建低效、統(tǒng)計特征的設(shè)計和篩選主觀性過強(qiáng),以及模型可解釋性與可控性較弱等問題。為此,本文首先研究有效的情緒原因發(fā)現(xiàn)方法,進(jìn)而研究基于多任務(wù)學(xué)習(xí)的情緒原因發(fā)現(xiàn)與情緒分類方法,目的是充分利用情緒原因和情緒表達(dá)之間的交互關(guān)系,有效提高文本情緒分類性能。本文首先研究結(jié)合知識正則化和層次注意力網(wǎng)絡(luò)的情緒原因發(fā)現(xiàn)方法。通過應(yīng)用層次結(jié)構(gòu)和注意力機(jī)制建模文本的篇章信息、子句與情緒表達(dá)之間的關(guān)系,以更好地發(fā)現(xiàn)情緒原因。同時,設(shè)計基于情感詞和基于位置的正則化約束項(xiàng),借助先驗(yàn)知識對上述模型參數(shù)進(jìn)行約束。在EMNLP2016中文情緒原因發(fā)現(xiàn)數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果...
【文章來源】:哈爾濱工業(yè)大學(xué)黑龍江省 211工程院校 985工程院校
【文章頁數(shù)】:69 頁
【學(xué)位級別】:碩士
【部分圖文】:
本文研究內(nèi)容框架圖
哈爾濱工業(yè)大學(xué)工程碩士學(xué)位論文-10-本。然后利用NB、SVM、ME作為分類模型,準(zhǔn)確率達(dá)到80%以上[37]。張志琳等人將目光聚焦于中文微博文本,結(jié)合情緒詞典匹配與機(jī)器學(xué)習(xí)方法進(jìn)行文本情緒分類。與此同時,他們也考慮了主題詞是否出現(xiàn)、主題詞的內(nèi)容以及情緒詞的頻度等特征,接著將對詞典傾向性打分的結(jié)果一起作為特征,通過SVM獲得最后的分類標(biāo)簽。實(shí)驗(yàn)結(jié)果顯示,該特征提取方式能夠更好地反映微博中情緒的傾向,提升了微博情緒分類的效果[38]。2.2.3基于深度學(xué)習(xí)的文本情緒分類方法深度學(xué)習(xí)方法表通過多層非線性的神經(jīng)元對輸入文本進(jìn)行特征提取和變換,表現(xiàn)出了強(qiáng)大的特征表示能力,因此受到廣泛關(guān)注。Socher等人采用深度學(xué)習(xí)的思想來解決文本情緒分析領(lǐng)域的問題。利用WordNet和FreeBase,并借助遞歸神經(jīng)張量網(wǎng)絡(luò)來學(xué)習(xí)文本中的語法樹以及樹節(jié)點(diǎn)上的情緒類別,來判斷樹中根節(jié)點(diǎn)的情緒類別,取得了不錯的成果[39]。Tang等人提出一種結(jié)構(gòu)化的神經(jīng)網(wǎng)絡(luò)對篇章級文本進(jìn)行情緒分類。作者在詞向量的基礎(chǔ)上,利用CNN或長短時記憶模型[40](LongShort-TermMemory,LSTM)學(xué)習(xí)句子的向量表示,然后利用另外的雙向門控網(wǎng)絡(luò)(GatedNeuralNetwork,GNN)分別從正向和逆向?qū)渥拥恼Z義及其在篇章中的關(guān)系進(jìn)行編碼,最后將學(xué)習(xí)到的整個篇章向量表示送入softmax,進(jìn)而實(shí)現(xiàn)對篇章的情緒分類,其模型框架如圖2-2所示[41]。圖2-2基于結(jié)構(gòu)化的神經(jīng)網(wǎng)絡(luò)篇章級情感分類模型[41]
哈爾濱工業(yè)大學(xué)工程碩士學(xué)位論文-11-Fan等人提出一種基于卷積記憶網(wǎng)絡(luò)的方面級情感分類模型。作者首先利用雙向門控單元[42](GatedRecurrentUnit,GRU)Bi-GRU來捕獲文本的全局語義信息。他們認(rèn)為文本中每個詞的重要程度不僅取決于當(dāng)前詞,還與上下文密切相關(guān)。因此,作者利用卷積記憶機(jī)制綜合考慮每個位置詞及其前后詞以計算注意力權(quán)重,然后對各文本片段加權(quán)求和得到最終的分類結(jié)果。其模型如圖2-3所示[8]。圖2-3基于特定目標(biāo)的卷積記憶網(wǎng)絡(luò)情感分類模型[8]2.3文本情緒原因發(fā)現(xiàn)相關(guān)技術(shù)文本情緒原因發(fā)現(xiàn)任務(wù)是在文本情緒分類基礎(chǔ)上的深入,旨在研究發(fā)現(xiàn)觸發(fā)情緒產(chǎn)生的事件或因素的方法。文本情緒原因發(fā)現(xiàn)任務(wù)上的相關(guān)研究推動了文本情緒分析領(lǐng)域的發(fā)展,同時也為情緒分類等基礎(chǔ)研究拓寬了視野,F(xiàn)有的文本情緒原因發(fā)現(xiàn)方法主要包括基于規(guī)則、機(jī)器學(xué)習(xí)及深度學(xué)習(xí)的方法。2.3.1基于規(guī)則與常識庫的情緒原因發(fā)現(xiàn)方法基于規(guī)則的情緒原因發(fā)現(xiàn)方法主要通過分析文本中的語言結(jié)構(gòu),并針對所標(biāo)注的語料庫,利用與表達(dá)情緒原因相關(guān)的指示性詞語、句法、語法等線索手工構(gòu)建情緒原因發(fā)現(xiàn)規(guī)則庫,從而利用規(guī)則來對情緒原因進(jìn)行識別。
【參考文獻(xiàn)】:
期刊論文
[1]基于E-CNN的情緒原因識別方法[J]. 慕永利,李旸,王素格. 中文信息學(xué)報. 2018(02)
[2]基于多注意力卷積神經(jīng)網(wǎng)絡(luò)的特定目標(biāo)情感分析[J]. 梁斌,劉全,徐進(jìn),周倩,章鵬. 計算機(jī)研究與發(fā)展. 2017(08)
[3]結(jié)合卷積神經(jīng)網(wǎng)絡(luò)和詞語情感序列特征的中文情感分析[J]. 陳釗,徐睿峰,桂林,陸勤. 中文信息學(xué)報. 2015(06)
[4]基于多樣化特征的中文微博情感分類方法研究[J]. 張志琳,宗成慶. 中文信息學(xué)報. 2015(04)
[5]多策略中文微博細(xì)粒度情緒分析研究[J]. 歐陽純萍,陽小華,雷龍艷,徐強(qiáng),余穎,劉志明. 北京大學(xué)學(xué)報(自然科學(xué)版). 2014(01)
[6]基于情緒知識的中文微博情感分類方法[J]. 龐磊,李壽山,周國棟. 計算機(jī)工程. 2012(13)
碩士論文
[1]基于文本的情緒自動歸因方法研究[D]. 袁麗.哈爾濱工業(yè)大學(xué) 2014
本文編號:3272341
【文章來源】:哈爾濱工業(yè)大學(xué)黑龍江省 211工程院校 985工程院校
【文章頁數(shù)】:69 頁
【學(xué)位級別】:碩士
【部分圖文】:
本文研究內(nèi)容框架圖
哈爾濱工業(yè)大學(xué)工程碩士學(xué)位論文-10-本。然后利用NB、SVM、ME作為分類模型,準(zhǔn)確率達(dá)到80%以上[37]。張志琳等人將目光聚焦于中文微博文本,結(jié)合情緒詞典匹配與機(jī)器學(xué)習(xí)方法進(jìn)行文本情緒分類。與此同時,他們也考慮了主題詞是否出現(xiàn)、主題詞的內(nèi)容以及情緒詞的頻度等特征,接著將對詞典傾向性打分的結(jié)果一起作為特征,通過SVM獲得最后的分類標(biāo)簽。實(shí)驗(yàn)結(jié)果顯示,該特征提取方式能夠更好地反映微博中情緒的傾向,提升了微博情緒分類的效果[38]。2.2.3基于深度學(xué)習(xí)的文本情緒分類方法深度學(xué)習(xí)方法表通過多層非線性的神經(jīng)元對輸入文本進(jìn)行特征提取和變換,表現(xiàn)出了強(qiáng)大的特征表示能力,因此受到廣泛關(guān)注。Socher等人采用深度學(xué)習(xí)的思想來解決文本情緒分析領(lǐng)域的問題。利用WordNet和FreeBase,并借助遞歸神經(jīng)張量網(wǎng)絡(luò)來學(xué)習(xí)文本中的語法樹以及樹節(jié)點(diǎn)上的情緒類別,來判斷樹中根節(jié)點(diǎn)的情緒類別,取得了不錯的成果[39]。Tang等人提出一種結(jié)構(gòu)化的神經(jīng)網(wǎng)絡(luò)對篇章級文本進(jìn)行情緒分類。作者在詞向量的基礎(chǔ)上,利用CNN或長短時記憶模型[40](LongShort-TermMemory,LSTM)學(xué)習(xí)句子的向量表示,然后利用另外的雙向門控網(wǎng)絡(luò)(GatedNeuralNetwork,GNN)分別從正向和逆向?qū)渥拥恼Z義及其在篇章中的關(guān)系進(jìn)行編碼,最后將學(xué)習(xí)到的整個篇章向量表示送入softmax,進(jìn)而實(shí)現(xiàn)對篇章的情緒分類,其模型框架如圖2-2所示[41]。圖2-2基于結(jié)構(gòu)化的神經(jīng)網(wǎng)絡(luò)篇章級情感分類模型[41]
哈爾濱工業(yè)大學(xué)工程碩士學(xué)位論文-11-Fan等人提出一種基于卷積記憶網(wǎng)絡(luò)的方面級情感分類模型。作者首先利用雙向門控單元[42](GatedRecurrentUnit,GRU)Bi-GRU來捕獲文本的全局語義信息。他們認(rèn)為文本中每個詞的重要程度不僅取決于當(dāng)前詞,還與上下文密切相關(guān)。因此,作者利用卷積記憶機(jī)制綜合考慮每個位置詞及其前后詞以計算注意力權(quán)重,然后對各文本片段加權(quán)求和得到最終的分類結(jié)果。其模型如圖2-3所示[8]。圖2-3基于特定目標(biāo)的卷積記憶網(wǎng)絡(luò)情感分類模型[8]2.3文本情緒原因發(fā)現(xiàn)相關(guān)技術(shù)文本情緒原因發(fā)現(xiàn)任務(wù)是在文本情緒分類基礎(chǔ)上的深入,旨在研究發(fā)現(xiàn)觸發(fā)情緒產(chǎn)生的事件或因素的方法。文本情緒原因發(fā)現(xiàn)任務(wù)上的相關(guān)研究推動了文本情緒分析領(lǐng)域的發(fā)展,同時也為情緒分類等基礎(chǔ)研究拓寬了視野,F(xiàn)有的文本情緒原因發(fā)現(xiàn)方法主要包括基于規(guī)則、機(jī)器學(xué)習(xí)及深度學(xué)習(xí)的方法。2.3.1基于規(guī)則與常識庫的情緒原因發(fā)現(xiàn)方法基于規(guī)則的情緒原因發(fā)現(xiàn)方法主要通過分析文本中的語言結(jié)構(gòu),并針對所標(biāo)注的語料庫,利用與表達(dá)情緒原因相關(guān)的指示性詞語、句法、語法等線索手工構(gòu)建情緒原因發(fā)現(xiàn)規(guī)則庫,從而利用規(guī)則來對情緒原因進(jìn)行識別。
【參考文獻(xiàn)】:
期刊論文
[1]基于E-CNN的情緒原因識別方法[J]. 慕永利,李旸,王素格. 中文信息學(xué)報. 2018(02)
[2]基于多注意力卷積神經(jīng)網(wǎng)絡(luò)的特定目標(biāo)情感分析[J]. 梁斌,劉全,徐進(jìn),周倩,章鵬. 計算機(jī)研究與發(fā)展. 2017(08)
[3]結(jié)合卷積神經(jīng)網(wǎng)絡(luò)和詞語情感序列特征的中文情感分析[J]. 陳釗,徐睿峰,桂林,陸勤. 中文信息學(xué)報. 2015(06)
[4]基于多樣化特征的中文微博情感分類方法研究[J]. 張志琳,宗成慶. 中文信息學(xué)報. 2015(04)
[5]多策略中文微博細(xì)粒度情緒分析研究[J]. 歐陽純萍,陽小華,雷龍艷,徐強(qiáng),余穎,劉志明. 北京大學(xué)學(xué)報(自然科學(xué)版). 2014(01)
[6]基于情緒知識的中文微博情感分類方法[J]. 龐磊,李壽山,周國棟. 計算機(jī)工程. 2012(13)
碩士論文
[1]基于文本的情緒自動歸因方法研究[D]. 袁麗.哈爾濱工業(yè)大學(xué) 2014
本文編號:3272341
本文鏈接:http://www.sikaile.net/kejilunwen/shengwushengchang/3272341.html
最近更新
教材專著