基于LSTM的文檔級(jí)別情感分析方法研究
發(fā)布時(shí)間:2023-06-03 01:30
隨著以人為中心的Web2.0時(shí)代的蓬勃發(fā)展,互聯(lián)網(wǎng)中產(chǎn)生了大量關(guān)于人物,事件,產(chǎn)品等包含用戶情感的有價(jià)值的評(píng)論信息,文本情感分析技術(shù)能有效挖掘其價(jià)值,因此越來(lái)越受到關(guān)注。對(duì)于短文本的詞語(yǔ)級(jí)別以及句子級(jí)別的情感分析已經(jīng)開展了多年研究并取得較好成績(jī),但是對(duì)于文檔級(jí)別情感分析,尤其是長(zhǎng)文本的建模仍然是一個(gè)巨大的難題,雖然LSTM神經(jīng)網(wǎng)絡(luò)在長(zhǎng)文本建模上取得了巨大的成功,但LSTM依然會(huì)存在對(duì)長(zhǎng)序列學(xué)習(xí)不完整的問(wèn)題,因此亟待研究新的篇章級(jí)情感分析方法。針對(duì)以上問(wèn)題,本文設(shè)計(jì)并實(shí)現(xiàn)了一個(gè)基于的LSTM的分層神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)并且嘗試提出了多種改進(jìn)的方法。首先,本文提出了一種雙層LSTM的模型,第一層對(duì)文檔中每個(gè)句子進(jìn)行詞到句子的建模,第二層是對(duì)文檔中的所有句子到文檔進(jìn)行建模。其次,為了提高模型的訓(xùn)練效果,本文提出了一種基于情感詞典的方法,來(lái)過(guò)濾掉一些客觀性句子,減少模型訓(xùn)練的噪聲。最后,為了考慮句子中詞語(yǔ)間的空間結(jié)構(gòu),本文用Tree-LSTM代替?zhèn)鹘y(tǒng)的序列LSTM對(duì)詞語(yǔ)到句子進(jìn)行建模,來(lái)得到更好的句子向量。實(shí)驗(yàn)結(jié)果表明基于的LSTM的分層神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)及其改進(jìn)的方法在三個(gè)公開的大規(guī)模的文檔級(jí)別數(shù)據(jù)集上都具...
【文章頁(yè)數(shù)】:57 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
abstract
第1章 緒論
1.1 研究背景和意義
1.2 研究?jī)?nèi)容和主要貢獻(xiàn)
1.3 論文組織結(jié)構(gòu)
第2章 相關(guān)研究綜述
2.1 文檔級(jí)情感分析方法綜述
2.1.1 情感分析方法的發(fā)展
2.1.2 文檔級(jí)情感分析
2.2 循環(huán)神經(jīng)網(wǎng)絡(luò)
2.2.1 LSTM(長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò))
2.2.2 Tree-LSTM(樹形長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò))
第3章 基于分層的LSTM的文檔級(jí)情感分析
3.1 整體框架
3.2 數(shù)據(jù)預(yù)處理
3.2.1 情感詞典
3.2.2 基于情感詞典的句子級(jí)別情感分析方法
3.3 本章小結(jié)
第4章 基于分層的Tree-LSTM的文檔級(jí)情感分析方法研究
4.1 整體框架
4.2 詞到句子的建模
4.2.1 句法語(yǔ)義樹
4.3 句子到文檔的建模
4.3.1 卷積神經(jīng)網(wǎng)絡(luò)(CNN)
4.3.2 注意力模型(attention)
4.3.3 Bi-GRU與 attention結(jié)合
4.3.4 CNN與 attention結(jié)合
4.4 stacking集成
4.5 本章總結(jié)
第5章 實(shí)驗(yàn)結(jié)果及分析
5.1 基于分層LSTM的相關(guān)實(shí)驗(yàn)
5.1.1 實(shí)驗(yàn)數(shù)據(jù)集和超參數(shù)的設(shè)置
5.1.2 Baseline模型
5.1.3 實(shí)驗(yàn)結(jié)果和分析
5.1.4 詞向量和最大句子數(shù)量Maxn的選擇
5.2 基于分層的Tree-LSTM的相關(guān)實(shí)驗(yàn)
5.2.1 實(shí)驗(yàn)結(jié)果
5.2.2 CNN與 LSTM的實(shí)驗(yàn)對(duì)比分析
5.2.3 集成學(xué)習(xí)實(shí)驗(yàn)結(jié)果以及分析
5.2.4 實(shí)驗(yàn)結(jié)論
第6章 總結(jié)和展望
參考文獻(xiàn)
發(fā)表論文和參加科研情況說(shuō)明
致謝
本文編號(hào):3828405
【文章頁(yè)數(shù)】:57 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
abstract
第1章 緒論
1.1 研究背景和意義
1.2 研究?jī)?nèi)容和主要貢獻(xiàn)
1.3 論文組織結(jié)構(gòu)
第2章 相關(guān)研究綜述
2.1 文檔級(jí)情感分析方法綜述
2.1.1 情感分析方法的發(fā)展
2.1.2 文檔級(jí)情感分析
2.2 循環(huán)神經(jīng)網(wǎng)絡(luò)
2.2.1 LSTM(長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò))
2.2.2 Tree-LSTM(樹形長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò))
第3章 基于分層的LSTM的文檔級(jí)情感分析
3.1 整體框架
3.2 數(shù)據(jù)預(yù)處理
3.2.1 情感詞典
3.2.2 基于情感詞典的句子級(jí)別情感分析方法
3.3 本章小結(jié)
第4章 基于分層的Tree-LSTM的文檔級(jí)情感分析方法研究
4.1 整體框架
4.2 詞到句子的建模
4.2.1 句法語(yǔ)義樹
4.3 句子到文檔的建模
4.3.1 卷積神經(jīng)網(wǎng)絡(luò)(CNN)
4.3.2 注意力模型(attention)
4.3.3 Bi-GRU與 attention結(jié)合
4.3.4 CNN與 attention結(jié)合
4.4 stacking集成
4.5 本章總結(jié)
第5章 實(shí)驗(yàn)結(jié)果及分析
5.1 基于分層LSTM的相關(guān)實(shí)驗(yàn)
5.1.1 實(shí)驗(yàn)數(shù)據(jù)集和超參數(shù)的設(shè)置
5.1.2 Baseline模型
5.1.3 實(shí)驗(yàn)結(jié)果和分析
5.1.4 詞向量和最大句子數(shù)量Maxn的選擇
5.2 基于分層的Tree-LSTM的相關(guān)實(shí)驗(yàn)
5.2.1 實(shí)驗(yàn)結(jié)果
5.2.2 CNN與 LSTM的實(shí)驗(yàn)對(duì)比分析
5.2.3 集成學(xué)習(xí)實(shí)驗(yàn)結(jié)果以及分析
5.2.4 實(shí)驗(yàn)結(jié)論
第6章 總結(jié)和展望
參考文獻(xiàn)
發(fā)表論文和參加科研情況說(shuō)明
致謝
本文編號(hào):3828405
本文鏈接:http://www.sikaile.net/kejilunwen/zidonghuakongzhilunwen/3828405.html
最近更新
教材專著