面向數(shù)據(jù)特性的文本情感分析方法研究
發(fā)布時(shí)間:2021-01-19 06:06
社交媒體與電商平臺(tái)為數(shù)以?xún)|計(jì)的用戶(hù)提供著便捷的工作、生活和社交娛樂(lè)服務(wù)的同時(shí),也散布著海量的文本數(shù)據(jù),其中,用戶(hù)生成的文本數(shù)據(jù)中蘊(yùn)含著豐富的情感信息。深入分析、挖掘這些數(shù)據(jù)中隱含的情感信息,服務(wù)于社會(huì)管理和商業(yè)運(yùn)營(yíng),正是文本情感分析技術(shù)追求的目標(biāo)。文本情感分析是指綜合運(yùn)用自然語(yǔ)言處理與機(jī)器學(xué)習(xí)等技術(shù)對(duì)文本中的情感信息進(jìn)行抽取、處理、分析和推理的過(guò)程。社會(huì)媒體中的文本數(shù)據(jù)紛繁復(fù)雜,觀察和統(tǒng)計(jì)表明,社會(huì)媒體數(shù)據(jù)具有:類(lèi)別非平衡、標(biāo)簽數(shù)據(jù)缺乏、情感表達(dá)隱晦、情感載體多樣等特性,這些數(shù)據(jù)特性給文本情感分析帶來(lái)了巨大挑戰(zhàn)。針對(duì)上述數(shù)據(jù)特性,本文旨在運(yùn)用數(shù)據(jù)采樣、半監(jiān)督學(xué)習(xí)、嵌入表示、深度學(xué)習(xí)等技術(shù),圍繞文本情感分類(lèi)、反問(wèn)與反諷句識(shí)別、可解釋推薦模型建立等問(wèn)題,開(kāi)展系統(tǒng)深入的研究,發(fā)展文本情感分析理論與方法。主要研究?jī)?nèi)容與創(chuàng)新點(diǎn)如下:(1)局部稠密下采樣與全局再平衡的文本情感分類(lèi)方法非平衡文本情感分類(lèi)。社會(huì)媒體評(píng)論文本數(shù)據(jù)的情感類(lèi)別非平衡性會(huì)導(dǎo)致分類(lèi)模型的偏置問(wèn)題,從而影響模型的分類(lèi)效果。本文提出了一種局部稠密區(qū)域下采樣與全局再平衡的文本情感分類(lèi)方法(LDMRC+SS/RS)。該方法在局部稠密邊界...
【文章來(lái)源】:山西大學(xué)山西省
【文章頁(yè)數(shù)】:137 頁(yè)
【學(xué)位級(jí)別】:博士
【文章目錄】:
中文摘要
英文摘要
第一章 緒論
1.1 研究背景及意義
1.2 國(guó)內(nèi)外研究動(dòng)態(tài)
1.2.1 非平衡文本情感分類(lèi)
1.2.2 半監(jiān)督文本情感分類(lèi)
1.2.3 隱式情感分析
1.2.4 方面項(xiàng)情感分析
1.2.5 可解釋產(chǎn)品推薦
1.3 研究?jī)?nèi)容
1.4 論文組織結(jié)構(gòu)
第二章 基于LDMRC算法與全局再平衡的文本情感分類(lèi)
2.1 問(wèn)題提出
2.2 基本概念
2.3 局部稠密混合區(qū)域下采樣+全局再平衡
2.3.1 LDMRC算法
2.3.2 數(shù)據(jù)的全局再平衡策略
2.4 文本情感分類(lèi)步驟
2.5 實(shí)驗(yàn)設(shè)置
2.5.1 實(shí)驗(yàn)數(shù)據(jù)
2.5.2 采樣方案
2.5.3 評(píng)價(jià)指標(biāo)
2.6 實(shí)驗(yàn)結(jié)果與分析
2.6.1 算法參數(shù)的確定
2.6.2 采樣方案比較
2.7 本章小結(jié)
第三章 文本情感分類(lèi)的協(xié)同混合半監(jiān)督學(xué)習(xí)
3.1 問(wèn)題提出
3.2 一些相關(guān)度量
3.3 學(xué)習(xí)框架
3.3.1 種子選擇算法
3.3.2 訓(xùn)練數(shù)據(jù)集更新
3.3.3 協(xié)同訓(xùn)練策略
3.3.4 集成分類(lèi)器
3.4 文本情感分類(lèi)步驟
3.5 實(shí)驗(yàn)設(shè)置
3.5.1 實(shí)驗(yàn)數(shù)據(jù)
3.5.2 評(píng)價(jià)指標(biāo)
3.5.3 訓(xùn)練模式設(shè)計(jì)
3.6 實(shí)驗(yàn)結(jié)果與分析
3.6.1 種子選擇方法
3.6.2 英文數(shù)據(jù)集上的比較實(shí)驗(yàn)
3.6.3 中文數(shù)據(jù)集上的比較實(shí)驗(yàn)
3.6.4 CASCT方法的穩(wěn)定性
3.7 本章小結(jié)
第四章 基于語(yǔ)言特征自動(dòng)獲取的反問(wèn)句識(shí)別
4.1 問(wèn)題提出
4.2 反問(wèn)句識(shí)別模型
4.2.1 反問(wèn)句特征自動(dòng)獲取模型
4.2.2 基于層疊注意力機(jī)制的反問(wèn)句識(shí)別模型
4.3 實(shí)驗(yàn)設(shè)置
4.3.1 數(shù)據(jù)集及評(píng)價(jià)指標(biāo)
4.3.2 參數(shù)設(shè)置
4.4 實(shí)驗(yàn)結(jié)果與分析
4.4.1 特征性能的比較實(shí)驗(yàn)
4.4.2 特征數(shù)對(duì)識(shí)別效果的影響
4.4.3 綜合比較實(shí)驗(yàn)
4.4.4 錯(cuò)誤分析
4.5 本章小結(jié)
第五章 基于多信息融合的反諷句識(shí)別
5.1 問(wèn)題提出
5.2 基于BERT的句子表示
5.3 融入顯式特征信息的句子表示
5.4 情感信息獲取
5.4.1 基于BERT的句子情感分類(lèi)
5.4.2 句子情感差異表示
5.5 多信息融合的反諷句識(shí)別框架
5.6 實(shí)驗(yàn)設(shè)置
5.6.1 實(shí)驗(yàn)數(shù)據(jù)及評(píng)價(jià)指標(biāo)
5.6.2 方法的比較方案
5.7 實(shí)驗(yàn)結(jié)果與分析
5.7.1 特征的有效性對(duì)比實(shí)驗(yàn)
5.7.2 與其他方法的對(duì)比實(shí)驗(yàn)
5.8 本章小結(jié)
第六章 基于方面項(xiàng)情感分析的可解釋推薦
6.1 問(wèn)題提出
6.2 方面項(xiàng)抽取
6.2.1 方面項(xiàng)情感判別
6.2.2 方面項(xiàng)確定
6.3 基于圖神經(jīng)網(wǎng)絡(luò)的推薦模型
6.3.1 用戶(hù)-產(chǎn)品圖建模
6.3.2 基于注意力機(jī)制的圖更新
6.3.3 模型輸出與訓(xùn)練
6.4 產(chǎn)品評(píng)級(jí)策略
6.5 實(shí)驗(yàn)設(shè)置
6.6 實(shí)驗(yàn)結(jié)果與分析
6.6.1 產(chǎn)品評(píng)級(jí)融合參數(shù)的選取
6.6.2 產(chǎn)品評(píng)級(jí)策略對(duì)比實(shí)驗(yàn)
6.6.3 與已有方法的比較
6.6.4 推薦的可解釋性
6.7 本章小結(jié)
第七章 總結(jié)及展望
7.1 主要結(jié)論
7.2 未來(lái)工作
參考文獻(xiàn)
攻讀博士學(xué)位期間取得的研究成果
致謝
個(gè)人簡(jiǎn)況及聯(lián)系方式
本文編號(hào):2986474
【文章來(lái)源】:山西大學(xué)山西省
【文章頁(yè)數(shù)】:137 頁(yè)
【學(xué)位級(jí)別】:博士
【文章目錄】:
中文摘要
英文摘要
第一章 緒論
1.1 研究背景及意義
1.2 國(guó)內(nèi)外研究動(dòng)態(tài)
1.2.1 非平衡文本情感分類(lèi)
1.2.2 半監(jiān)督文本情感分類(lèi)
1.2.3 隱式情感分析
1.2.4 方面項(xiàng)情感分析
1.2.5 可解釋產(chǎn)品推薦
1.3 研究?jī)?nèi)容
1.4 論文組織結(jié)構(gòu)
第二章 基于LDMRC算法與全局再平衡的文本情感分類(lèi)
2.1 問(wèn)題提出
2.2 基本概念
2.3 局部稠密混合區(qū)域下采樣+全局再平衡
2.3.1 LDMRC算法
2.3.2 數(shù)據(jù)的全局再平衡策略
2.4 文本情感分類(lèi)步驟
2.5 實(shí)驗(yàn)設(shè)置
2.5.1 實(shí)驗(yàn)數(shù)據(jù)
2.5.2 采樣方案
2.5.3 評(píng)價(jià)指標(biāo)
2.6 實(shí)驗(yàn)結(jié)果與分析
2.6.1 算法參數(shù)的確定
2.6.2 采樣方案比較
2.7 本章小結(jié)
第三章 文本情感分類(lèi)的協(xié)同混合半監(jiān)督學(xué)習(xí)
3.1 問(wèn)題提出
3.2 一些相關(guān)度量
3.3 學(xué)習(xí)框架
3.3.1 種子選擇算法
3.3.2 訓(xùn)練數(shù)據(jù)集更新
3.3.3 協(xié)同訓(xùn)練策略
3.3.4 集成分類(lèi)器
3.4 文本情感分類(lèi)步驟
3.5 實(shí)驗(yàn)設(shè)置
3.5.1 實(shí)驗(yàn)數(shù)據(jù)
3.5.2 評(píng)價(jià)指標(biāo)
3.5.3 訓(xùn)練模式設(shè)計(jì)
3.6 實(shí)驗(yàn)結(jié)果與分析
3.6.1 種子選擇方法
3.6.2 英文數(shù)據(jù)集上的比較實(shí)驗(yàn)
3.6.3 中文數(shù)據(jù)集上的比較實(shí)驗(yàn)
3.6.4 CASCT方法的穩(wěn)定性
3.7 本章小結(jié)
第四章 基于語(yǔ)言特征自動(dòng)獲取的反問(wèn)句識(shí)別
4.1 問(wèn)題提出
4.2 反問(wèn)句識(shí)別模型
4.2.1 反問(wèn)句特征自動(dòng)獲取模型
4.2.2 基于層疊注意力機(jī)制的反問(wèn)句識(shí)別模型
4.3 實(shí)驗(yàn)設(shè)置
4.3.1 數(shù)據(jù)集及評(píng)價(jià)指標(biāo)
4.3.2 參數(shù)設(shè)置
4.4 實(shí)驗(yàn)結(jié)果與分析
4.4.1 特征性能的比較實(shí)驗(yàn)
4.4.2 特征數(shù)對(duì)識(shí)別效果的影響
4.4.3 綜合比較實(shí)驗(yàn)
4.4.4 錯(cuò)誤分析
4.5 本章小結(jié)
第五章 基于多信息融合的反諷句識(shí)別
5.1 問(wèn)題提出
5.2 基于BERT的句子表示
5.3 融入顯式特征信息的句子表示
5.4 情感信息獲取
5.4.1 基于BERT的句子情感分類(lèi)
5.4.2 句子情感差異表示
5.5 多信息融合的反諷句識(shí)別框架
5.6 實(shí)驗(yàn)設(shè)置
5.6.1 實(shí)驗(yàn)數(shù)據(jù)及評(píng)價(jià)指標(biāo)
5.6.2 方法的比較方案
5.7 實(shí)驗(yàn)結(jié)果與分析
5.7.1 特征的有效性對(duì)比實(shí)驗(yàn)
5.7.2 與其他方法的對(duì)比實(shí)驗(yàn)
5.8 本章小結(jié)
第六章 基于方面項(xiàng)情感分析的可解釋推薦
6.1 問(wèn)題提出
6.2 方面項(xiàng)抽取
6.2.1 方面項(xiàng)情感判別
6.2.2 方面項(xiàng)確定
6.3 基于圖神經(jīng)網(wǎng)絡(luò)的推薦模型
6.3.1 用戶(hù)-產(chǎn)品圖建模
6.3.2 基于注意力機(jī)制的圖更新
6.3.3 模型輸出與訓(xùn)練
6.4 產(chǎn)品評(píng)級(jí)策略
6.5 實(shí)驗(yàn)設(shè)置
6.6 實(shí)驗(yàn)結(jié)果與分析
6.6.1 產(chǎn)品評(píng)級(jí)融合參數(shù)的選取
6.6.2 產(chǎn)品評(píng)級(jí)策略對(duì)比實(shí)驗(yàn)
6.6.3 與已有方法的比較
6.6.4 推薦的可解釋性
6.7 本章小結(jié)
第七章 總結(jié)及展望
7.1 主要結(jié)論
7.2 未來(lái)工作
參考文獻(xiàn)
攻讀博士學(xué)位期間取得的研究成果
致謝
個(gè)人簡(jiǎn)況及聯(lián)系方式
本文編號(hào):2986474
本文鏈接:http://www.sikaile.net/shoufeilunwen/xxkjbs/2986474.html
最近更新
教材專(zhuān)著