漢藏雙語情感詞典構(gòu)建及情感計算研究
發(fā)布時間:2022-12-11 12:34
隨著網(wǎng)絡(luò)的快速發(fā)展,越來越多的少數(shù)民族的人們通過微博來發(fā)表觀點、表達情感、交流心得。藏文微博文本的研究不僅可以了解少數(shù)民族的日常生活和文化,還可以獲得少數(shù)民族用戶對于某類服務(wù)、產(chǎn)品的態(tài)度,也將有利于少數(shù)民族地區(qū)社會服務(wù)質(zhì)量的提升、合理政策的頒布。本文以漢藏雙語情感詞典構(gòu)建為基礎(chǔ),研究了藏文微博文本的情感計算模型。研究內(nèi)容主要包括:(1)總結(jié)分析了當(dāng)前情感詞典構(gòu)建和國外、中文、藏文文本情感計算的技術(shù)和最新的研究成果。(2)利用已有的中文情感詞典資源自動構(gòu)建漢藏雙語情感詞典,不但解決了藏文詞典構(gòu)建費時費力的問題,還保證了藏文情感詞典的正確性和足夠多的詞匯;跇(gòu)建的情感詞典對藏文微博文本進行情感計算,實驗結(jié)果,準(zhǔn)確率達到76.6%,表明情感詞典達到了實用性效果。(3)針對原始數(shù)據(jù)集較小的問題,研究構(gòu)建了藏文同反義詞詞典,并通過同反義詞匯替換的方式,實現(xiàn)了數(shù)據(jù)的自動擴充。(4)根據(jù)卷積神經(jīng)網(wǎng)絡(luò)和長短時記憶網(wǎng)絡(luò)的特點,提出了CLSTM混合深度學(xué)習(xí)模型,取得了較好的情感計算效果,準(zhǔn)確率達到了85.1%。研究了模型參數(shù)優(yōu)化等問題,使模型達到最優(yōu)效果。
【文章頁數(shù)】:53 頁
【學(xué)位級別】:碩士
【文章目錄】:
中文摘要
Abstract
第一章 緒論
1.1 研究背景及意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 情感詞典的構(gòu)建國內(nèi)外研究現(xiàn)狀
1.2.2 情感計算國內(nèi)外研究現(xiàn)狀
1.2.3 情感詞典資源現(xiàn)狀
1.3 課題的主要研究內(nèi)容及創(chuàng)新點
1.3.1 選題的主要研究內(nèi)容
1.3.2 課題的創(chuàng)新點
1.4 本文的結(jié)構(gòu)安排
第二章 文本情感計算相關(guān)介紹
2.1 概述
2.2 文本預(yù)處理
2.2.1 分詞技術(shù)
2.2.2 去停用詞
2.3 基于情感詞典的情感計算原理
2.4 基于機器學(xué)習(xí)情感計算流程
2.5 Word2Vec簡介
2.5.1 Word2Vec神經(jīng)網(wǎng)絡(luò)架構(gòu)
2.5.2 Skip-Gram(Continuous Skip-Gram Model)模型
2.6 基于深度學(xué)習(xí)情感計算原理
2.6.1 卷積神經(jīng)網(wǎng)絡(luò)
2.6.2 長短時記憶神經(jīng)網(wǎng)絡(luò)
2.7 本章小結(jié)
第三章 漢藏雙語情感詞典構(gòu)建
3.1 概述
3.2 《漢藏大辭典》數(shù)據(jù)整理
3.3 中文情感詞典資源整理
3.4 漢藏雙語情感詞典構(gòu)建
3.4.1 漢藏雙語情感詞典構(gòu)建
3.4.2 構(gòu)建結(jié)果分析
3.5 本章小結(jié)
第四章 藏文微博文本情感計算
4.1 概述
4.2 數(shù)據(jù)擴充
4.2.1 基于同反義詞詞典的數(shù)據(jù)擴充
4.2.2 原始藏文微博文本語料
4.3 基于情感詞典的藏文微博情感計算
4.3.1 未出現(xiàn)轉(zhuǎn)折詞
4.3.2 出現(xiàn)轉(zhuǎn)折詞
4.3.3 情感傾向計算
4.4 CLSTM混合深度學(xué)習(xí)模型的藏文微博情感計算
4.4.1 網(wǎng)絡(luò)模型
4.4.2 模型參數(shù)優(yōu)化
4.5 本章小結(jié)
第五章 實驗及結(jié)果分析
5.1 概述
5.2 環(huán)境介紹
5.2.1 硬件環(huán)境
5.2.2 軟件環(huán)境
5.3 基于情感詞典情感計算及結(jié)果分析
5.4 基于CLSTM模型的結(jié)果與分析
5.4.1 實驗數(shù)據(jù)
5.4.2 結(jié)果與分析
5.5 本章小結(jié)
第六章 總結(jié)與展望
6.1 總結(jié)
6.2 展望
參考文獻
作者在讀期間科研成果簡介
致謝
【參考文獻】:
期刊論文
[1]基于深度學(xué)習(xí)的領(lǐng)域情感詞典自動構(gòu)建——以金融領(lǐng)域為例[J]. 胡家珩,岑詠華,吳承堯. 數(shù)據(jù)分析與知識發(fā)現(xiàn). 2018(10)
[2]基于深度循環(huán)神經(jīng)網(wǎng)絡(luò)的跨領(lǐng)域文本情感分析[J]. 余傳明. 圖書情報工作. 2018(11)
[3]基于情感詞典的藏語文本句子情感分類[J]. 閆曉東,黃濤. 中文信息學(xué)報. 2018(02)
[4]基于詞典與機器學(xué)習(xí)的藏文微博情感分析研究[J]. 楊志. 軟件. 2017(11)
[5]基于詞向量的藏文情感詞典的構(gòu)建方法研究[J]. 巴桑卓瑪,李苗苗,高定國. 電子技術(shù)與軟件工程. 2017(20)
[6]基于多特征的藏文微博情感傾向性分析[J]. 江濤,袁斌,于洪志,加羊吉. 中文信息學(xué)報. 2017(03)
[7]基于詞向量的跨領(lǐng)域中文情感詞典構(gòu)建方法[J]. 馮超,梁循,李亞平,周小平,李曉菲. 數(shù)據(jù)采集與處理. 2017(03)
[8]基于Word2Vec的情感詞典自動構(gòu)建與優(yōu)化[J]. 楊小平,張中夏,王良,張永俊,馬奇鳳,吳佳楠,張悅. 計算機科學(xué). 2017(01)
[9]深度學(xué)習(xí)算法在藏文情感分析中的應(yīng)用研究[J]. 普次仁,侯佳林,劉月,翟東海. 計算機科學(xué)與探索. 2017(07)
[10]基于關(guān)聯(lián)規(guī)則挖掘和極性分析的商品評論情感詞典構(gòu)建[J]. 鐘敏娟,萬常選,劉德喜. 情報學(xué)報. 2016 (05)
碩士論文
[1]基于深度學(xué)習(xí)的微博文本情感分析研究[D]. 宋夢姣.南京大學(xué) 2018
[2]面向社交網(wǎng)絡(luò)特定話題的情感詞典自構(gòu)建方法研究[D]. 張歡.上海師范大學(xué) 2018
[3]基于擴展詞典和規(guī)則的中文微博情感分析[D]. 李繼東.北京交通大學(xué) 2018
[4]一種基于詞典的文本情感分析算法的實現(xiàn)[D]. 姚文杰.陜西師范大學(xué) 2017
[5]藏文文本情感分析方法研究[D]. 李苗苗.西藏大學(xué) 2017
[6]藏文微博情感分類研究與實現(xiàn)[D]. 袁斌.西北民族大學(xué) 2016
[7]基于深度學(xué)習(xí)的情感詞向量生成模型研究[D]. 焦晨晨.北京郵電大學(xué) 2016
[8]藏文句子傾向性分析研究[D]. 杜雪峰.中央民族大學(xué) 2015
本文編號:3718789
【文章頁數(shù)】:53 頁
【學(xué)位級別】:碩士
【文章目錄】:
中文摘要
Abstract
第一章 緒論
1.1 研究背景及意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 情感詞典的構(gòu)建國內(nèi)外研究現(xiàn)狀
1.2.2 情感計算國內(nèi)外研究現(xiàn)狀
1.2.3 情感詞典資源現(xiàn)狀
1.3 課題的主要研究內(nèi)容及創(chuàng)新點
1.3.1 選題的主要研究內(nèi)容
1.3.2 課題的創(chuàng)新點
1.4 本文的結(jié)構(gòu)安排
第二章 文本情感計算相關(guān)介紹
2.1 概述
2.2 文本預(yù)處理
2.2.1 分詞技術(shù)
2.2.2 去停用詞
2.3 基于情感詞典的情感計算原理
2.4 基于機器學(xué)習(xí)情感計算流程
2.5 Word2Vec簡介
2.5.1 Word2Vec神經(jīng)網(wǎng)絡(luò)架構(gòu)
2.5.2 Skip-Gram(Continuous Skip-Gram Model)模型
2.6 基于深度學(xué)習(xí)情感計算原理
2.6.1 卷積神經(jīng)網(wǎng)絡(luò)
2.6.2 長短時記憶神經(jīng)網(wǎng)絡(luò)
2.7 本章小結(jié)
第三章 漢藏雙語情感詞典構(gòu)建
3.1 概述
3.2 《漢藏大辭典》數(shù)據(jù)整理
3.3 中文情感詞典資源整理
3.4 漢藏雙語情感詞典構(gòu)建
3.4.1 漢藏雙語情感詞典構(gòu)建
3.4.2 構(gòu)建結(jié)果分析
3.5 本章小結(jié)
第四章 藏文微博文本情感計算
4.1 概述
4.2 數(shù)據(jù)擴充
4.2.1 基于同反義詞詞典的數(shù)據(jù)擴充
4.2.2 原始藏文微博文本語料
4.3 基于情感詞典的藏文微博情感計算
4.3.1 未出現(xiàn)轉(zhuǎn)折詞
4.3.2 出現(xiàn)轉(zhuǎn)折詞
4.3.3 情感傾向計算
4.4 CLSTM混合深度學(xué)習(xí)模型的藏文微博情感計算
4.4.1 網(wǎng)絡(luò)模型
4.4.2 模型參數(shù)優(yōu)化
4.5 本章小結(jié)
第五章 實驗及結(jié)果分析
5.1 概述
5.2 環(huán)境介紹
5.2.1 硬件環(huán)境
5.2.2 軟件環(huán)境
5.3 基于情感詞典情感計算及結(jié)果分析
5.4 基于CLSTM模型的結(jié)果與分析
5.4.1 實驗數(shù)據(jù)
5.4.2 結(jié)果與分析
5.5 本章小結(jié)
第六章 總結(jié)與展望
6.1 總結(jié)
6.2 展望
參考文獻
作者在讀期間科研成果簡介
致謝
【參考文獻】:
期刊論文
[1]基于深度學(xué)習(xí)的領(lǐng)域情感詞典自動構(gòu)建——以金融領(lǐng)域為例[J]. 胡家珩,岑詠華,吳承堯. 數(shù)據(jù)分析與知識發(fā)現(xiàn). 2018(10)
[2]基于深度循環(huán)神經(jīng)網(wǎng)絡(luò)的跨領(lǐng)域文本情感分析[J]. 余傳明. 圖書情報工作. 2018(11)
[3]基于情感詞典的藏語文本句子情感分類[J]. 閆曉東,黃濤. 中文信息學(xué)報. 2018(02)
[4]基于詞典與機器學(xué)習(xí)的藏文微博情感分析研究[J]. 楊志. 軟件. 2017(11)
[5]基于詞向量的藏文情感詞典的構(gòu)建方法研究[J]. 巴桑卓瑪,李苗苗,高定國. 電子技術(shù)與軟件工程. 2017(20)
[6]基于多特征的藏文微博情感傾向性分析[J]. 江濤,袁斌,于洪志,加羊吉. 中文信息學(xué)報. 2017(03)
[7]基于詞向量的跨領(lǐng)域中文情感詞典構(gòu)建方法[J]. 馮超,梁循,李亞平,周小平,李曉菲. 數(shù)據(jù)采集與處理. 2017(03)
[8]基于Word2Vec的情感詞典自動構(gòu)建與優(yōu)化[J]. 楊小平,張中夏,王良,張永俊,馬奇鳳,吳佳楠,張悅. 計算機科學(xué). 2017(01)
[9]深度學(xué)習(xí)算法在藏文情感分析中的應(yīng)用研究[J]. 普次仁,侯佳林,劉月,翟東海. 計算機科學(xué)與探索. 2017(07)
[10]基于關(guān)聯(lián)規(guī)則挖掘和極性分析的商品評論情感詞典構(gòu)建[J]. 鐘敏娟,萬常選,劉德喜. 情報學(xué)報. 2016 (05)
碩士論文
[1]基于深度學(xué)習(xí)的微博文本情感分析研究[D]. 宋夢姣.南京大學(xué) 2018
[2]面向社交網(wǎng)絡(luò)特定話題的情感詞典自構(gòu)建方法研究[D]. 張歡.上海師范大學(xué) 2018
[3]基于擴展詞典和規(guī)則的中文微博情感分析[D]. 李繼東.北京交通大學(xué) 2018
[4]一種基于詞典的文本情感分析算法的實現(xiàn)[D]. 姚文杰.陜西師范大學(xué) 2017
[5]藏文文本情感分析方法研究[D]. 李苗苗.西藏大學(xué) 2017
[6]藏文微博情感分類研究與實現(xiàn)[D]. 袁斌.西北民族大學(xué) 2016
[7]基于深度學(xué)習(xí)的情感詞向量生成模型研究[D]. 焦晨晨.北京郵電大學(xué) 2016
[8]藏文句子傾向性分析研究[D]. 杜雪峰.中央民族大學(xué) 2015
本文編號:3718789
本文鏈接:http://www.sikaile.net/kejilunwen/shengwushengchang/3718789.html
最近更新
教材專著