多特征情感詞典在文本情感分析問(wèn)題中的研究
發(fā)布時(shí)間:2022-02-11 12:55
隨著我國(guó)互聯(lián)網(wǎng)行業(yè)的迅速發(fā)展,如何從日益增長(zhǎng)的海量數(shù)據(jù)中提取有效的信息成為當(dāng)前的一個(gè)熱門(mén)研究課題。文本情感分析作為自然語(yǔ)言處理的一個(gè)重要應(yīng)用方向,可以進(jìn)行分析、處理、判斷文本的情感傾向,被廣泛應(yīng)用于輿情監(jiān)控、信用評(píng)價(jià)、網(wǎng)絡(luò)營(yíng)銷(xiāo)、產(chǎn)品與服務(wù)優(yōu)化等領(lǐng)域。情感詞典是文本情感分析的基礎(chǔ)和重要工具,完善且精確的情感詞典可以有效地提高文本情感分析的效果,F(xiàn)有的通用情感詞典大多為情感詞和情感極性值的組合,其情感傾向一般被設(shè)定為固定值。這種情感詞典主觀性較強(qiáng),沒(méi)有考慮情感詞在不同語(yǔ)境下可能會(huì)表現(xiàn)出的不同情感傾向,具有一定的片面性。語(yǔ)句的長(zhǎng)短、詞語(yǔ)的頻率和位置、詞語(yǔ)之間的關(guān)聯(lián)等包含了大量的文本特征信息,這些信息是詞語(yǔ)情感強(qiáng)度變化的關(guān)鍵。本文將詞語(yǔ)的文本特征信息加入到情感詞典的構(gòu)建過(guò)程中,以期找到不同文本語(yǔ)境下詞語(yǔ)的特征信息與情感傾向的關(guān)系,從而使情感詞典更好地適用于各個(gè)領(lǐng)域。本文總結(jié)了常見(jiàn)的三十余種文本特征并根據(jù)特征類(lèi)別、所屬級(jí)別等進(jìn)行分類(lèi),在各個(gè)類(lèi)別中尋找對(duì)詞語(yǔ)的情感值有影響的特征。本文在對(duì)詞語(yǔ)的文本特征和情感傾向的關(guān)系做出大量研究后,提出了基于特征的情感詞典構(gòu)建方法。算法的基本思想:選擇文本特征,統(tǒng)...
【文章來(lái)源】:吉林大學(xué)吉林省211工程院校985工程院校教育部直屬院校
【文章頁(yè)數(shù)】:72 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
文本情感分析的常用方法比較
第 2 章 構(gòu)建情感詞典的相關(guān)理論和技術(shù)據(jù)文本最突出的組織形式(特征項(xiàng))在原有的特征空間上聚結(jié)果不一定與情感有關(guān)[60]。Kmeans 介紹ans 作為最常用的聚類(lèi)算法之一,以其簡(jiǎn)潔性和準(zhǔn)確性聞名,情感分析中。Kmeans 聚類(lèi)算法的主要流程如下[61]:
圖 3.1 單特征情感詞典構(gòu)建和查詢(xún)特征情感詞典構(gòu)建方法的核心邏輯偽代碼如下:begin設(shè)置評(píng)論數(shù)量 N、詞語(yǔ)最小次數(shù)閾值 WAC、評(píng)論最小次數(shù)閾值 CACfor i = 0,N:for word = 0,len(i):記錄評(píng)論 i 情感星級(jí);選取特征計(jì)算函數(shù),計(jì)算 i 特征值;加入情感星級(jí)-特征值列表;end forend for
【參考文獻(xiàn)】:
期刊論文
[1]基于文本聚類(lèi)與情感分析的群租房微博輿情量化研究[J]. 李泉,李萌,成洪權(quán),蔣林秀,肖舒婷,王極可. 圖書(shū)情報(bào)研究. 2019(01)
[2]基于文本聚類(lèi)與情感分析的群租房微博輿情量化研究[J]. 李泉,李萌,成洪權(quán),蔣林秀,肖舒婷,王極可. 圖書(shū)情報(bào)研究. 2019 (01)
[3]文本情感分析研究[J]. 李青松. 現(xiàn)代計(jì)算機(jī)(專(zhuān)業(yè)版). 2019(04)
[4]融合多特征的TextRank關(guān)鍵詞抽取方法[J]. 李航,唐超蘭,楊賢,沈婉婷. 情報(bào)雜志. 2017(08)
[5]基于多特征融合的微博主題情感挖掘[J]. 黃發(fā)良,馮時(shí),王大玲,于戈. 計(jì)算機(jī)學(xué)報(bào). 2017(04)
[6]情感詞典構(gòu)建綜述[J]. 梅莉莉,黃河燕,周新宇,毛先領(lǐng). 中文信息學(xué)報(bào). 2016(05)
[7]基于特征融合的層次結(jié)構(gòu)微博情感分類(lèi)[J]. 朱憲瑩,劉箴,金煒,劉婷婷,劉翠娟,柴艷杰. 電信科學(xué). 2016(07)
[8]基于情感特征的用戶(hù)聚類(lèi)分析[J]. 任偉,劉循. 中國(guó)新通信. 2016(05)
[9]情感詞典自動(dòng)構(gòu)建方法綜述[J]. 王科,夏睿. 自動(dòng)化學(xué)報(bào). 2016(04)
[10]基于話(huà)題聚類(lèi)及情感強(qiáng)度的中文微博輿情分析[J]. 吳青林,周天宏. 情報(bào)理論與實(shí)踐. 2016(01)
博士論文
[1]文本傾向性分析中的情感詞典構(gòu)建技術(shù)研究[D]. 杜偉夫.哈爾濱工業(yè)大學(xué) 2010
碩士論文
[1]基于多維度特征評(píng)論分類(lèi)的研究[D]. 包友軍.浙江大學(xué) 2017
[2]基于詞典和機(jī)器學(xué)習(xí)組合的情感分析[D]. 丁蔚.西安郵電大學(xué) 2017
[3]基于多元特征融合和LSTM神經(jīng)網(wǎng)絡(luò)的中文評(píng)論情感分析[D]. 李科.太原理工大學(xué) 2017
[4]中文微博情感詞典的構(gòu)建研究與應(yīng)用[D]. 於偉.上海師范大學(xué) 2017
[5]基于機(jī)器學(xué)習(xí)的微博評(píng)論信息傾向性分析的研究[D]. 汪淳.哈爾濱工業(yè)大學(xué) 2016
[6]基于社交網(wǎng)絡(luò)的用戶(hù)情感分析方法研究[D]. 陳強(qiáng).重慶郵電大學(xué) 2016
[7]互聯(lián)網(wǎng)評(píng)論文本情感分析研究[D]. 崔連超.山東大學(xué) 2015
[8]面向不均衡數(shù)據(jù)和情感詞典構(gòu)建的特征選擇方法研究[D]. 吳金源.北京工業(yè)大學(xué) 2014
[9]基于情感常識(shí)的公眾情感趨勢(shì)預(yù)測(cè)[D]. 任巨偉.大連理工大學(xué) 2014
[10]面向情感傾向分析的微博表情情感詞典構(gòu)建及應(yīng)用[D]. 王文遠(yuǎn).東北大學(xué) 2012
本文編號(hào):3620319
【文章來(lái)源】:吉林大學(xué)吉林省211工程院校985工程院校教育部直屬院校
【文章頁(yè)數(shù)】:72 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
文本情感分析的常用方法比較
第 2 章 構(gòu)建情感詞典的相關(guān)理論和技術(shù)據(jù)文本最突出的組織形式(特征項(xiàng))在原有的特征空間上聚結(jié)果不一定與情感有關(guān)[60]。Kmeans 介紹ans 作為最常用的聚類(lèi)算法之一,以其簡(jiǎn)潔性和準(zhǔn)確性聞名,情感分析中。Kmeans 聚類(lèi)算法的主要流程如下[61]:
圖 3.1 單特征情感詞典構(gòu)建和查詢(xún)特征情感詞典構(gòu)建方法的核心邏輯偽代碼如下:begin設(shè)置評(píng)論數(shù)量 N、詞語(yǔ)最小次數(shù)閾值 WAC、評(píng)論最小次數(shù)閾值 CACfor i = 0,N:for word = 0,len(i):記錄評(píng)論 i 情感星級(jí);選取特征計(jì)算函數(shù),計(jì)算 i 特征值;加入情感星級(jí)-特征值列表;end forend for
【參考文獻(xiàn)】:
期刊論文
[1]基于文本聚類(lèi)與情感分析的群租房微博輿情量化研究[J]. 李泉,李萌,成洪權(quán),蔣林秀,肖舒婷,王極可. 圖書(shū)情報(bào)研究. 2019(01)
[2]基于文本聚類(lèi)與情感分析的群租房微博輿情量化研究[J]. 李泉,李萌,成洪權(quán),蔣林秀,肖舒婷,王極可. 圖書(shū)情報(bào)研究. 2019 (01)
[3]文本情感分析研究[J]. 李青松. 現(xiàn)代計(jì)算機(jī)(專(zhuān)業(yè)版). 2019(04)
[4]融合多特征的TextRank關(guān)鍵詞抽取方法[J]. 李航,唐超蘭,楊賢,沈婉婷. 情報(bào)雜志. 2017(08)
[5]基于多特征融合的微博主題情感挖掘[J]. 黃發(fā)良,馮時(shí),王大玲,于戈. 計(jì)算機(jī)學(xué)報(bào). 2017(04)
[6]情感詞典構(gòu)建綜述[J]. 梅莉莉,黃河燕,周新宇,毛先領(lǐng). 中文信息學(xué)報(bào). 2016(05)
[7]基于特征融合的層次結(jié)構(gòu)微博情感分類(lèi)[J]. 朱憲瑩,劉箴,金煒,劉婷婷,劉翠娟,柴艷杰. 電信科學(xué). 2016(07)
[8]基于情感特征的用戶(hù)聚類(lèi)分析[J]. 任偉,劉循. 中國(guó)新通信. 2016(05)
[9]情感詞典自動(dòng)構(gòu)建方法綜述[J]. 王科,夏睿. 自動(dòng)化學(xué)報(bào). 2016(04)
[10]基于話(huà)題聚類(lèi)及情感強(qiáng)度的中文微博輿情分析[J]. 吳青林,周天宏. 情報(bào)理論與實(shí)踐. 2016(01)
博士論文
[1]文本傾向性分析中的情感詞典構(gòu)建技術(shù)研究[D]. 杜偉夫.哈爾濱工業(yè)大學(xué) 2010
碩士論文
[1]基于多維度特征評(píng)論分類(lèi)的研究[D]. 包友軍.浙江大學(xué) 2017
[2]基于詞典和機(jī)器學(xué)習(xí)組合的情感分析[D]. 丁蔚.西安郵電大學(xué) 2017
[3]基于多元特征融合和LSTM神經(jīng)網(wǎng)絡(luò)的中文評(píng)論情感分析[D]. 李科.太原理工大學(xué) 2017
[4]中文微博情感詞典的構(gòu)建研究與應(yīng)用[D]. 於偉.上海師范大學(xué) 2017
[5]基于機(jī)器學(xué)習(xí)的微博評(píng)論信息傾向性分析的研究[D]. 汪淳.哈爾濱工業(yè)大學(xué) 2016
[6]基于社交網(wǎng)絡(luò)的用戶(hù)情感分析方法研究[D]. 陳強(qiáng).重慶郵電大學(xué) 2016
[7]互聯(lián)網(wǎng)評(píng)論文本情感分析研究[D]. 崔連超.山東大學(xué) 2015
[8]面向不均衡數(shù)據(jù)和情感詞典構(gòu)建的特征選擇方法研究[D]. 吳金源.北京工業(yè)大學(xué) 2014
[9]基于情感常識(shí)的公眾情感趨勢(shì)預(yù)測(cè)[D]. 任巨偉.大連理工大學(xué) 2014
[10]面向情感傾向分析的微博表情情感詞典構(gòu)建及應(yīng)用[D]. 王文遠(yuǎn).東北大學(xué) 2012
本文編號(hào):3620319
本文鏈接:http://www.sikaile.net/kejilunwen/shengwushengchang/3620319.html
最近更新
教材專(zhuān)著