天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

面向電子商務(wù)評(píng)論文本的情感分析技術(shù)研究

發(fā)布時(shí)間:2020-08-24 23:35
【摘要】:隨著電子商務(wù)對(duì)人們生活產(chǎn)生深刻的影響,面向電子商務(wù)評(píng)論文本的情感分析研究也成為當(dāng)前的熱點(diǎn)研究方向。評(píng)論文本情感分析方法主要分為基于情感詞典的方法和基于機(jī)器學(xué)習(xí)的方法,然而傳統(tǒng)的情感分析方法面對(duì)電子商務(wù)評(píng)論文本時(shí)在特征表示及提取等方面存在諸多不足,而豐富有效的特征提取是提升情感判別準(zhǔn)確率的關(guān)鍵因素。為了解決傳統(tǒng)情感分析模型在處理電子商務(wù)文本時(shí)特征構(gòu)建與使用方面存在的問(wèn)題,本論文針對(duì)傳統(tǒng)情感分析方法提出了兩種改進(jìn)模型并在真實(shí)的中文電子商務(wù)評(píng)論上進(jìn)行試驗(yàn),驗(yàn)證了我們提出的改進(jìn)方法的有效性。本文的主要工作有:第一,通過(guò)對(duì)情感詞典采用模板匹配的方式進(jìn)行擴(kuò)展和針對(duì)不同句型針對(duì)性分析評(píng)論語(yǔ)句情感值的計(jì)算方法,建立了基于情感詞典的改進(jìn)分析模型。本文首先對(duì)現(xiàn)有情感詞典進(jìn)行了收集和整理,同時(shí)對(duì)網(wǎng)絡(luò)詞典進(jìn)行收集并采用基于模板規(guī)則的方法對(duì)情感詞典進(jìn)行了拓展,獲取領(lǐng)域情感詞,構(gòu)建了面向電子商務(wù)評(píng)論的情感詞典。其次,本文引入決策樹(shù)對(duì)不同句型進(jìn)行分類,將句子分為四大類,包括肯定句、否定句、雙重否定句及反問(wèn)句,然后針對(duì)每類句型設(shè)計(jì)情感值計(jì)算方法,并對(duì)雙重否定句以及反問(wèn)句這兩類情感強(qiáng)度較強(qiáng)的句子做加權(quán)處理,實(shí)現(xiàn)整條評(píng)論的情感值計(jì)算來(lái)獲取其情感傾向性。最后,通過(guò)在京東部分商品評(píng)論數(shù)據(jù)上的實(shí)驗(yàn)證明了改進(jìn)模型的情感判別效果明顯優(yōu)于傳統(tǒng)模型,充分體現(xiàn)本文提出的改進(jìn)模型的有效性。第二,通過(guò)融合詞向量特征建立了基于機(jī)器學(xué)習(xí)的改進(jìn)分析模型。傳統(tǒng)的基于機(jī)器學(xué)習(xí)的分析方法對(duì)于評(píng)論這樣的短文本進(jìn)行特征表示時(shí),存在特征稀疏問(wèn)題。詞向量技術(shù)能實(shí)現(xiàn)文本的向量化表示,向量維度較低,并能有效對(duì)詞語(yǔ)之間的語(yǔ)義關(guān)系進(jìn)行建模。為了提取更為豐富準(zhǔn)確的文本特征,我們?cè)诘谝徊糠滞卣沟那楦性~典的基礎(chǔ)上基于詞向量技術(shù)對(duì)情感詞的向量表示進(jìn)行情感調(diào)整構(gòu)造情感詞向量,并利用TF-IDF值表征詞在文本中的重要性,作為詞向量的權(quán)重,最后將詞向量進(jìn)行加權(quán)疊加,形成文本的向量化表示。在此基礎(chǔ)上,將第一部分中基于情感詞典的分析模型輸出作為特征與本部分中的情感詞向量特征進(jìn)行融合,并通過(guò)機(jī)器學(xué)習(xí)方法進(jìn)行情感分析。實(shí)驗(yàn)結(jié)果表明,改進(jìn)的基于機(jī)器學(xué)習(xí)的情感分析模型相比其它基礎(chǔ)模型在性能上有進(jìn)一步提升。
【學(xué)位授予單位】:華中師范大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2018
【分類號(hào)】:F713.36;TP391.1
【圖文】:

情感,詞典,分析流程,分析方法


造情感詞典,通過(guò)詞典分析文本中所有能夠影響情感表達(dá)的詞語(yǔ),通常包括情感詞逡逑以及修飾詞,根據(jù)情感詞語(yǔ)及其修飾詞的情感強(qiáng)度賦予其對(duì)應(yīng)的權(quán)重值,然后綜合逡逑加權(quán)來(lái)計(jì)算文本情感值。基于情感詞典的分析流程如圖2-1所示:逡逑評(píng)論文本邋邐?文本預(yù)處理一?捐感詞匹配——?情感值計(jì)算——?憧感分類逡逑1邐邐_J邋邐邐邐邋邐邋邐逡逑情感詞典逡逑圖2-1基于情感詞典的分析流程逡逑基于情感詞典的分析方法關(guān)鍵之一是情感詞典的構(gòu)建,情感詞典主要由具有情逡逑感傾向性的情感詞語(yǔ)構(gòu)成,同時(shí)也包括副詞及否定詞等修飾情感傾向性的詞語(yǔ)。目逡逑前的研究工作中常用的情感詞典構(gòu)建方法主要分成兩種,第一種是以受到廣泛認(rèn)可逡逑的情感詞典,例如知網(wǎng)等為基礎(chǔ),再根據(jù)情感分類問(wèn)題所屬的具體領(lǐng)域,針對(duì)性的逡逑構(gòu)建特定研宄領(lǐng)域所需的情感詞典;第二種是根據(jù)特定情感分類領(lǐng)域的特點(diǎn),完全逡逑由人工通過(guò)收集整理的方式,構(gòu)建特定領(lǐng)域的情感詞典。顯然第一種方法構(gòu)建情感逡逑詞典的方法有前人的研宄工作作為基礎(chǔ),構(gòu)建起來(lái)速度更快,任務(wù)量更小,可以在逡逑相對(duì)較短的時(shí)間里完成情感詞典的構(gòu)建;相反第二種方法無(wú)任何現(xiàn)有詞典作為基礎(chǔ)

模型圖,情感,基礎(chǔ)分析,模型


3.1基于情感詞典的基礎(chǔ)分析模型逡逑基于情感詞典的情感分析過(guò)程主要包括:情感詞典的構(gòu)建、文本預(yù)處理、利用逡逑規(guī)則計(jì)算句子的情感值,如圖3-1所示,其中關(guān)鍵的工作是情感詞典的構(gòu)建和情感逡逑極性值的計(jì)算。逡逑12逡逑

情感,領(lǐng)域


現(xiàn)存情感詞典包含情感詞有限,雖然已通過(guò)人工收集整理的方式獲取了很多網(wǎng)逡逑絡(luò)新詞,但情感詞典的覆蓋程度仍然很低,我們采用一種較簡(jiǎn)單的挖掘情感新詞的逡逑方法,即基于模板規(guī)則的方法,利用該方法挖掘領(lǐng)域情感詞的流程如圖3-2所示。逡逑評(píng)論ifiS溯逡逑處理逡逑詞頻統(tǒng)計(jì)邐構(gòu)建規(guī)則逡逑t邐/"I逡逑挑選基sE提取候選詞逡逑TJX逡逑計(jì)算候選詞?一

本文編號(hào):2802980

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/jingjilunwen/guojimaoyilunwen/2802980.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶27b6b***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com