基于情感分類的酒店評論短文本主題挖掘
發(fā)布時間:2024-01-28 08:05
隨著近幾年社交網(wǎng)絡(luò)的迅猛發(fā)展,網(wǎng)絡(luò)用戶愈發(fā)頻繁地在互聯(lián)網(wǎng)上發(fā)表自身的評論和觀點(diǎn),這些評論和觀點(diǎn)呈現(xiàn)爆炸式增長,其中包含用戶情感等信息,這些信息在輿情監(jiān)控、商品改進(jìn)和產(chǎn)品推薦等方面有著重要意義。文本情感分類研究順應(yīng)這一發(fā)展趨勢,成為了一個研究熱點(diǎn)。隨著社會經(jīng)濟(jì)的發(fā)展,人們生活水平的提高,旅游客戶在關(guān)注酒店消費(fèi)價格的同時,更注重精神層面的感受,更關(guān)注服務(wù)體驗(yàn)。客戶完成體驗(yàn)之后,在網(wǎng)絡(luò)上發(fā)表的評論成為了未來用戶選擇酒店時的重要參考。而經(jīng)濟(jì)型快捷酒店由于價格定位低,分布范圍廣,成為了人們出游的首選。本文首先通過八爪魚爬蟲工具,從攜程網(wǎng)站獲取杭州地區(qū)如家酒店和漢庭酒店的客戶評論。針對原始語料,通過數(shù)據(jù)清洗預(yù)處理等步驟,獲得如家酒店評論18685條,漢庭酒店評論19690條。接著在統(tǒng)計詞典的基礎(chǔ)上,構(gòu)建自定義酒店領(lǐng)域情感詞典,對評論文本進(jìn)行分詞處理,利用分詞結(jié)果訓(xùn)練詞向量。然后將帶有情感標(biāo)簽評論的詞向量作為輸入變量,對TextCNN卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,將訓(xùn)練好的網(wǎng)絡(luò)模型,對未帶有情感標(biāo)簽的評論進(jìn)行情感分類。得到如家酒店積極評論14547條,消極評論4138條,消極評論占比22.15%;漢庭酒店積...
【文章頁數(shù)】:77 頁
【學(xué)位級別】:碩士
本文編號:3887347
【文章頁數(shù)】:77 頁
【學(xué)位級別】:碩士
圖1.1全文研究框架
圖2.1NNLM模型框架圖
圖2.2CBOW模型結(jié)構(gòu)
圖2.3Skip-gram模型結(jié)構(gòu)
本文編號:3887347
本文鏈接:http://www.sikaile.net/guanlilunwen/jiudianguanli/3887347.html
最近更新
教材專著