基于機器學(xué)習(xí)的租房軟件評論情感分析研究
發(fā)布時間:2024-03-16 22:52
隨著城鎮(zhèn)化的發(fā)展,房價水漲船高,越來越多的人選擇租房來解決自己的住房問題;ヂ(lián)網(wǎng)的發(fā)展和智能手機的普及,越來越多的租房軟件出現(xiàn)在人們的視野中,房屋租賃業(yè)務(wù)也開始由線下轉(zhuǎn)為線上。各大應(yīng)用商店都匯集著大量軟件的用戶評論,這些評論文本包含著眾多的情感和信息,對這些情感和信息進行分析,具有豐富的商業(yè)價值和現(xiàn)實意義。本文基于租房軟件評論文本進行情感分析,首先對用戶評論數(shù)據(jù)進行預(yù)處理,包括數(shù)據(jù)清洗、文本分詞以及去停用詞,基于情感詞典和人工標(biāo)注結(jié)合的方法對評論文本進行標(biāo)注,通過word2vec獲取評論文本的詞向量表示。其次,對預(yù)處理之后的數(shù)據(jù)構(gòu)建情感傾向分類模型,分別構(gòu)建基于傳統(tǒng)機器學(xué)習(xí)算法的分類模型以及基于深度學(xué)習(xí)方法的分類模型。先后采用支持向量機、隨機森林、卷積神經(jīng)網(wǎng)絡(luò)、雙向長短時記憶網(wǎng)絡(luò)、BERT模型構(gòu)建情感分類模型并進行模型評價,最終選擇基于BERT的情感分類模型,其準確率達到了89.6%,F1-socre為0.9034,AUC值為0.8783,能夠很好地完成對租房軟件用戶評論文本情感傾向的識別。最后,采用LDA主題模型對租房軟件用戶評論進行文本挖掘,將數(shù)據(jù)集分為正面情感數(shù)據(jù)集和負面情感數(shù)據(jù)...
【文章頁數(shù)】:67 頁
【學(xué)位級別】:碩士
【部分圖文】:
本文編號:3930212
【文章頁數(shù)】:67 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖1-1研究框架
本文的研究框架如圖1-1所示。2.1傳統(tǒng)機器學(xué)習(xí)相關(guān)算法
圖2-1支持向量機示意圖
其中w為法向量,b為截距,用(w,b)來表示劃分超平面,劃分超平面將特征空間劃分為兩側(cè),一側(cè)為正例,另一側(cè)為負例。當(dāng)訓(xùn)練樣本集線性可分時,為了求解,使間隔最大化,則
圖2-2隨機森林算法流程圖
(4)隨機森林模型對測試集上的數(shù)據(jù)進行預(yù)測,最后憑借“少數(shù)服從多數(shù)”的投票法得到最終的分類結(jié)果。2.2深度學(xué)習(xí)相關(guān)算法
圖2-3CBOW模型結(jié)構(gòu)示意圖
word2vec的模型訓(xùn)練有兩種方式,分別是連續(xù)詞袋模型(ContinuousBag-of-Words,CBOW)和Skip-Gram模型。CBOW模型的基本思想是向神經(jīng)網(wǎng)絡(luò)傳入上下文詞匯,然后預(yù)測目標(biāo)詞匯。CBOW模型結(jié)構(gòu)示意圖如圖2-3所示。圖中的Inputlayer表示....
本文編號:3930212
本文鏈接:http://www.sikaile.net/jingjifazhanlunwen/3930212.html
最近更新
教材專著