天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于機器學(xué)習(xí)的租房軟件評論情感分析研究

發(fā)布時間:2024-03-16 22:52
  隨著城鎮(zhèn)化的發(fā)展,房價水漲船高,越來越多的人選擇租房來解決自己的住房問題;ヂ(lián)網(wǎng)的發(fā)展和智能手機的普及,越來越多的租房軟件出現(xiàn)在人們的視野中,房屋租賃業(yè)務(wù)也開始由線下轉(zhuǎn)為線上。各大應(yīng)用商店都匯集著大量軟件的用戶評論,這些評論文本包含著眾多的情感和信息,對這些情感和信息進行分析,具有豐富的商業(yè)價值和現(xiàn)實意義。本文基于租房軟件評論文本進行情感分析,首先對用戶評論數(shù)據(jù)進行預(yù)處理,包括數(shù)據(jù)清洗、文本分詞以及去停用詞,基于情感詞典和人工標(biāo)注結(jié)合的方法對評論文本進行標(biāo)注,通過word2vec獲取評論文本的詞向量表示。其次,對預(yù)處理之后的數(shù)據(jù)構(gòu)建情感傾向分類模型,分別構(gòu)建基于傳統(tǒng)機器學(xué)習(xí)算法的分類模型以及基于深度學(xué)習(xí)方法的分類模型。先后采用支持向量機、隨機森林、卷積神經(jīng)網(wǎng)絡(luò)、雙向長短時記憶網(wǎng)絡(luò)、BERT模型構(gòu)建情感分類模型并進行模型評價,最終選擇基于BERT的情感分類模型,其準確率達到了89.6%,F1-socre為0.9034,AUC值為0.8783,能夠很好地完成對租房軟件用戶評論文本情感傾向的識別。最后,采用LDA主題模型對租房軟件用戶評論進行文本挖掘,將數(shù)據(jù)集分為正面情感數(shù)據(jù)集和負面情感數(shù)據(jù)...

【文章頁數(shù)】:67 頁

【學(xué)位級別】:碩士

【部分圖文】:

圖1-1研究框架

圖1-1研究框架

本文的研究框架如圖1-1所示。2.1傳統(tǒng)機器學(xué)習(xí)相關(guān)算法


圖2-1支持向量機示意圖

圖2-1支持向量機示意圖

其中w為法向量,b為截距,用(w,b)來表示劃分超平面,劃分超平面將特征空間劃分為兩側(cè),一側(cè)為正例,另一側(cè)為負例。當(dāng)訓(xùn)練樣本集線性可分時,為了求解,使間隔最大化,則


圖2-2隨機森林算法流程圖

圖2-2隨機森林算法流程圖

(4)隨機森林模型對測試集上的數(shù)據(jù)進行預(yù)測,最后憑借“少數(shù)服從多數(shù)”的投票法得到最終的分類結(jié)果。2.2深度學(xué)習(xí)相關(guān)算法


圖2-3CBOW模型結(jié)構(gòu)示意圖

圖2-3CBOW模型結(jié)構(gòu)示意圖

word2vec的模型訓(xùn)練有兩種方式,分別是連續(xù)詞袋模型(ContinuousBag-of-Words,CBOW)和Skip-Gram模型。CBOW模型的基本思想是向神經(jīng)網(wǎng)絡(luò)傳入上下文詞匯,然后預(yù)測目標(biāo)詞匯。CBOW模型結(jié)構(gòu)示意圖如圖2-3所示。圖中的Inputlayer表示....



本文編號:3930212

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/jingjifazhanlunwen/3930212.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶39883***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com