基于情感分析的商品評(píng)價(jià)系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)
發(fā)布時(shí)間:2021-04-01 08:00
網(wǎng)絡(luò)購(gòu)物在方便人們生活的同時(shí),也存在著一些問(wèn)題,由于網(wǎng)絡(luò)購(gòu)物不能像線下購(gòu)物一樣能夠接觸到商品,而且商品的所有信息都是由商家所給出的,這就造成了信息的不對(duì)等,容易導(dǎo)致用戶買到了假貨、殘次品、或與自己期望不符的商品,造成一定的損失。雖然用戶可以通過(guò)查看商品評(píng)論來(lái)獲取有價(jià)值的信息,但隨著商品評(píng)論的不斷的累積,這種信息獲取方式的效率越來(lái)越低。針對(duì)商品評(píng)論累積過(guò)多的問(wèn)題,重點(diǎn)是從海量的商品評(píng)論中提取出有價(jià)值的信息,本文通過(guò)對(duì)現(xiàn)有情感分析方法進(jìn)行研究,設(shè)計(jì)并實(shí)現(xiàn)了基于情感詞典和基于SVM的商品評(píng)價(jià)系統(tǒng),利用情感分析方法對(duì)商品評(píng)論進(jìn)行分析處理,向用戶提供客觀且全面的購(gòu)物參考信息。本文主要工作體現(xiàn)在以下方面:(1)數(shù)據(jù)的采集。本文通過(guò)對(duì)電商平臺(tái)頁(yè)面進(jìn)行分析,設(shè)計(jì)了基于Scrapy框架的網(wǎng)絡(luò)爬蟲,該網(wǎng)絡(luò)爬蟲能夠從電商平臺(tái)上爬取相應(yīng)商品的各項(xiàng)信息。本文利用該網(wǎng)絡(luò)爬蟲從電商平臺(tái)累積收集了數(shù)十萬(wàn)條數(shù)據(jù)。(2)情感分析方法的研究。為了從商品評(píng)論中挖掘出有價(jià)值的信息,本文對(duì)現(xiàn)有情感分析方法進(jìn)行研究,采用了基于情感詞典和基于SVM這兩種情感分析方法對(duì)商品評(píng)論進(jìn)行處理。在情感詞典方法的研究中,本文以通用情感詞典為基礎(chǔ)...
【文章來(lái)源】:河北工程大學(xué)河北省
【文章頁(yè)數(shù)】:80 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
京東源碼截圖
第3章基于Scrapy框架的數(shù)據(jù)采集23圖3-7京東源碼截圖Fig.3-7JDsourcecodescreenshot通過(guò)同樣的分析方法,可以發(fā)現(xiàn)淘寶用于存儲(chǔ)商品評(píng)論的文件為包含有l(wèi)ist_detail的文件,商品評(píng)論的URL同樣可以在headers中找到,如圖3-8所示。圖3-8淘寶源碼截圖Fig.3-8screenshotofTaobaosourcecode在對(duì)其他筆記本電腦進(jìn)行同樣的分析后,可以發(fā)現(xiàn)這些用于存儲(chǔ)商品評(píng)論的URL的區(qū)別僅在于商品的ID不同,所以本文依此構(gòu)造了商品評(píng)論的初始URL,并通過(guò)更改URL中的商品ID來(lái)構(gòu)造出相應(yīng)商品評(píng)論的URL。獲取評(píng)論的URL后,就可分析電商平臺(tái)返回的數(shù)據(jù)來(lái)制定相應(yīng)的爬蟲規(guī)則來(lái)獲取評(píng)論內(nèi)容、評(píng)分等信息。本文以京東商城的返回?cái)?shù)據(jù)為例進(jìn)行分析,如圖3-9所示,可以發(fā)現(xiàn)返回的響應(yīng)數(shù)據(jù)是json格式的數(shù)據(jù),所以可以通過(guò)查找數(shù)據(jù)中的key來(lái)獲取對(duì)應(yīng)的數(shù)據(jù),其中存放評(píng)論的key是content,存放評(píng)論創(chuàng)建時(shí)間的是creationTime,存放用戶評(píng)分的是score。因此通過(guò)遍歷數(shù)據(jù)中的content、createTime、score來(lái)獲取到相應(yīng)的數(shù)據(jù)。圖3-9京東響應(yīng)數(shù)據(jù)截圖Fig.3-9JDresponsedatascreenshot
第3章基于Scrapy框架的數(shù)據(jù)采集23圖3-7京東源碼截圖Fig.3-7JDsourcecodescreenshot通過(guò)同樣的分析方法,可以發(fā)現(xiàn)淘寶用于存儲(chǔ)商品評(píng)論的文件為包含有l(wèi)ist_detail的文件,商品評(píng)論的URL同樣可以在headers中找到,如圖3-8所示。圖3-8淘寶源碼截圖Fig.3-8screenshotofTaobaosourcecode在對(duì)其他筆記本電腦進(jìn)行同樣的分析后,可以發(fā)現(xiàn)這些用于存儲(chǔ)商品評(píng)論的URL的區(qū)別僅在于商品的ID不同,所以本文依此構(gòu)造了商品評(píng)論的初始URL,并通過(guò)更改URL中的商品ID來(lái)構(gòu)造出相應(yīng)商品評(píng)論的URL。獲取評(píng)論的URL后,就可分析電商平臺(tái)返回的數(shù)據(jù)來(lái)制定相應(yīng)的爬蟲規(guī)則來(lái)獲取評(píng)論內(nèi)容、評(píng)分等信息。本文以京東商城的返回?cái)?shù)據(jù)為例進(jìn)行分析,如圖3-9所示,可以發(fā)現(xiàn)返回的響應(yīng)數(shù)據(jù)是json格式的數(shù)據(jù),所以可以通過(guò)查找數(shù)據(jù)中的key來(lái)獲取對(duì)應(yīng)的數(shù)據(jù),其中存放評(píng)論的key是content,存放評(píng)論創(chuàng)建時(shí)間的是creationTime,存放用戶評(píng)分的是score。因此通過(guò)遍歷數(shù)據(jù)中的content、createTime、score來(lái)獲取到相應(yīng)的數(shù)據(jù)。圖3-9京東響應(yīng)數(shù)據(jù)截圖Fig.3-9JDresponsedatascreenshot
【參考文獻(xiàn)】:
期刊論文
[1]商品評(píng)論情感傾向性分析[J]. 李明,胡吉霞,侯琳娜,嚴(yán)峻. 計(jì)算機(jī)應(yīng)用. 2019(S2)
[2]中文文本分類方法綜述[J]. 于游,付鈺,吳曉平. 網(wǎng)絡(luò)與信息安全學(xué)報(bào). 2019(05)
[3]攝影領(lǐng)域評(píng)論情感詞典構(gòu)建方法[J]. 劉亞橋,陸向艷,鄧凱凱,阮開棟,劉峻. 計(jì)算機(jī)工程與設(shè)計(jì). 2019(10)
[4]面向突發(fā)事件應(yīng)急管理的情感詞典構(gòu)建——以“暴雨洪澇”災(zāi)害為例[J]. 周莉,楊小儷. 武漢理工大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版). 2019(04)
[5]基于多部情感詞典與SVM的電影評(píng)論情感分析[J]. 吳杰勝,陸奎,王詩(shī)兵. 阜陽(yáng)師范學(xué)院學(xué)報(bào)(自然科學(xué)版). 2019(02)
[6]基于改進(jìn)隨機(jī)森林算法的文本分類研究與應(yīng)用[J]. 劉勇,興艷云. 計(jì)算機(jī)系統(tǒng)應(yīng)用. 2019(05)
[7]文本情感分析方法研究綜述[J]. 洪巍,李敏. 計(jì)算機(jī)工程與科學(xué). 2019(04)
[8]結(jié)合word2vec與擴(kuò)充情感詞典的微博多元情感分類研究[J]. 王名揚(yáng),吳歡,賈曉婷. 東北師大學(xué)報(bào)(自然科學(xué)版). 2019(01)
[9]基于深度學(xué)習(xí)的女裝圖片分類探索[J]. 葉錦,彭小江,喬宇,邢昊. 集成技術(shù). 2019(02)
[10]基于中文社交媒體文本的領(lǐng)域情感詞典構(gòu)建方法研究[J]. 蔣翠清,郭軼博,劉堯. 數(shù)據(jù)分析與知識(shí)發(fā)現(xiàn). 2019(02)
碩士論文
[1]基于機(jī)器學(xué)習(xí)的中文文本分類算法的研究與實(shí)現(xiàn)[D]. 朱夢(mèng).北京郵電大學(xué) 2019
[2]產(chǎn)品評(píng)論文本的情感分析方法研究[D]. 原多多.蘭州財(cái)經(jīng)大學(xué) 2019
[3]商品評(píng)論情感分析技術(shù)研究[D]. 張佳悅.北京交通大學(xué) 2018
[4]基于情感分析的汽車推薦系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D]. 王彥婕.山西大學(xué) 2018
[5]基于酒店中文評(píng)論情感傾向分析[D]. 李長(zhǎng)江.華南理工大學(xué) 2016
本文編號(hào):3112977
【文章來(lái)源】:河北工程大學(xué)河北省
【文章頁(yè)數(shù)】:80 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
京東源碼截圖
第3章基于Scrapy框架的數(shù)據(jù)采集23圖3-7京東源碼截圖Fig.3-7JDsourcecodescreenshot通過(guò)同樣的分析方法,可以發(fā)現(xiàn)淘寶用于存儲(chǔ)商品評(píng)論的文件為包含有l(wèi)ist_detail的文件,商品評(píng)論的URL同樣可以在headers中找到,如圖3-8所示。圖3-8淘寶源碼截圖Fig.3-8screenshotofTaobaosourcecode在對(duì)其他筆記本電腦進(jìn)行同樣的分析后,可以發(fā)現(xiàn)這些用于存儲(chǔ)商品評(píng)論的URL的區(qū)別僅在于商品的ID不同,所以本文依此構(gòu)造了商品評(píng)論的初始URL,并通過(guò)更改URL中的商品ID來(lái)構(gòu)造出相應(yīng)商品評(píng)論的URL。獲取評(píng)論的URL后,就可分析電商平臺(tái)返回的數(shù)據(jù)來(lái)制定相應(yīng)的爬蟲規(guī)則來(lái)獲取評(píng)論內(nèi)容、評(píng)分等信息。本文以京東商城的返回?cái)?shù)據(jù)為例進(jìn)行分析,如圖3-9所示,可以發(fā)現(xiàn)返回的響應(yīng)數(shù)據(jù)是json格式的數(shù)據(jù),所以可以通過(guò)查找數(shù)據(jù)中的key來(lái)獲取對(duì)應(yīng)的數(shù)據(jù),其中存放評(píng)論的key是content,存放評(píng)論創(chuàng)建時(shí)間的是creationTime,存放用戶評(píng)分的是score。因此通過(guò)遍歷數(shù)據(jù)中的content、createTime、score來(lái)獲取到相應(yīng)的數(shù)據(jù)。圖3-9京東響應(yīng)數(shù)據(jù)截圖Fig.3-9JDresponsedatascreenshot
第3章基于Scrapy框架的數(shù)據(jù)采集23圖3-7京東源碼截圖Fig.3-7JDsourcecodescreenshot通過(guò)同樣的分析方法,可以發(fā)現(xiàn)淘寶用于存儲(chǔ)商品評(píng)論的文件為包含有l(wèi)ist_detail的文件,商品評(píng)論的URL同樣可以在headers中找到,如圖3-8所示。圖3-8淘寶源碼截圖Fig.3-8screenshotofTaobaosourcecode在對(duì)其他筆記本電腦進(jìn)行同樣的分析后,可以發(fā)現(xiàn)這些用于存儲(chǔ)商品評(píng)論的URL的區(qū)別僅在于商品的ID不同,所以本文依此構(gòu)造了商品評(píng)論的初始URL,并通過(guò)更改URL中的商品ID來(lái)構(gòu)造出相應(yīng)商品評(píng)論的URL。獲取評(píng)論的URL后,就可分析電商平臺(tái)返回的數(shù)據(jù)來(lái)制定相應(yīng)的爬蟲規(guī)則來(lái)獲取評(píng)論內(nèi)容、評(píng)分等信息。本文以京東商城的返回?cái)?shù)據(jù)為例進(jìn)行分析,如圖3-9所示,可以發(fā)現(xiàn)返回的響應(yīng)數(shù)據(jù)是json格式的數(shù)據(jù),所以可以通過(guò)查找數(shù)據(jù)中的key來(lái)獲取對(duì)應(yīng)的數(shù)據(jù),其中存放評(píng)論的key是content,存放評(píng)論創(chuàng)建時(shí)間的是creationTime,存放用戶評(píng)分的是score。因此通過(guò)遍歷數(shù)據(jù)中的content、createTime、score來(lái)獲取到相應(yīng)的數(shù)據(jù)。圖3-9京東響應(yīng)數(shù)據(jù)截圖Fig.3-9JDresponsedatascreenshot
【參考文獻(xiàn)】:
期刊論文
[1]商品評(píng)論情感傾向性分析[J]. 李明,胡吉霞,侯琳娜,嚴(yán)峻. 計(jì)算機(jī)應(yīng)用. 2019(S2)
[2]中文文本分類方法綜述[J]. 于游,付鈺,吳曉平. 網(wǎng)絡(luò)與信息安全學(xué)報(bào). 2019(05)
[3]攝影領(lǐng)域評(píng)論情感詞典構(gòu)建方法[J]. 劉亞橋,陸向艷,鄧凱凱,阮開棟,劉峻. 計(jì)算機(jī)工程與設(shè)計(jì). 2019(10)
[4]面向突發(fā)事件應(yīng)急管理的情感詞典構(gòu)建——以“暴雨洪澇”災(zāi)害為例[J]. 周莉,楊小儷. 武漢理工大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版). 2019(04)
[5]基于多部情感詞典與SVM的電影評(píng)論情感分析[J]. 吳杰勝,陸奎,王詩(shī)兵. 阜陽(yáng)師范學(xué)院學(xué)報(bào)(自然科學(xué)版). 2019(02)
[6]基于改進(jìn)隨機(jī)森林算法的文本分類研究與應(yīng)用[J]. 劉勇,興艷云. 計(jì)算機(jī)系統(tǒng)應(yīng)用. 2019(05)
[7]文本情感分析方法研究綜述[J]. 洪巍,李敏. 計(jì)算機(jī)工程與科學(xué). 2019(04)
[8]結(jié)合word2vec與擴(kuò)充情感詞典的微博多元情感分類研究[J]. 王名揚(yáng),吳歡,賈曉婷. 東北師大學(xué)報(bào)(自然科學(xué)版). 2019(01)
[9]基于深度學(xué)習(xí)的女裝圖片分類探索[J]. 葉錦,彭小江,喬宇,邢昊. 集成技術(shù). 2019(02)
[10]基于中文社交媒體文本的領(lǐng)域情感詞典構(gòu)建方法研究[J]. 蔣翠清,郭軼博,劉堯. 數(shù)據(jù)分析與知識(shí)發(fā)現(xiàn). 2019(02)
碩士論文
[1]基于機(jī)器學(xué)習(xí)的中文文本分類算法的研究與實(shí)現(xiàn)[D]. 朱夢(mèng).北京郵電大學(xué) 2019
[2]產(chǎn)品評(píng)論文本的情感分析方法研究[D]. 原多多.蘭州財(cái)經(jīng)大學(xué) 2019
[3]商品評(píng)論情感分析技術(shù)研究[D]. 張佳悅.北京交通大學(xué) 2018
[4]基于情感分析的汽車推薦系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D]. 王彥婕.山西大學(xué) 2018
[5]基于酒店中文評(píng)論情感傾向分析[D]. 李長(zhǎng)江.華南理工大學(xué) 2016
本文編號(hào):3112977
本文鏈接:http://www.sikaile.net/guanlilunwen/pinpaiwenhualunwen/3112977.html
最近更新
教材專著