基于語義情感信息的評(píng)論有用性研究
發(fā)布時(shí)間:2019-10-18 11:26
【摘要】:在電子商務(wù)平臺(tái),用戶評(píng)論為用戶提供了豐富的意見乃至購物導(dǎo)向,影響著用戶的購物決策。而隨著電子商務(wù)的發(fā)展和越來越多的用戶參與其中,在線評(píng)論的數(shù)量急劇增長,用戶難以從海量的評(píng)論中攝取有用的信息借以對(duì)產(chǎn)品的各方面有所了解,更難以從龐雜的信息流中對(duì)可靠和有用的評(píng)論加以識(shí)別。近年來針對(duì)評(píng)論的研究主要涉及垃圾評(píng)論、評(píng)論質(zhì)量和評(píng)論摘要三個(gè)方面。垃圾評(píng)論通過發(fā)掘特征基于機(jī)器學(xué)習(xí)方法都能較好識(shí)別,評(píng)論摘要和評(píng)論質(zhì)量是多年來研究領(lǐng)域一直討論的問題,是在線網(wǎng)絡(luò)平臺(tái)對(duì)評(píng)論的不同組織方式。本文針對(duì)評(píng)論摘要和評(píng)論質(zhì)量研究中存在的問題,主要完成了以下工作:(1)針對(duì)傳統(tǒng)基于句法分析在不規(guī)范評(píng)論文本中的缺陷和主題模型應(yīng)用于產(chǎn)品特征提取中的問題,提出了基于句法分析和主題模型結(jié)合的改進(jìn)LDA模型SA-LDA進(jìn)行產(chǎn)品特征抽取。(2)對(duì)于特征詞的聚類,結(jié)合語義相似度和觀點(diǎn)相似度的方法對(duì)特征詞之間的距離進(jìn)行度量。(3)利用句法分析得到的特征集和觀點(diǎn)集對(duì)觀點(diǎn)句進(jìn)行識(shí)別,作為主題模型的輸入,并結(jié)合must-link和cannot-link兩種約束條件進(jìn)行主題學(xué)習(xí),保證了模型的準(zhǔn)確率。(4)探索評(píng)論摘要與評(píng)論有用性之間的聯(lián)系,基于相同觀點(diǎn)具有一致有用性的思想,提出一個(gè)無監(jiān)督模型OSUD通過觀點(diǎn)支持度對(duì)評(píng)論的有用性進(jìn)行預(yù)測。(5)挖掘評(píng)論回復(fù)信息對(duì)觀點(diǎn)支持度以及評(píng)論有用性的影響,評(píng)論回復(fù)表征了用戶針對(duì)產(chǎn)品某方面特征的意見表述,比評(píng)論有用投票更具參考價(jià)值。本文的實(shí)驗(yàn)數(shù)據(jù)從中關(guān)村網(wǎng)站獲取,通過人工標(biāo)記數(shù)據(jù)的方式構(gòu)造數(shù)據(jù)集,實(shí)驗(yàn)證明本文的特征提取方法在保證較好召回率的同時(shí)對(duì)準(zhǔn)確率也有所提升,且對(duì)于部分隱式特征也能較好抽取;谟^點(diǎn)支持度的評(píng)論有用性模型在保證有效性的同時(shí)能夠?qū)?shí)驗(yàn)結(jié)果提供很好的解釋。
【圖文】:
重慶大學(xué)碩士學(xué)位論文 1 緒 論1 緒 論1.1研究背景及意義1.1.1 研究背景中國互聯(lián)網(wǎng)絡(luò)信息中心(CNNIC)2016 年 1 月發(fā)布了《第 37 次中國互聯(lián)網(wǎng)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告》[1],報(bào)告顯示,2015 年新增網(wǎng)民近四千萬人,如今網(wǎng)民規(guī)模已達(dá) 6.88 億,互聯(lián)網(wǎng)普及率已超過百分之五十,較 2014 年底提升了 2.4 個(gè)百分點(diǎn)。如圖 1.1 所示。
品進(jìn)行改進(jìn)和提升,從而提高產(chǎn)品在市場中的競爭力;用戶通過評(píng)論可以快速對(duì)產(chǎn)品各個(gè)方面有所了解,并且通過產(chǎn)品的性能評(píng)價(jià)對(duì)比,為用戶購物決策帶來方便。此外,也有商家利用評(píng)論信息對(duì)消費(fèi)者進(jìn)行誤導(dǎo),通過發(fā)表垃圾評(píng)論信息推廣自己的產(chǎn)品或詆毀競爭對(duì)手的產(chǎn)品;同時(shí),消費(fèi)者所發(fā)表的評(píng)論信息質(zhì)量良莠不齊,不同用戶也會(huì)關(guān)注產(chǎn)品不同方面的特性,于是產(chǎn)生了信息洪災(zāi),使用戶難以便捷地獲取對(duì)自己有用的評(píng)論數(shù)據(jù),也難以辨別評(píng)論內(nèi)容的可信度。這就需要一種有效合理的方法對(duì)海量評(píng)論信息進(jìn)行挖掘和分析,進(jìn)而有效地對(duì)評(píng)論進(jìn)行組織。目前,電商網(wǎng)站大都提供兩種評(píng)論組織方式,即評(píng)論排序和評(píng)論摘要。評(píng)論排序用于將評(píng)論按照某種順序進(jìn)行列表展示,,許多網(wǎng)站基于時(shí)間和有用投票率兩種方式對(duì)評(píng)論進(jìn)行排序顯示,但效果并不理想。林煜明等提到,按時(shí)間排序可能會(huì)使得許多高質(zhì)量的評(píng)論排序靠后,且不能識(shí)別垃圾評(píng)論,評(píng)論質(zhì)量難以保證;而按有用性得票率排序則可能存在得票不公平的問題,因?yàn)橛脩舾鼉A向于投有用的票,且新產(chǎn)生的評(píng)論投票較少難以區(qū)分[3]。 如此,“評(píng)論挖掘”技術(shù)應(yīng)運(yùn)而生。
【學(xué)位授予單位】:重慶大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:TP391.1
本文編號(hào):2551060
【圖文】:
重慶大學(xué)碩士學(xué)位論文 1 緒 論1 緒 論1.1研究背景及意義1.1.1 研究背景中國互聯(lián)網(wǎng)絡(luò)信息中心(CNNIC)2016 年 1 月發(fā)布了《第 37 次中國互聯(lián)網(wǎng)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告》[1],報(bào)告顯示,2015 年新增網(wǎng)民近四千萬人,如今網(wǎng)民規(guī)模已達(dá) 6.88 億,互聯(lián)網(wǎng)普及率已超過百分之五十,較 2014 年底提升了 2.4 個(gè)百分點(diǎn)。如圖 1.1 所示。
品進(jìn)行改進(jìn)和提升,從而提高產(chǎn)品在市場中的競爭力;用戶通過評(píng)論可以快速對(duì)產(chǎn)品各個(gè)方面有所了解,并且通過產(chǎn)品的性能評(píng)價(jià)對(duì)比,為用戶購物決策帶來方便。此外,也有商家利用評(píng)論信息對(duì)消費(fèi)者進(jìn)行誤導(dǎo),通過發(fā)表垃圾評(píng)論信息推廣自己的產(chǎn)品或詆毀競爭對(duì)手的產(chǎn)品;同時(shí),消費(fèi)者所發(fā)表的評(píng)論信息質(zhì)量良莠不齊,不同用戶也會(huì)關(guān)注產(chǎn)品不同方面的特性,于是產(chǎn)生了信息洪災(zāi),使用戶難以便捷地獲取對(duì)自己有用的評(píng)論數(shù)據(jù),也難以辨別評(píng)論內(nèi)容的可信度。這就需要一種有效合理的方法對(duì)海量評(píng)論信息進(jìn)行挖掘和分析,進(jìn)而有效地對(duì)評(píng)論進(jìn)行組織。目前,電商網(wǎng)站大都提供兩種評(píng)論組織方式,即評(píng)論排序和評(píng)論摘要。評(píng)論排序用于將評(píng)論按照某種順序進(jìn)行列表展示,,許多網(wǎng)站基于時(shí)間和有用投票率兩種方式對(duì)評(píng)論進(jìn)行排序顯示,但效果并不理想。林煜明等提到,按時(shí)間排序可能會(huì)使得許多高質(zhì)量的評(píng)論排序靠后,且不能識(shí)別垃圾評(píng)論,評(píng)論質(zhì)量難以保證;而按有用性得票率排序則可能存在得票不公平的問題,因?yàn)橛脩舾鼉A向于投有用的票,且新產(chǎn)生的評(píng)論投票較少難以區(qū)分[3]。 如此,“評(píng)論挖掘”技術(shù)應(yīng)運(yùn)而生。
【學(xué)位授予單位】:重慶大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:TP391.1
【參考文獻(xiàn)】
相關(guān)期刊論文 前6條
1 周紅慶;吳揚(yáng)揚(yáng);;中文客戶評(píng)論對(duì)象特征的抽取與聚類方法[J];微型機(jī)與應(yīng)用;2014年15期
2 黃婷婷;曾國蓀;熊煥亮;;基于商品特征關(guān)聯(lián)度的購物客戶評(píng)論可信排序方法[J];計(jì)算機(jī)應(yīng)用;2014年08期
3 靳健;季平;;用于在線產(chǎn)品評(píng)論質(zhì)量分析的Co-training算法[J];上海大學(xué)學(xué)報(bào)(自然科學(xué)版);2014年03期
4 林煜明;王曉玲;朱濤;周傲英;;用戶評(píng)論的質(zhì)量檢測與控制研究綜述[J];軟件學(xué)報(bào);2014年03期
5 扈中凱;鄭小林;吳亞峰;陳德人;;基于用戶評(píng)論挖掘的產(chǎn)品推薦算法[J];浙江大學(xué)學(xué)報(bào)(工學(xué)版);2013年08期
6 劉海濤;依存語法和機(jī)器翻譯[J];語言文字應(yīng)用;1997年03期
本文編號(hào):2551060
本文鏈接:http://www.sikaile.net/jingjilunwen/dianzishangwulunwen/2551060.html
最近更新
教材專著