基于評(píng)論挖掘的跨域推薦問(wèn)題研究
發(fā)布時(shí)間:2018-02-13 04:13
本文關(guān)鍵詞: 跨領(lǐng)域推薦 聯(lián)合張量分解 細(xì)粒度偏好遷移 張量稀疏問(wèn)題的緩解 出處:《山東大學(xué)》2017年碩士論文 論文類(lèi)型:學(xué)位論文
【摘要】:近年來(lái),蓬勃發(fā)展的在線(xiàn)商品評(píng)論網(wǎng)站給廣大用戶(hù)帶來(lái)了極大便利,同時(shí)用戶(hù)也留下了大量的偏好信息。在線(xiàn)商家通過(guò)這些偏好信息,了解用戶(hù)興趣,為其推薦商品,由此,推薦系統(tǒng)應(yīng)運(yùn)而生。推薦系統(tǒng)將用戶(hù)表現(xiàn)出的偏好信息進(jìn)行合理的運(yùn)算,預(yù)測(cè)出用戶(hù)可能喜歡的商品,供用戶(hù)參考。這已被廣泛應(yīng)用于各大在線(xiàn)商品評(píng)論網(wǎng)站中,如Amazon,eBay,Taobao,JD.com等,取得了極大成功。然而,直到如今,新用戶(hù)的冷啟動(dòng)問(wèn)題仍然是推薦系統(tǒng)中的一個(gè)不可忽視的重要挑戰(zhàn)。對(duì)此,跨領(lǐng)域推薦(以下簡(jiǎn)稱(chēng)"跨域推薦")作為一種有效的解決思路,正在引起越來(lái)越多研究者的關(guān)注?缬蛲扑]旨在利用知識(shí)遷移的策略,將一個(gè)相對(duì)稠密域的用戶(hù)偏好遷移到相對(duì)稀疏的目標(biāo)域中,用以輔助解決目標(biāo)域的冷啟動(dòng)問(wèn)題,F(xiàn)今的跨域推薦工作絕大多數(shù)利用的是用戶(hù)對(duì)商品的評(píng)分,而實(shí)際上,評(píng)論文本之類(lèi)的文本信息蘊(yùn)含著更為豐富的用戶(hù)偏好,這是已有工作往往所忽視的。在評(píng)論中,用戶(hù)往往會(huì)表達(dá)出對(duì)商品在更細(xì)粒度上的喜惡,合理利用這些細(xì)粒度的情感偏好,將大大有助于提高跨域推薦的準(zhǔn)確度。例如,對(duì)于一部手機(jī),一個(gè)用戶(hù)的評(píng)論可以向我們展現(xiàn)出他對(duì)"屏幕"的看法或者對(duì)"電池"的看法,這比僅利用評(píng)分精確得多。基于此,本文研究如何有效利用評(píng)論中的細(xì)粒度用戶(hù)偏好進(jìn)行跨域推薦。由于評(píng)論中的偏好信息是雜亂無(wú)章的,所以利用評(píng)論中的細(xì)粒度偏好進(jìn)行跨域推薦相比僅利用評(píng)分等數(shù)據(jù)更為復(fù)雜。其中包含兩個(gè)挑戰(zhàn):第一,如何建模用戶(hù)在評(píng)論中的細(xì)粒度偏好來(lái)適應(yīng)知識(shí)遷移的需要?第二,如何有效地進(jìn)行基于評(píng)論的知識(shí)遷移?本文對(duì)此進(jìn)行了較為深入的研究,提出了一個(gè)比較完整的解決框架,包含了一系列比較復(fù)雜的問(wèn)題。具體工作和貢獻(xiàn)概括如下:1.針對(duì)跨域框架中細(xì)粒度偏好的建模問(wèn)題,本文將"方面"這一層級(jí)引入框架中,并且分別用"評(píng)價(jià)值張量"和"關(guān)注度張量"去建模用戶(hù)偏好。從評(píng)論中提取用戶(hù)的細(xì)粒度情感偏好,本文使用"用戶(hù)-商品-方面"這種三元關(guān)系來(lái)組織。對(duì)于這種三元關(guān)系,本文使用三維張量(third-ordertensor,以下簡(jiǎn)稱(chēng)"張量")進(jìn)行建模。在張量中,每一個(gè)元素記錄某用戶(hù)對(duì)某商品在某"方面"上的情感程度。這種建模方式在跨域推薦中的優(yōu)勢(shì)在于:第一,可以將評(píng)論中雜亂無(wú)章的用戶(hù)偏好組織成便于運(yùn)算的結(jié)構(gòu)化數(shù)據(jù),便于實(shí)現(xiàn)兩域數(shù)據(jù)的對(duì)接;第二,將"方面"作為一個(gè)獨(dú)立的維度,便于捕捉兩個(gè)不同域中"方面"的聯(lián)系,使得"方面"這一層級(jí)的作用在跨域推薦中得以充分發(fā)揮。引入"方面"層級(jí)后,為解決用戶(hù)對(duì)商品在各"方面"上的情感偏好與對(duì)商品的整體偏好之間的關(guān)系問(wèn)題,本文基于"一個(gè)用戶(hù)對(duì)某商品在其更為關(guān)注的方面上的評(píng)價(jià)將更大地影響該用戶(hù)對(duì)該商品的整體評(píng)價(jià)"這一思想,在每個(gè)域中建模"評(píng)價(jià)值張量"和"關(guān)注度張量"。2.針對(duì)細(xì)粒度知識(shí)的跨域遷移問(wèn)題,本文首次提出了一種基于評(píng)論的聯(lián)合張量分解模型(Review Based Joint Tensor Factorization,RB-JTF),并將其應(yīng)用于跨域推薦框架中。RB-JTF模型通過(guò)將輔助域張量和目標(biāo)域張量進(jìn)行聯(lián)合地分解來(lái)實(shí)現(xiàn)知識(shí)遷移。怎樣通過(guò)聯(lián)合地分解兩個(gè)不同域的張量來(lái)跨域遷移知識(shí)這個(gè)問(wèn)題在目前來(lái)說(shuō)仍然沒(méi)有被很好地解決,是一個(gè)重要挑戰(zhàn)。在RB-JTF中,首先兩個(gè)張量均被分解為三個(gè)因子矩陣,分別為用戶(hù),商品和"方面"的潛在特征矩陣。然后,RB-JTF的知識(shí)遷移策略包括兩個(gè)部分:第一,使用戶(hù)的潛在特征在輔助域和目標(biāo)域中實(shí)現(xiàn)共享;第二,捕捉兩個(gè)域中"方面"的聯(lián)系并將其融入知識(shí)遷移模型,首先度量?jī)蓚(gè)"方面"的語(yǔ)義相似度,然后根據(jù)語(yǔ)義相似度對(duì)"方面"的潛在特征的距離給予不同程度的約束,實(shí)現(xiàn)"方面"潛在特征的遷移。本文給出了 RB-JTF模型的目標(biāo)函數(shù),并且使用非線(xiàn)性共軛梯度法對(duì)因子矩陣進(jìn)行學(xué)習(xí),并分析了算法的時(shí)間復(fù)雜性。不同于以往的跨域推薦模型,RB-JTF預(yù)測(cè)的是"方面"這個(gè)層級(jí)的偏好,為了將預(yù)測(cè)的用戶(hù)對(duì)商品各方面的評(píng)價(jià)轉(zhuǎn)化為對(duì)這件商品整體的評(píng)價(jià),本文分別在評(píng)價(jià)值張量和關(guān)注度張量上進(jìn)行知識(shí)的跨域遷移。另外,針對(duì)張量的稀疏問(wèn)題,本文提出了緩解策略,通過(guò)預(yù)估張量中的部分元素以及其可靠度,進(jìn)一步提高聯(lián)合張量分解模型的準(zhǔn)確度。3.本文在Amazon.com數(shù)據(jù)集上驗(yàn)證了本文所提出的基于評(píng)論挖掘的跨域推薦框架的有效性。本文設(shè)計(jì)了兩組跨域組合,分別是"電影-圖書(shū)"和"電影-音樂(lè)",通過(guò)實(shí)驗(yàn)顯示,基于評(píng)論挖掘的聯(lián)合張量分解模型在RMSE和MAE兩個(gè)指標(biāo)上均優(yōu)于各基線(xiàn)方法,尤其是對(duì)于目標(biāo)域中的冷啟動(dòng)用戶(hù)。此外,實(shí)驗(yàn)還進(jìn)行了重要參數(shù)的影響分析,訓(xùn)練算法的迭代分析以及張量稀疏問(wèn)題緩解策略效果分析等。
[Abstract]:......
【學(xué)位授予單位】:山東大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2017
【分類(lèi)號(hào)】:TP391.3
【參考文獻(xiàn)】
相關(guān)期刊論文 前2條
1 鄒本友;李翠平;譚力文;陳紅;王紹卿;;基于用戶(hù)信任和張量分解的社會(huì)網(wǎng)絡(luò)推薦[J];軟件學(xué)報(bào);2014年12期
2 羅浩;高升;徐蔚然;;基于個(gè)性信息的跨域推薦算法[J];軟件;2013年12期
,本文編號(hào):1507291
本文鏈接:http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/1507291.html
最近更新
教材專(zhuān)著