基于地理標(biāo)簽和用戶評(píng)論情感分析的興趣點(diǎn)推薦模型
發(fā)布時(shí)間:2022-01-26 15:07
近些年,商品推薦模型越來(lái)越多的融入了用戶個(gè)人相關(guān)信息,這些信息有效的增強(qiáng)了用戶與商品之間的粘合度,提高了推薦的準(zhǔn)確度;谟脩粜畔⒌膫(gè)性化推薦算法已經(jīng)成為重點(diǎn)研究方向,針對(duì)于不同類別的用戶,推薦結(jié)果也呈現(xiàn)多樣性,其中基于地域劃分和情感分析的推薦方法逐漸體現(xiàn)出越來(lái)越重要的地位。地理區(qū)域的不同影響著用戶興趣的變化。同時(shí),時(shí)間因素對(duì)于評(píng)論情感的極性的變化有著一定的影響,進(jìn)而影響著用戶的抉擇,一些研究沒(méi)有著重考慮這些問(wèn)題。針對(duì)于上述問(wèn)題,本文的主要工作包括以下4點(diǎn):1.提出了基于地理標(biāo)簽和用戶評(píng)論情感分析的興趣點(diǎn)推薦模型(Point-of-Interest Recommendation Model Based on Geo-Tagging and Sentiment Analysis of User Reviews,GTSA),實(shí)現(xiàn)了用戶的本地和外地推薦。2.通過(guò)對(duì)興趣點(diǎn)內(nèi)容描述文本信息的擴(kuò)充,實(shí)現(xiàn)了興趣點(diǎn)之間相似性的度量,從而構(gòu)建出基于內(nèi)容的推薦模型。3.提出了一套對(duì)于無(wú)標(biāo)簽評(píng)論數(shù)據(jù)情感挖掘的方法,從而獲得興趣點(diǎn)評(píng)論的情感極性偏好,并將時(shí)間窗口和用戶評(píng)論的情感值結(jié)合,分析得出興趣點(diǎn)整體評(píng)論的...
【文章來(lái)源】:河北大學(xué)河北省
【文章頁(yè)數(shù)】:67 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
文章框架
第二章相關(guān)研究技術(shù)和基礎(chǔ)理論知識(shí)9圖2-1基于內(nèi)容的推薦圖2-1給出了CB方法的例子。該例子中以手機(jī)推薦為例,首先對(duì)手機(jī)進(jìn)行特征提取,圖中手機(jī)特征包括了品牌名稱、內(nèi)存大小,其他特征還包括手機(jī)屏幕的大孝處理器的類型和電池等等。本例中以前兩者為推薦依據(jù)。通過(guò)對(duì)用戶A的挖掘發(fā)現(xiàn),該用戶喜愛(ài)蘋果品牌,并且喜愛(ài)內(nèi)存大手機(jī),而手機(jī)D的特征與用戶A的喜好相符所以把手機(jī)D推薦給用戶A。同樣的,手機(jī)D的特征與用戶B和用戶C的喜好特點(diǎn)不相符,所以不會(huì)推薦給用戶B和C。CB方法其推薦過(guò)程大概包括3個(gè)步驟:1.根據(jù)每個(gè)商品的內(nèi)容描述信息抽取特征以此表示該商品;2.根據(jù)用戶的歷史記錄挖掘用戶的喜好特征;3.根據(jù)用戶的喜好特征,選擇商品集中與用戶喜好相似度高的商品推薦給用戶。CB方法有如下的優(yōu)點(diǎn):1.用戶與用戶之間是無(wú)關(guān)聯(lián)的:各個(gè)用戶的喜好特點(diǎn)是根據(jù)其歷史特性來(lái)獲得,因此與其他用戶是無(wú)關(guān)的,這一點(diǎn)與協(xié)同過(guò)濾算法(CollaborativeFiltering,CF)不同,CF算法需要利用其他用戶人的數(shù)據(jù)。CB方法的特點(diǎn)使得無(wú)論商家或用戶對(duì)商品如何造假,都不會(huì)改變用戶的個(gè)人興趣。2.可解釋性強(qiáng):當(dāng)系統(tǒng)給用戶推薦某一類商品時(shí),我們可以向用戶解釋,由于該商品符合用戶的潛在興趣,所以才會(huì)推薦給用戶。
第二章相關(guān)研究技術(shù)和基礎(chǔ)理論知識(shí)11圖2-2LDA模型對(duì)于文檔集中的每一篇文檔,其生成過(guò)程如圖2-3所示。圖2-3LDA生成過(guò)程以上對(duì)LDA做簡(jiǎn)要的敘述,接下來(lái)將簡(jiǎn)要介紹下LDA模型中涉及到的理論知識(shí)。2.3.1二項(xiàng)分布和Beta分布LDA的思想是基于貝葉斯模型的,貝葉斯模型涉及到先驗(yàn)分布、后驗(yàn)分布和似然函數(shù)。貝葉斯學(xué)派的思想:先驗(yàn)分布+似然=后驗(yàn)分布。對(duì)于似然函數(shù),可以用二項(xiàng)分布(BinomialDistribution)來(lái)表示如公式(2.1)所示:Binom(|,)(1)knknknpppk(2.1)其中的p代表擲硬幣正面朝上的次數(shù),n為擲硬幣的總次數(shù)。在貝葉斯學(xué)派中如果先驗(yàn)分布和后驗(yàn)分布屬于同一個(gè)分布,則稱先驗(yàn)分布和后驗(yàn)分布為共軛分布,并且先驗(yàn)分布稱為似然函數(shù)的共軛先驗(yàn)。Beta分布是BinomialDistribution的共軛分布,Beta分布的表達(dá)式如公式(2.2)所示:
【參考文獻(xiàn)】:
期刊論文
[1]LBSN中基于社區(qū)聯(lián)合聚類的協(xié)同推薦方法[J]. 龔衛(wèi)華,金蓉,裴小兵,梅建萍. 計(jì)算機(jī)研究與發(fā)展. 2019(11)
[2]一種基于矩陣分解的上下文感知POI推薦算法[J]. 彭宏偉,靳遠(yuǎn)遠(yuǎn),呂曉強(qiáng),王曉玲. 計(jì)算機(jī)學(xué)報(bào). 2019(08)
[3]基于位置社會(huì)網(wǎng)絡(luò)的雙重細(xì)粒度興趣點(diǎn)推薦[J]. 廖國(guó)瓊,姜珊,周志恒,萬(wàn)常選. 計(jì)算機(jī)研究與發(fā)展. 2017(11)
[4]一種改進(jìn)的偏好融合組推薦方法[J]. 胡川,孟祥武,張玉潔,杜雨露. 軟件學(xué)報(bào). 2018(10)
[5]基于用戶簽到行為的興趣點(diǎn)推薦[J]. 任星怡,宋美娜,宋俊德. 計(jì)算機(jī)學(xué)報(bào). 2017(01)
碩士論文
[1]基于地理社交因素和分類信息的地點(diǎn)推薦算法研究與實(shí)現(xiàn)[D]. 張朝輝.北京郵電大學(xué) 2018
[2]基于排序?qū)W習(xí)的興趣點(diǎn)推薦系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[D]. 申鵬.北京郵電大學(xué) 2018
本文編號(hào):3610701
【文章來(lái)源】:河北大學(xué)河北省
【文章頁(yè)數(shù)】:67 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
文章框架
第二章相關(guān)研究技術(shù)和基礎(chǔ)理論知識(shí)9圖2-1基于內(nèi)容的推薦圖2-1給出了CB方法的例子。該例子中以手機(jī)推薦為例,首先對(duì)手機(jī)進(jìn)行特征提取,圖中手機(jī)特征包括了品牌名稱、內(nèi)存大小,其他特征還包括手機(jī)屏幕的大孝處理器的類型和電池等等。本例中以前兩者為推薦依據(jù)。通過(guò)對(duì)用戶A的挖掘發(fā)現(xiàn),該用戶喜愛(ài)蘋果品牌,并且喜愛(ài)內(nèi)存大手機(jī),而手機(jī)D的特征與用戶A的喜好相符所以把手機(jī)D推薦給用戶A。同樣的,手機(jī)D的特征與用戶B和用戶C的喜好特點(diǎn)不相符,所以不會(huì)推薦給用戶B和C。CB方法其推薦過(guò)程大概包括3個(gè)步驟:1.根據(jù)每個(gè)商品的內(nèi)容描述信息抽取特征以此表示該商品;2.根據(jù)用戶的歷史記錄挖掘用戶的喜好特征;3.根據(jù)用戶的喜好特征,選擇商品集中與用戶喜好相似度高的商品推薦給用戶。CB方法有如下的優(yōu)點(diǎn):1.用戶與用戶之間是無(wú)關(guān)聯(lián)的:各個(gè)用戶的喜好特點(diǎn)是根據(jù)其歷史特性來(lái)獲得,因此與其他用戶是無(wú)關(guān)的,這一點(diǎn)與協(xié)同過(guò)濾算法(CollaborativeFiltering,CF)不同,CF算法需要利用其他用戶人的數(shù)據(jù)。CB方法的特點(diǎn)使得無(wú)論商家或用戶對(duì)商品如何造假,都不會(huì)改變用戶的個(gè)人興趣。2.可解釋性強(qiáng):當(dāng)系統(tǒng)給用戶推薦某一類商品時(shí),我們可以向用戶解釋,由于該商品符合用戶的潛在興趣,所以才會(huì)推薦給用戶。
第二章相關(guān)研究技術(shù)和基礎(chǔ)理論知識(shí)11圖2-2LDA模型對(duì)于文檔集中的每一篇文檔,其生成過(guò)程如圖2-3所示。圖2-3LDA生成過(guò)程以上對(duì)LDA做簡(jiǎn)要的敘述,接下來(lái)將簡(jiǎn)要介紹下LDA模型中涉及到的理論知識(shí)。2.3.1二項(xiàng)分布和Beta分布LDA的思想是基于貝葉斯模型的,貝葉斯模型涉及到先驗(yàn)分布、后驗(yàn)分布和似然函數(shù)。貝葉斯學(xué)派的思想:先驗(yàn)分布+似然=后驗(yàn)分布。對(duì)于似然函數(shù),可以用二項(xiàng)分布(BinomialDistribution)來(lái)表示如公式(2.1)所示:Binom(|,)(1)knknknpppk(2.1)其中的p代表擲硬幣正面朝上的次數(shù),n為擲硬幣的總次數(shù)。在貝葉斯學(xué)派中如果先驗(yàn)分布和后驗(yàn)分布屬于同一個(gè)分布,則稱先驗(yàn)分布和后驗(yàn)分布為共軛分布,并且先驗(yàn)分布稱為似然函數(shù)的共軛先驗(yàn)。Beta分布是BinomialDistribution的共軛分布,Beta分布的表達(dá)式如公式(2.2)所示:
【參考文獻(xiàn)】:
期刊論文
[1]LBSN中基于社區(qū)聯(lián)合聚類的協(xié)同推薦方法[J]. 龔衛(wèi)華,金蓉,裴小兵,梅建萍. 計(jì)算機(jī)研究與發(fā)展. 2019(11)
[2]一種基于矩陣分解的上下文感知POI推薦算法[J]. 彭宏偉,靳遠(yuǎn)遠(yuǎn),呂曉強(qiáng),王曉玲. 計(jì)算機(jī)學(xué)報(bào). 2019(08)
[3]基于位置社會(huì)網(wǎng)絡(luò)的雙重細(xì)粒度興趣點(diǎn)推薦[J]. 廖國(guó)瓊,姜珊,周志恒,萬(wàn)常選. 計(jì)算機(jī)研究與發(fā)展. 2017(11)
[4]一種改進(jìn)的偏好融合組推薦方法[J]. 胡川,孟祥武,張玉潔,杜雨露. 軟件學(xué)報(bào). 2018(10)
[5]基于用戶簽到行為的興趣點(diǎn)推薦[J]. 任星怡,宋美娜,宋俊德. 計(jì)算機(jī)學(xué)報(bào). 2017(01)
碩士論文
[1]基于地理社交因素和分類信息的地點(diǎn)推薦算法研究與實(shí)現(xiàn)[D]. 張朝輝.北京郵電大學(xué) 2018
[2]基于排序?qū)W習(xí)的興趣點(diǎn)推薦系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[D]. 申鵬.北京郵電大學(xué) 2018
本文編號(hào):3610701
本文鏈接:http://www.sikaile.net/kejilunwen/shengwushengchang/3610701.html
最近更新
教材專著