天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

行為序列模式識(shí)別在泛娛樂(lè)平臺(tái)用戶興趣發(fā)現(xiàn)中的應(yīng)用

發(fā)布時(shí)間:2020-08-08 22:00
【摘要】:泛娛樂(lè)是現(xiàn)階段互聯(lián)網(wǎng)發(fā)展的重要特征之一,移動(dòng)互聯(lián)網(wǎng)泛娛樂(lè)化的趨勢(shì),激活了用戶固有的、旺盛的娛樂(lè)社交需求。用戶在產(chǎn)品使用過(guò)程中產(chǎn)生了大量日志,包含了一切行為的時(shí)間、地點(diǎn)、內(nèi)容、互動(dòng)、消費(fèi)等信息,企業(yè)如何充分利用用戶在其產(chǎn)品上留下的海量日志,運(yùn)用數(shù)據(jù)挖掘技術(shù),對(duì)用戶進(jìn)行深刻洞察,挖掘用戶屬性,揣摩用戶的喜好,提取出對(duì)企業(yè)有價(jià)值的信息,以實(shí)現(xiàn)平臺(tái)效益的最大化,也成為了工業(yè)界和學(xué)術(shù)界一個(gè)熱點(diǎn)研究話題。帶有時(shí)序信息的行為日志,又稱(chēng)為行為路徑,蘊(yùn)含了用戶跳轉(zhuǎn)習(xí)慣、路徑偏好等有價(jià)值的信息,為了引導(dǎo)用戶持續(xù)深入體驗(yàn)產(chǎn)品的價(jià)值,最大限度的激發(fā)用戶興趣,互聯(lián)網(wǎng)行業(yè)普遍采用用戶行為路徑分析方法,該方法又可以稱(chēng)為行為序列模式挖掘,是一種將序列挖掘技術(shù)與用戶行為路徑相結(jié)合,探索行為規(guī)律,發(fā)現(xiàn)興趣模式,從而獲知產(chǎn)品使用情況,找到優(yōu)化方向的分析方法。本文積極探索了行為序列模式識(shí)別技術(shù)在用戶興趣發(fā)現(xiàn)中的應(yīng)用,從挖掘偏好路徑、提取關(guān)鍵功能點(diǎn)、分析低活躍用戶特征三個(gè)角度,構(gòu)建了一個(gè)多層次用戶興趣分析體系,并以某泛娛樂(lè)平臺(tái)的用戶真實(shí)行為數(shù)據(jù)為基礎(chǔ),通過(guò)實(shí)驗(yàn),論證了該體系的可行性,具體工作如下。首先提出了有效行為和有效序列的概念,并據(jù)此完成了數(shù)據(jù)清洗和整理,形成了供后續(xù)分析的基礎(chǔ)數(shù)據(jù),然后從序列長(zhǎng)度、行為種類(lèi)等角度進(jìn)行了基本的數(shù)據(jù)探索和特征分析。其次,基于隱馬爾可夫模型的參數(shù)估計(jì)問(wèn)題,設(shè)計(jì)實(shí)驗(yàn),進(jìn)行了用戶興趣模式的挖掘。實(shí)驗(yàn)根據(jù)序列長(zhǎng)度將基礎(chǔ)數(shù)據(jù)進(jìn)行了分組,并且為了保證模型科學(xué)訓(xùn)練,不被分布差異過(guò)大的數(shù)據(jù)所誤導(dǎo),本文還提出了針對(duì)性的分層采樣方案。在結(jié)果評(píng)估階段,基于已知行為所屬場(chǎng)景天然屬于隱藏狀態(tài)的事實(shí),設(shè)計(jì)出了隱藏狀態(tài)準(zhǔn)確率的指標(biāo),利用該指標(biāo)挑選出了較優(yōu)模型,進(jìn)而模擬出最可能的行為路徑,從這些模擬的路徑中發(fā)現(xiàn)出了用戶的路徑偏好規(guī)律,并說(shuō)明了這些模擬序列在興趣發(fā)現(xiàn)中的實(shí)際指導(dǎo)意義。然后,為了解決泛娛樂(lè)平臺(tái)中重要功能的發(fā)現(xiàn)問(wèn)題,本文基于數(shù)學(xué)領(lǐng)域中圖論的思想,提出了以行為為節(jié)點(diǎn),以行為的跳轉(zhuǎn)關(guān)系為邊構(gòu)建圖的方案,將問(wèn)題抽象成為圖論中的關(guān)鍵節(jié)點(diǎn)發(fā)現(xiàn)問(wèn)題。在關(guān)鍵節(jié)點(diǎn)發(fā)現(xiàn)的方案中,選用了三種從不同角度刻畫(huà)節(jié)點(diǎn)重要性的指標(biāo)。在實(shí)驗(yàn)分析階段,利用不同序列長(zhǎng)度的分組數(shù)據(jù),分別進(jìn)行了圖形的構(gòu)建和關(guān)鍵節(jié)點(diǎn)的發(fā)現(xiàn),并在每個(gè)指標(biāo)下得出了頭部的結(jié)果,通過(guò)對(duì)比不同組別和不同指標(biāo)的結(jié)果,給出了對(duì)系統(tǒng)起到重要作用的功能,并針對(duì)這個(gè)結(jié)果對(duì)產(chǎn)品提出了優(yōu)化建議,證明了該場(chǎng)景下圖模型的可行性。最后,聚焦于泛娛樂(lè)生態(tài)促活問(wèn)題,設(shè)計(jì)了對(duì)比實(shí)驗(yàn),將平臺(tái)的低活躍用戶和高活躍用戶的行為序列進(jìn)行對(duì)比,以高活躍的數(shù)據(jù)指標(biāo)作為參考,觀察指標(biāo)為界面跳出率和界面退出率,提出了用于衡量?jī)山M數(shù)據(jù)差異度的指標(biāo)比例差值。針對(duì)跳出率和退出率,選取比例差值大于閾值的行為界面作為實(shí)驗(yàn)結(jié)果。然后從實(shí)際業(yè)務(wù)出發(fā),解釋了這些界面對(duì)用戶流失造成了哪些具體的影響,并給出了優(yōu)化方案,最后還提出了其他針對(duì)性的的促活建議。
【學(xué)位授予單位】:對(duì)外經(jīng)濟(jì)貿(mào)易大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2019
【分類(lèi)號(hào)】:TP393.09;O211.61
【圖文】:

領(lǐng)域,社交,移動(dòng)互聯(lián)網(wǎng)


第 1 章 引言1.1 研究背景隨著移動(dòng)互聯(lián)網(wǎng)技術(shù)的高速發(fā)展和大眾對(duì)娛樂(lè)的需求日趨多元化,手機(jī) App領(lǐng)域涌現(xiàn)出了很多綜合性泛娛樂(lè)平臺(tái),它們集游戲、視頻、社交、電商等功能為一體,旨在打造一個(gè)內(nèi)容多樣,用戶粘性較高的大生態(tài)?梢哉f(shuō),泛娛樂(lè)是現(xiàn)階段互聯(lián)網(wǎng)發(fā)展的重要特征之一,圖 1.1 是易觀(一家中國(guó)大數(shù)據(jù)公司)在《2018網(wǎng)絡(luò)社交泛娛樂(lè)化新趨勢(shì)專(zhuān)題分析》中關(guān)于泛娛樂(lè)影響力的數(shù)據(jù)展示,可以看到,社交、視頻等泛娛樂(lè)應(yīng)用相較于其他應(yīng)用,明顯具有更多的活躍用戶,且在最受歡迎的社交網(wǎng)絡(luò)領(lǐng)域,單 2 月用戶使用時(shí)長(zhǎng)就超過(guò)了 300 億小時(shí)。說(shuō)明整個(gè)移動(dòng)互聯(lián)網(wǎng)泛娛樂(lè)化趨勢(shì),確實(shí)是激活了用戶固有的、旺盛的娛樂(lè)社交需求。

論文結(jié)構(gòu)


作為后續(xù)研究?jī)?nèi)容的基礎(chǔ),介紹論文研究數(shù)據(jù)基于真實(shí)的用戶數(shù)據(jù),說(shuō)明了日志采集手段,序列的建立方式,解釋了各字段含義,并對(duì)數(shù)據(jù)進(jìn)行了探索,分析了關(guān)鍵特征的分布。第三章,用戶興趣模式發(fā)現(xiàn),主要介紹了用戶行為序列分析模型 HMM,說(shuō)明其基本理論及優(yōu)化算法,之后進(jìn)行了實(shí)驗(yàn),訓(xùn)練出最佳模型,并推演出了有意義的行為序列。用結(jié)果驗(yàn)證了該模型在興趣模式發(fā)現(xiàn)中的可行性和有效性。第四章,關(guān)鍵功能點(diǎn)提取,主要介紹了圖論領(lǐng)域的相關(guān)理論,定義了節(jié)點(diǎn)發(fā)現(xiàn)指標(biāo),之后進(jìn)行了分組實(shí)驗(yàn),從結(jié)果對(duì)比中,提煉出了關(guān)鍵行為節(jié)點(diǎn),驗(yàn)證了圖論在行為節(jié)點(diǎn)發(fā)現(xiàn)中的可行性及有效性,并依據(jù)實(shí)驗(yàn)結(jié)果給出了節(jié)點(diǎn)優(yōu)化建議。第五章,用戶促活問(wèn)題探討,針對(duì)活躍度較低的用戶,定義關(guān)鍵指標(biāo),比較其與高活躍用戶差異較大的地方,并進(jìn)行了實(shí)驗(yàn)分析,依據(jù)實(shí)驗(yàn)結(jié)果提出了有針對(duì)性的用戶促活方案。第六章,對(duì)全文工作進(jìn)行了總結(jié),指出了本文的一些不足之處,并對(duì)未來(lái)工作進(jìn)行了展望。

序列,序列數(shù),行為,種類(lèi)分布


圖 2.1 序列長(zhǎng)度分布2.3.2 行為種類(lèi)分布序列是由行為構(gòu)成的,行為種類(lèi)分布的意思是,對(duì)于某種行為,它出現(xiàn)在了多少條序列中,包含它的的序列數(shù)量越多,就代表它被訪問(wèn)的越普遍,越高頻。圖 2.2 比較了包含不同行為種類(lèi)的序列數(shù),從中可以看出<看他人資料,發(fā)個(gè)人消息,看他人動(dòng)態(tài),動(dòng)態(tài)詳情>屬于高頻高覆蓋的幾種行為,大部分的序列都包含這些行為,而包含其他的行為的序列數(shù)量相對(duì)較少,為了使研究能覆蓋到全部的行為,后續(xù)的研究過(guò)程要注意這個(gè)特點(diǎn)。

【參考文獻(xiàn)】

相關(guān)期刊論文 前5條

1 丁振國(guó);宋薇;李婧;;基于序列模式挖掘的社交網(wǎng)絡(luò)用戶行為分析[J];現(xiàn)代情報(bào);2013年03期

2 孫秀娟;金民鎖;陳孝國(guó);;基于隱馬爾科夫模型的瀏覽興趣預(yù)測(cè)[J];科技導(dǎo)報(bào);2009年18期

3 褚紅丹;焦素云;馬威;;用戶訪問(wèn)興趣路徑挖掘方法[J];計(jì)算機(jī)工程與應(yīng)用;2008年35期

4 夏明波;王曉川;孫永強(qiáng);金士堯;;序列模式挖掘算法研究[J];計(jì)算機(jī)技術(shù)與發(fā)展;2006年04期

5 邢東山,沈鈞毅,宋擒豹;從Web日志中挖掘用戶瀏覽偏愛(ài)路徑[J];計(jì)算機(jī)學(xué)報(bào);2003年11期

相關(guān)博士學(xué)位論文 前1條

1 陸海霞;線上評(píng)論感知有用性對(duì)購(gòu)買(mǎi)意愿變化和購(gòu)買(mǎi)行為的影響研究[D];吉林大學(xué);2016年

相關(guān)碩士學(xué)位論文 前5條

1 林布鍇;MOOCs用戶閱讀行為的頻繁模式挖掘的研究及應(yīng)用[D];廣東工業(yè)大學(xué);2017年

2 馮路;海量用戶行為序列中的模式發(fā)現(xiàn)及應(yīng)用[D];電子科技大學(xué);2017年

3 楊宇佳;基于序列模式挖掘的移動(dòng)應(yīng)用使用預(yù)測(cè)研究[D];浙江大學(xué);2016年

4 肖揚(yáng);序列挖掘算法研究及其在用戶行為分析中的應(yīng)用[D];北京郵電大學(xué);2014年

5 程光曦;SNS中用戶生成內(nèi)容和行為數(shù)據(jù)的分析與應(yīng)用[D];北京郵電大學(xué);2010年



本文編號(hào):2786168

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/guanlilunwen/ydhl/2786168.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶528cf***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com