基于手機(jī)應(yīng)用日志的用戶基礎(chǔ)屬性預(yù)測
發(fā)布時(shí)間:2017-04-26 08:04
本文關(guān)鍵詞:基于手機(jī)應(yīng)用日志的用戶基礎(chǔ)屬性預(yù)測,,由筆耕文化傳播整理發(fā)布。
【摘要】:用戶基礎(chǔ)屬性信息,比如性別、年齡等,通常被認(rèn)為是用戶隱私信息,企業(yè)很難獲得,但是用戶基礎(chǔ)屬性信息在個(gè)性化服務(wù)、特定廣告投放、用戶行為分析和其他方面有著廣泛的應(yīng)用。本文針對(duì)上述問題,提出一種新穎的基于移動(dòng)用戶手機(jī)應(yīng)用軟件使用日志分析用戶基礎(chǔ)屬性預(yù)測方法。首先,本文從移動(dòng)用戶使用手機(jī)應(yīng)用的上網(wǎng)日志文件出發(fā),根據(jù)用戶訪問網(wǎng)頁的內(nèi)容提取頁面主題,從而得出用戶的訪問偏好和興趣主題,結(jié)合訪問記錄統(tǒng)計(jì)得出用戶訪問偏好矩陣并將用戶偏好矩陣作為用戶特征。其次結(jié)合用戶基礎(chǔ)屬性信息,分析了不同基礎(chǔ)屬性用戶群體訪問偏好特點(diǎn),找出了不同基礎(chǔ)屬性用戶群體之間訪問偏好的區(qū)別。然后采用常用的四種分類預(yù)測算法作為基礎(chǔ)算法,實(shí)現(xiàn)對(duì)用戶基礎(chǔ)屬性分類預(yù)測,探索性的研究了實(shí)驗(yàn)數(shù)據(jù)采集持續(xù)時(shí)間和采集樣本數(shù)量對(duì)預(yù)測結(jié)果的影響。發(fā)現(xiàn)當(dāng)實(shí)驗(yàn)數(shù)據(jù)采集持續(xù)時(shí)間為8周時(shí),四種常用的方法可以取得較穩(wěn)定的預(yù)測結(jié)果;而樣本采集數(shù)量對(duì)實(shí)驗(yàn)結(jié)果影響不是很大。最后結(jié)合用戶偏好矩陣隱性反饋信息,提出基于主題和用戶的協(xié)同優(yōu)化方法。本文采用實(shí)際用戶的真實(shí)數(shù)據(jù)對(duì)方法進(jìn)行驗(yàn)證,實(shí)驗(yàn)結(jié)果表明本文提出的預(yù)測算法在用戶性別基礎(chǔ)屬性預(yù)測中準(zhǔn)確率為81.21%,1F值為80.11%。對(duì)于用戶年齡和終端檔次多分類問題,本文提出的方法依然可以取得較好的預(yù)測結(jié)果,用戶終端檔次分類預(yù)測結(jié)果準(zhǔn)確率和1F值都高于71.82%,用戶年齡分類預(yù)測結(jié)果準(zhǔn)確率和1F值都高于64.39%。
【關(guān)鍵詞】:人口統(tǒng)計(jì)信息預(yù)測 智能手機(jī)應(yīng)用日志 用戶興趣模型 隱語義模型
【學(xué)位授予單位】:電子科技大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類號(hào)】:TP393.01;TN929.5
本文關(guān)鍵詞:基于手機(jī)應(yīng)用日志的用戶基礎(chǔ)屬性預(yù)測,由筆耕文化傳播整理發(fā)布。
本文編號(hào):328029
本文鏈接:http://www.sikaile.net/kejilunwen/wltx/328029.html
最近更新
教材專著