天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 自動化論文 >

基于網(wǎng)絡行為的用戶畫像算法研究

發(fā)布時間:2021-05-24 07:12
  伴隨著整個社會對互聯(lián)網(wǎng)、特別是移動互聯(lián)網(wǎng)的廣泛接受,用戶產(chǎn)生數(shù)據(jù)呈現(xiàn)爆發(fā)式增長。我們每天都會在網(wǎng)絡上留下大量的行為數(shù)據(jù),比如查詢詞、網(wǎng)頁訪問記錄等,這些數(shù)據(jù)類型豐富、時效性強,為分析用戶的愛好習慣及個人屬性信息、構(gòu)建用戶畫像模型,提供了充足的數(shù)據(jù)資源。用戶畫像是企業(yè)大數(shù)據(jù)的基礎(chǔ),充分利用用戶行為記錄數(shù)據(jù),刻畫出用戶屬性信息全貌,高效地構(gòu)建用戶畫像,將有利于企業(yè)實現(xiàn)精準營銷及個性化服務。傳統(tǒng)人工給用戶畫像打標簽的效率較低,所以借助算法模型來預測標簽成為用戶畫像的一個熱門研究方向。但是目前主流的機器學習算法未能深入挖掘特征間的復雜關(guān)系,在高維、稀疏特征時預測效果仍不盡人意,還存在較大提升空間。而混合算法往往能結(jié)合各算法的優(yōu)點,一定程度上克服缺陷,提高預測精度。針對用戶的查詢記錄數(shù)據(jù),為了實現(xiàn)用戶多維人口屬性標簽的預測任務,對用戶畫像構(gòu)建方法進行了深入研究,研究工作總結(jié)如下:1)提出了一種基于隨機森林算法的二層集成學習框架。在第一層模型中,基于6種傳統(tǒng)的機器學習算法來作為用戶查詢詞特征提取器,并與用戶的數(shù)字特征相融合,作為第二層模型的輸入;在第二層模型中,使用隨機森林算法作為分類器,采用不同... 

【文章來源】:廣東技術(shù)師范大學廣東省

【文章頁數(shù)】:60 頁

【學位級別】:碩士

【文章目錄】:
摘要
Abstract
1 緒論
    1.1 研究背景
    1.2 研究意義
    1.3 用戶網(wǎng)絡行為畫像研究現(xiàn)狀
    1.4 論文研究內(nèi)容及結(jié)構(gòu)
2 相關(guān)理論技術(shù)及模型
    2.1 用戶畫像基礎(chǔ)
        2.1.1 用戶畫像信息來源
        2.1.2 用戶畫像常用模型
    2.2 文本向量化常用模型
        2.2.1 TF-IDF模型
        2.2.2 詞向量模型
        2.2.3 文檔向量模型
    2.3 集成學習
        2.3.1 Bagging算法
        2.3.2 Boosting算法
        2.3.3 Stacking算法
    2.4 本章小結(jié)
3 基于隨機森林算法的用戶畫像構(gòu)建
    3.1 引言
    3.2 算法介紹
        3.2.1 邏輯回歸算法
        3.2.2 支持向量機算法
        3.2.3 樸素貝葉斯算法
        3.2.4 主題模型
        3.2.5 隨機森林算法
        3.2.6 基于隨機森林算法的用戶畫像算法框架
    3.3 實驗結(jié)果與分析
        3.3.1 實驗環(huán)境及工具
        3.3.2 數(shù)據(jù)集
        3.3.3 預處理
        3.3.4 對比方法
        3.3.5 參數(shù)選擇
        3.3.6 實驗結(jié)果
    3.4 本章小結(jié)
4 基于XGBoost算法的用戶畫像算法框架
    4.1 引言
    4.2 算法介紹
        4.2.1 BPDM(BPNN based Doc2Vec Model)
        4.2.2 XGBoost算法
        4.2.3 基于XGBoost算法的用戶畫像算法框架
    4.3 實驗結(jié)果與分析
        4.3.1 實驗環(huán)境及工具
        4.3.2 數(shù)據(jù)集
        4.3.3 對比方法
        4.3.4 參數(shù)選擇
        4.3.5 實驗結(jié)果
    4.4 本章小結(jié)
5 總結(jié)與展望
    5.1 全文總結(jié)
    5.2 未來展望
參考文獻
致謝
攻讀碩士學位期間取得的研究成果
學位論文數(shù)據(jù)集表


【參考文獻】:
期刊論文
[1]基于樸素貝葉斯的農(nóng)業(yè)文本分類方法研究[J]. 趙燕,李曉輝,周云成,張越.  節(jié)水灌溉. 2018(02)
[2]貝葉斯網(wǎng)絡在用戶畫像構(gòu)建中的研究[J]. 張小可,沈文明,杜翠鳳.  移動通信. 2016(22)
[3]基于大數(shù)據(jù)的個人信用風險評估關(guān)鍵技術(shù)研究[J]. 林漢川,張萬軍,楊柳.  管理現(xiàn)代化. 2016(02)
[4]手機用戶畫像在大數(shù)據(jù)平臺的實現(xiàn)方案[J]. 張慷.  信息通信. 2014(02)
[5]人類行為的動力學與統(tǒng)計力學研究[J]. 汪秉宏,韓筱璞.  物理. 2010(01)

博士論文
[1]基于社交大數(shù)據(jù)的用戶信用畫像方法研究[D]. 郭光明.中國科學技術(shù)大學 2017
[2]面向個性化服務的User Profile研究及應用[D]. 杜卿.華南理工大學 2014
[3]在線社會網(wǎng)絡用戶行為模型與應用算法研究[D]. 肖云鵬.北京郵電大學 2013
[4]網(wǎng)絡用戶行為分析的若干問題研究[D]. 劉鵬.北京郵電大學 2010

碩士論文
[1]基于Web日志的用戶行為大數(shù)據(jù)分析[D]. 宋芷萱.沈陽師范大學 2018
[2]基于深度神經(jīng)網(wǎng)絡的用戶畫像研究[D]. 周妹璇.湖南大學 2018
[3]用戶畫像構(gòu)建中知識表示與模型融合研究[D]. 李恒超.大連理工大學 2017
[4]基于集成SVM的文本分類方法研究[D]. 游攀利.華中科技大學 2014
[5]人機交互中用戶建模方法的研究[D]. 李榮.南京師范大學 2004



本文編號:3203782

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/zidonghuakongzhilunwen/3203782.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶b39db***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com