天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 軟件論文 >

基于用戶行為時(shí)序的聚類研究與實(shí)現(xiàn)

發(fā)布時(shí)間:2022-10-15 14:57
  網(wǎng)絡(luò)用戶隨時(shí)間變化的行為分析是近年來(lái)用戶行為分析的熱點(diǎn),通常為了發(fā)現(xiàn)用戶行為的特征需要對(duì)用戶做聚類處理。針對(duì)用戶時(shí)序數(shù)據(jù)的聚類問(wèn)題,現(xiàn)有研究方法存在計(jì)算性能差,距離度量不準(zhǔn)確的缺點(diǎn),無(wú)法處理大規(guī)模數(shù)據(jù)。為了解決上述問(wèn)題,本文研究了基于對(duì)稱KL距離的用戶行為時(shí)序聚類方法,同時(shí)采用分布式計(jì)算和MapReduce編程模型進(jìn)一步提高聚類運(yùn)算的計(jì)算效率,最終實(shí)現(xiàn)用戶行為時(shí)序的自動(dòng)聚類。本文主要的研究?jī)?nèi)容包括:(1)在現(xiàn)有時(shí)序聚類研究基礎(chǔ)上,針對(duì)網(wǎng)絡(luò)用戶時(shí)序數(shù)據(jù)的特點(diǎn),提出基于對(duì)稱KL距離的用戶行為時(shí)序聚類方法。KL距離描述的是對(duì)象在概率分布上的差異,能適應(yīng)數(shù)據(jù)的平移縮放等變形,擺脫傳統(tǒng)距離定義在幾何空間上的局限性,提高時(shí)間分布差異性描述的準(zhǔn)確性,實(shí)驗(yàn)結(jié)果證明,該算法相比采用歐式距離和DTW(Dynamic Time Warping,動(dòng)態(tài)時(shí)間歸整)距離度量的聚類算法能提高4%的準(zhǔn)確度,與采用medoids聚類質(zhì)心的聚類算法相比計(jì)算時(shí)間減少一個(gè)量級(jí);(2)面向?qū)嵕W(wǎng)環(huán)境,實(shí)現(xiàn)了海量用戶行為時(shí)序的分布式聚類;诜植际狡脚_(tái),設(shè)計(jì)并實(shí)現(xiàn)了網(wǎng)絡(luò)用戶行為數(shù)據(jù)時(shí)序化,最優(yōu)聚類數(shù)量自動(dòng)尋參,聚類映射關(guān)系特征化等關(guān)... 

【文章頁(yè)數(shù)】:73 頁(yè)

【學(xué)位級(jí)別】:碩士

【文章目錄】:
摘要
ABSTRACT
第一章 緒論
    1.1 課題研究背景與意義
    1.2 本文主要研究?jī)?nèi)容
    1.3 研究生期間工作
    1.4 論文組織結(jié)構(gòu)
    1.5 本章小結(jié)
第二章 時(shí)序聚類技術(shù)及大數(shù)據(jù)平臺(tái)綜述
    2.1 引言
    2.2 時(shí)序聚類技術(shù)綜述
        2.2.1 國(guó)內(nèi)外研究現(xiàn)狀
        2.2.2 時(shí)間序列聚類
    2.3 大數(shù)據(jù)平臺(tái)相關(guān)技術(shù)
        2.3.1 HDFS
        2.3.2 Hadoop Streaming
        2.3.3 MapReduce抽象編程
    2.4 本章小結(jié)
第三章 基于對(duì)稱KL距離的用戶行為時(shí)序聚類方法
    3.1 引言
    3.2 用戶時(shí)序概率模型
        3.2.1 時(shí)序概率模型表示
        3.2.2 對(duì)稱KL距離度量
    3.3 基于對(duì)稱KL距離的用戶行為時(shí)序聚類方法
        3.3.1 確定聚類質(zhì)心
        3.3.2 算法加速
        3.3.3 聚類算法
    3.4 仿真結(jié)果與討論
        3.4.1 評(píng)價(jià)指標(biāo)
        3.4.2 人工數(shù)據(jù)仿真結(jié)果與討論
        3.4.3 實(shí)際數(shù)據(jù)仿真結(jié)果與討論
    3.5 本章小結(jié)
第四章 基于用戶行為時(shí)序的分布式聚類實(shí)現(xiàn)
    4.1 引言
    4.2 基于用戶行為時(shí)序的分布式聚類實(shí)現(xiàn)框架
    4.3 模塊功能實(shí)現(xiàn)
        4.3.1 數(shù)據(jù)獲取與存儲(chǔ)
        4.3.2 預(yù)處理模塊
        4.3.3 聚類模塊
        4.3.4 聚類后處理模塊
    4.4 實(shí)例評(píng)估
        4.4.1 系統(tǒng)環(huán)境搭建
        4.4.2 系統(tǒng)運(yùn)行評(píng)估
        4.4.3 運(yùn)行效率評(píng)估
    4.5 本章小結(jié)
第五章 結(jié)束語(yǔ)
    5.1 論文總結(jié)
    5.2 未來(lái)的研究工作
參考文獻(xiàn)
致謝
攻讀學(xué)位期間發(fā)表的論文及專利


【參考文獻(xiàn)】:
期刊論文
[1]手機(jī)用戶上網(wǎng)時(shí)段的混合Markov預(yù)測(cè)方法[J]. 方志祥,于沖,張韜,馮明翔,倪雅倩.  地球信息科學(xué)學(xué)報(bào). 2017(08)
[2]基于用戶行為的微博用戶社會(huì)影響力分析[J]. 毛佳昕,劉奕群,張敏,馬少平.  計(jì)算機(jī)學(xué)報(bào). 2014(04)
[3]大數(shù)據(jù)平臺(tái)技術(shù)綜述[J]. 宮夏屹,李伯虎,柴旭東,谷牧.  系統(tǒng)仿真學(xué)報(bào). 2014(03)

博士論文
[1]基于流量監(jiān)測(cè)的網(wǎng)絡(luò)用戶行為分析[D]. 延皓.北京郵電大學(xué) 2011



本文編號(hào):3691512

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/3691512.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶f5f56***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com