天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

社交網(wǎng)絡(luò)與時(shí)空數(shù)據(jù)連接的關(guān)鍵技術(shù)及應(yīng)用研究

發(fā)布時(shí)間:2020-06-08 13:56
【摘要】:伴隨著GPS全球定位系統(tǒng)、傳感器設(shè)備、可穿戴移動(dòng)設(shè)備等在日常生活中的普遍應(yīng)用,人們獲得了大量移動(dòng)對(duì)象的軌跡數(shù)據(jù)。此外,新浪微博、微信、Foursquare、Twitter、Instagram等社交網(wǎng)絡(luò)的興起給用戶提供了互相交流和分享經(jīng)驗(yàn)的平臺(tái),并因此產(chǎn)生了大量的社交網(wǎng)絡(luò)數(shù)據(jù)。連接跨時(shí)空數(shù)據(jù)庫和社交網(wǎng)絡(luò)的用戶能夠獲得更加豐富的數(shù)據(jù),基于此構(gòu)建的用戶畫像可以為諸多實(shí)際應(yīng)用提供數(shù)據(jù)支撐。具體來講,本文的研究?jī)?nèi)容主要包括以下三個(gè)部分。(1)基于聚類的跨平臺(tái)用戶連接。要實(shí)現(xiàn)跨平臺(tái)的用戶連接首先需要提取用戶的特征,并基于此計(jì)算用戶之間的相似度。相較于直接比較兩個(gè)用戶的歷史記錄,聚類是一種更加有效的方式。在空間領(lǐng)域,可以使用聚類算法DP找到用戶的停駐區(qū)域分布。在時(shí)間領(lǐng)域,可以使用高斯混合模型找到用戶的時(shí)間分布。此外,為了進(jìn)一步提高連接準(zhǔn)確度,本文基于TF-IDF思想為所提取特征賦予了相應(yīng)的權(quán)值。突出用戶區(qū)別度高的特征,并弱化區(qū)別度低的特征;谡鎸(shí)數(shù)據(jù)集的大量實(shí)驗(yàn)表明本文所提算法的連接準(zhǔn)確度明顯好于已有的同類算法。(2)數(shù)據(jù)稀疏情況下的用戶連接。基于聚類的方法有一個(gè)必要的前提是提供的數(shù)據(jù)集是高密度的。然而,在現(xiàn)實(shí)生活中雖然軌跡數(shù)據(jù)是高密度的,但社交網(wǎng)絡(luò)數(shù)據(jù)通常是稀疏的、不對(duì)稱的。因?yàn)樵S多用戶會(huì)同時(shí)活躍在多個(gè)不同的社交平臺(tái)上,而且出于安全考慮,用戶在分享和轉(zhuǎn)發(fā)狀態(tài)時(shí)經(jīng)常不提供位置數(shù)據(jù)。在這種情況下,很難提取用戶的停駐區(qū)域以計(jì)算任意兩個(gè)用戶之間的相似度。為了解決該問題,可以使用高斯核密度估計(jì)直接計(jì)算兩個(gè)用戶之間的相似度。但是,基于高斯核的算法效率很低。因?yàn)樵谟?jì)算相似度的過程中需要針對(duì)每個(gè)單獨(dú)的點(diǎn)計(jì)算它和另一個(gè)數(shù)據(jù)集所有點(diǎn)的相似度。為了提高效率,可以將空間領(lǐng)域劃分成網(wǎng)格,將時(shí)間劃分成片段,并計(jì)算用戶在相應(yīng)網(wǎng)格和時(shí)間段的概率。此外,可以基于任意熵計(jì)算網(wǎng)格和時(shí)間段的權(quán)值以更加精確地計(jì)算用戶之間的相似度,來極大地提高連接的準(zhǔn)確度。實(shí)驗(yàn)結(jié)果表明,綜合考慮網(wǎng)格、時(shí)間段和權(quán)值的算法能同時(shí)保證連接效率和準(zhǔn)確度。(3)用戶畫像的構(gòu)建及應(yīng)用。完成用戶連接以后,單一用戶的數(shù)據(jù)將變得更加豐富;诖丝梢詾橛脩魳(gòu)建更加完整的畫像。具體過程包括:基于網(wǎng)格使用DP算法提取用戶的停駐區(qū)域分布;基于歷史軌跡分析用戶在區(qū)域間的轉(zhuǎn)移概率和路徑;基于歷史數(shù)據(jù)的時(shí)間信息計(jì)算用戶在停駐區(qū)域的時(shí)間分布;基于LDA模型分析用戶在停駐區(qū)域上的主題分布。根據(jù)該畫像,并使用真實(shí)數(shù)據(jù)集,可以研究用戶畫像在位置預(yù)測(cè)、時(shí)間預(yù)測(cè)、主題預(yù)測(cè)和路徑預(yù)測(cè)方面的應(yīng)用性。實(shí)驗(yàn)結(jié)果表明,該畫像在行為預(yù)測(cè)方面能獲得良好的性能。最后,本文對(duì)上述研究?jī)?nèi)容進(jìn)行了總結(jié),并對(duì)其中可以拓展的內(nèi)容進(jìn)行了展望,也提出了相應(yīng)的解決方案。
【圖文】:

數(shù)據(jù),軌跡,社交


定義2.2.簽到記錄。社交網(wǎng)絡(luò)中用戶的一個(gè)簽到記錄定義為r邋=辦N希幔齲籩溴義現(xiàn)校睿紜⒇、f和Mr分冰咜表经度、炜度、时间戳簣D鍬幾醬奈謀灸諶蕁e義賢跡玻倍允笨帳菘庵械墓旒J鶯蛻緗煌韁械那┑絞萁辛誦問交卣瑰義鮮盡M還旒V邢嗔詰闃淶氖奔浼涓敉ǔ1冉隙蹋郟眨玻ⅲ緗煌韁邢嗔誶┑郊清義下賈淶氖奔浼涓敉ǔ:艽,有导{踔臉ご錛父鱸攏郟保保擔(dān)?悸塹焦旒J鶯頹┑絞蒎義系睦嘈筒畋穡頤嗆苣閻苯踴謖飭街質(zhì)菁撲閿沒е淶南嗨菩。因此,需要离辶x仙⒒旒J藎業(yè)焦旒V兄匾牡,并基又q廡┑閼業(yè)接沒У目占淝蚍植己褪卞義霞浞植肌e義稀蓿卞?逦?逦#辶x希掊??逦???辶x希ǎ幔┦笨展旒e危ǎ猓┣┑郊鍬煎義賢跡玻抗旒J縈肭┑絞蒎義隙ㄒ澹玻常Wさ悖懟8ㄒ惶豕旒#蟈澹藉危,?),一个停驻祽|砹艘桓鲇緬義匣A羰奔涑ㄣ兄檔那頡8ㄊ奔溷兄擔(dān)途嗬脬兄?jǐn)衬,染J嬖諞蛔殄義狹牡閌劍桑┦溝枚勻我獾溺郟輳┒加校輳模螅椋幔睿悖澹希蓿穡粒海╁澹ぶ,辶x希猓皰濉幸孕腦蟯Wさ悖罌梢遠(yuǎn)ㄒ邐哄義希

本文編號(hào):2703187

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/guanlilunwen/ydhl/2703187.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶d2498***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com