天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于推薦算法的微博個(gè)人數(shù)據(jù)可視化

發(fā)布時(shí)間:2022-03-12 07:08
  微博已經(jīng)成為了人們獲取信息、分享觀點(diǎn)的重要平臺,海量數(shù)據(jù)背后蘊(yùn)藏著巨大的學(xué)術(shù)研究價(jià)值。因此,本文以微博為研究對象,圍繞微博數(shù)據(jù)的采集、挖掘、可視化進(jìn)行研究,設(shè)計(jì)并實(shí)現(xiàn)基于推薦算法的微博個(gè)人數(shù)據(jù)可視化系統(tǒng)。本文中設(shè)計(jì)并實(shí)現(xiàn)了三個(gè)主要子系統(tǒng):數(shù)據(jù)采集子系統(tǒng)、關(guān)系計(jì)算子系統(tǒng)、可視化展示子系統(tǒng)。數(shù)據(jù)采集子系統(tǒng)通過模擬登陸的方法來解決身份認(rèn)證問題。關(guān)系計(jì)算子系統(tǒng)對原始數(shù)據(jù)進(jìn)行處理轉(zhuǎn)化為可視化數(shù)據(jù)。系統(tǒng)重點(diǎn)實(shí)現(xiàn)了微博用戶關(guān)系計(jì)算模塊,我們利用推薦算法來計(jì)算關(guān)系度用于衡量兩個(gè)人之間的關(guān)系。子系統(tǒng)中還利用TF-IDF算法提取微博關(guān)鍵字?梢暬酉到y(tǒng)系統(tǒng),可視化子系統(tǒng)由瀏覽器呈現(xiàn)數(shù)據(jù)挖掘結(jié)果。本文中采用柱狀圖、折線圖、極坐標(biāo)、地圖、標(biāo)簽云以及關(guān)系圖來呈現(xiàn)數(shù)據(jù)分析結(jié)果。本文中主要貢獻(xiàn)和創(chuàng)新點(diǎn)包括:(1)設(shè)計(jì)并實(shí)現(xiàn)了微博數(shù)據(jù)采集、關(guān)系計(jì)算、個(gè)人信息可視化系統(tǒng)。搭建的系統(tǒng)實(shí)現(xiàn)了用戶關(guān)系度的計(jì)算和微博用戶分析的功能,為后續(xù)研究提供基礎(chǔ)平臺。同時(shí)在系統(tǒng)中我們使用Redis數(shù)據(jù)庫作為數(shù)據(jù)處理的緩存,減少系統(tǒng)響應(yīng)時(shí)間。(2)系統(tǒng)實(shí)現(xiàn)了利用推薦算法來衡量關(guān)系度,利用SVM算法進(jìn)行模型建立,通過各個(gè)分類的概率來進(jìn)行關(guān)系度... 

【文章來源】:天津大學(xué)天津市211工程院校985工程院校教育部直屬院校

【文章頁數(shù)】:67 頁

【學(xué)位級別】:碩士

【文章目錄】:
摘要
abstract
第1章 概述
    1.1 背景介紹
    1.2 國內(nèi)外研究現(xiàn)狀
        1.2.1 國外研究現(xiàn)狀
        1.2.2 國內(nèi)研究現(xiàn)狀
    1.3 課題簡介
    1.4 論文主要工作和組織結(jié)構(gòu)
第2章 相關(guān)研究工作
    2.1 推薦算法
        2.1.1 基于內(nèi)容的推薦算法
        2.1.2 協(xié)同過濾推薦算法
        2.1.3 混合推薦算法
        2.1.4 其它推薦算法
    2.2 TF-IDF算法
    2.3 信息可視化
        2.3.1 平行坐標(biāo)可視化
        2.3.2 圖表可視化
        2.3.3 地圖可視化
        2.3.4 標(biāo)簽云可視化
    2.4 數(shù)據(jù)采集
        2.4.1 通過微博API采集
        2.4.2 通過網(wǎng)絡(luò)爬蟲采集
    2.5 本章小結(jié)
第3章 推薦算法和TF-IDF算法的應(yīng)用
    3.1 基于內(nèi)容的推薦算法在微博關(guān)系中的應(yīng)用
        3.1.1 算法基本原理
        3.1.2 目標(biāo)用戶配置模板的建立
        3.1.3 關(guān)系度計(jì)算
    3.2 TF-IDF算法的應(yīng)用
    3.3 本章小結(jié)
第4章 系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)
    4.1 需求分析
        4.1.1 數(shù)據(jù)采集需求
        4.1.2 數(shù)據(jù)處理與分析需求
        4.1.3 可視化展示需求
    4.2 系統(tǒng)架構(gòu)設(shè)計(jì)
    4.3 功能模塊詳細(xì)設(shè)計(jì)
        4.3.1 數(shù)據(jù)庫子系統(tǒng)
        4.3.2 數(shù)據(jù)采集子系統(tǒng)
        4.3.3 關(guān)系計(jì)算子系統(tǒng)
        4.3.4 可視化展示子系統(tǒng)
    4.4 本章小結(jié)
第5章 系統(tǒng)介紹與可視化展示
    5.1 使用技術(shù)
        5.1.1 FlaskWeb框架
        5.1.2 MySQL數(shù)據(jù)庫
        5.1.3 Redis數(shù)據(jù)庫
        5.1.4 Echarts可視化組件
    5.2 可視化展示
        5.2.1 關(guān)系可視化
        5.2.2 關(guān)系度分?jǐn)?shù)可視化
        5.2.3 地域分布可視化
        5.2.4 微博發(fā)送時(shí)間可視化
        5.2.5 性別可視化
        5.2.6 關(guān)鍵詞可視化
    5.3 本章小結(jié)
第6章 總結(jié)與展望
    6.1 總結(jié)
    6.2 展望
參考文獻(xiàn)
發(fā)表論文和參加科研情況說明
致謝


【參考文獻(xiàn)】:
期刊論文
[1]面向微博主題的可視分析研究[J]. 王臻皇,陳思明,袁曉如.  軟件學(xué)報(bào). 2018(04)
[2]基于文本挖掘的微博文本情緒分析技術(shù)研究[J]. 戴天翔,岑鑫,柳珺文,王帥,歐陽帆.  科技資訊. 2017(07)
[3]基于時(shí)序行為的協(xié)同過濾推薦算法[J]. 孫光福,吳樂,劉淇,朱琛,陳恩紅.  軟件學(xué)報(bào). 2013(11)
[4]基于項(xiàng)目流行度的協(xié)同過濾TopN推薦算法[J]. 郝立燕,王靖.  計(jì)算機(jī)工程與設(shè)計(jì). 2013(10)
[5]國內(nèi)微博研究綜述[J]. 周金元,張莎莎,劉桂鋒,王振.  情報(bào)雜志. 2013(09)
[6]大數(shù)據(jù)管理:概念、技術(shù)與挑戰(zhàn)[J]. 孟小峰,慈祥.  計(jì)算機(jī)研究與發(fā)展. 2013(01)
[7]使用機(jī)器學(xué)習(xí)方法進(jìn)行新聞的情感自動(dòng)分類[J]. 徐軍,丁宇新,王曉龍.  中文信息學(xué)報(bào). 2007(06)
[8]從科學(xué)計(jì)算可視化到信息可視化[J]. 楊峰.  情報(bào)雜志. 2007(01)
[9]基于領(lǐng)域知識的個(gè)性化推薦算法研究[J]. 張丙奇.  計(jì)算機(jī)工程. 2005(21)
[10]個(gè)性化推薦算法設(shè)計(jì)[J]. 趙亮,胡乃靜,張守志.  計(jì)算機(jī)研究與發(fā)展. 2002(08)



本文編號:3645840

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/guanlilunwen/ydhl/3645840.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶836b7***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請E-mail郵箱bigeng88@qq.com