基于興趣轉(zhuǎn)移的微博用戶動態(tài)畫像構(gòu)建研究
發(fā)布時間:2023-06-03 13:19
隨著互聯(lián)網(wǎng)技術(shù)的蓬勃發(fā)展,以微博、微信等為代表的社交媒體應(yīng)運而生,并憑借其全民化、多元化、自由參與等獨特優(yōu)勢吸引人們的廣泛參與。社交媒體用戶規(guī)模龐大,用戶間交互使得社交媒體產(chǎn)生海量數(shù)據(jù),這些數(shù)據(jù)為用戶畫像生成提供了重要的數(shù)據(jù)來源。用戶畫像是建立在用戶真實數(shù)據(jù)之上的用戶標(biāo)簽化表示。用戶畫像對于精準(zhǔn)識別用戶需求與興趣具有重要價值,現(xiàn)已被廣泛應(yīng)用于個性化推薦、精準(zhǔn)營銷等方面。微博作為web2.0時代具有代表性的社交媒體,其用戶畫像的構(gòu)建逐漸成為當(dāng)前研究熱點。本文在綜合已有用戶畫像研究的基礎(chǔ)上,針對現(xiàn)有微博用戶畫像構(gòu)建方法存在的對用戶特征提取不全面、不準(zhǔn)確的問題,提出基于興趣轉(zhuǎn)移的微博用戶動態(tài)畫像構(gòu)建方法。該方法構(gòu)建的微博用戶動態(tài)畫像包括靜態(tài)屬性標(biāo)簽和動態(tài)興趣標(biāo)簽兩部分。靜態(tài)屬性標(biāo)簽從用戶微博平臺主頁的基本信息中提取;動態(tài)興趣標(biāo)簽依據(jù)用戶歷史微博集進(jìn)行動態(tài)的興趣挖掘。本文主要的研究工作如下:(1)用戶靜態(tài)屬性標(biāo)簽的提取:從用戶微博主頁個人信息中獲取用戶相關(guān)屬性信息,包括性別、年齡、地域、學(xué)校、公司、個人簡介、微博認(rèn)證以及自勾選標(biāo)簽,對獲取的原始文本進(jìn)行文本處理,運用層次分析法確定標(biāo)簽權(quán)重,生成...
【文章頁數(shù)】:61 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
abstract
第一章 緒論
1.1 研究背景和意義
1.1.1 研究背景
1.1.2 研究意義
1.2 研究現(xiàn)狀
1.2.1 用戶畫像構(gòu)建的國內(nèi)外研究現(xiàn)狀
1.2.2 微博的用戶畫像構(gòu)建研究現(xiàn)狀
1.3 創(chuàng)新點與研究方法
1.3.1 研究內(nèi)容
1.3.2 創(chuàng)新點
1.4 研究方法
1.5 本章小結(jié)
第二章 相關(guān)工作
2.1 文本預(yù)處理
2.1.1 中文分詞技術(shù)
2.1.2 去停用詞
2.2 文本表示
2.2.1 向量空間模型
2.2.2 特征選擇——TF-IDF算法
2.2.3 文本相似度計算
2.3 層次分析法
2.4 聚類分析
2.4.1 聚類分析算法分類及分析
2.4.2 K-means 聚類
2.5 生命周期理論
2.5.1 生命周期的內(nèi)涵
2.5.2 生命周期理論的適用對象
2.5.3 生命周期理論的適用模型
2.6 本章小結(jié)
第三章 微博用戶動態(tài)畫像構(gòu)建
3.1 問題分析與用戶畫像表示
3.2 基于屬性信息的靜態(tài)屬性標(biāo)簽提取
3.2.1 用戶屬性信息描述
3.2.2 屬性標(biāo)簽的提取
3.2.3 權(quán)重計算
3.3 基于興趣轉(zhuǎn)移的動態(tài)興趣標(biāo)簽提取
3.3.1 候選興趣詞集的獲取
3.3.2 興趣轉(zhuǎn)移的時間衰減函數(shù)的構(gòu)造
3.3.3 動態(tài)興趣標(biāo)簽的生成與更新
3.4 本章小結(jié)
第四章 實證研究
4.1 實驗數(shù)據(jù)集描述
4.2 評價標(biāo)準(zhǔn)
4.3 實驗與分析
4.3.1 相關(guān)參數(shù)的確定
4.3.2 對比實驗
4.4 本章小結(jié)
第五章 總結(jié)與展望
5.1 總結(jié)
5.2 展望
參考文獻(xiàn)
致謝
攻讀學(xué)位期間取得的研究成果
本文編號:3829410
【文章頁數(shù)】:61 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
abstract
第一章 緒論
1.1 研究背景和意義
1.1.1 研究背景
1.1.2 研究意義
1.2 研究現(xiàn)狀
1.2.1 用戶畫像構(gòu)建的國內(nèi)外研究現(xiàn)狀
1.2.2 微博的用戶畫像構(gòu)建研究現(xiàn)狀
1.3 創(chuàng)新點與研究方法
1.3.1 研究內(nèi)容
1.3.2 創(chuàng)新點
1.4 研究方法
1.5 本章小結(jié)
第二章 相關(guān)工作
2.1 文本預(yù)處理
2.1.1 中文分詞技術(shù)
2.1.2 去停用詞
2.2 文本表示
2.2.1 向量空間模型
2.2.2 特征選擇——TF-IDF算法
2.2.3 文本相似度計算
2.3 層次分析法
2.4 聚類分析
2.4.1 聚類分析算法分類及分析
2.4.2 K-means 聚類
2.5 生命周期理論
2.5.1 生命周期的內(nèi)涵
2.5.2 生命周期理論的適用對象
2.5.3 生命周期理論的適用模型
2.6 本章小結(jié)
第三章 微博用戶動態(tài)畫像構(gòu)建
3.1 問題分析與用戶畫像表示
3.2 基于屬性信息的靜態(tài)屬性標(biāo)簽提取
3.2.1 用戶屬性信息描述
3.2.2 屬性標(biāo)簽的提取
3.2.3 權(quán)重計算
3.3 基于興趣轉(zhuǎn)移的動態(tài)興趣標(biāo)簽提取
3.3.1 候選興趣詞集的獲取
3.3.2 興趣轉(zhuǎn)移的時間衰減函數(shù)的構(gòu)造
3.3.3 動態(tài)興趣標(biāo)簽的生成與更新
3.4 本章小結(jié)
第四章 實證研究
4.1 實驗數(shù)據(jù)集描述
4.2 評價標(biāo)準(zhǔn)
4.3 實驗與分析
4.3.1 相關(guān)參數(shù)的確定
4.3.2 對比實驗
4.4 本章小結(jié)
第五章 總結(jié)與展望
5.1 總結(jié)
5.2 展望
參考文獻(xiàn)
致謝
攻讀學(xué)位期間取得的研究成果
本文編號:3829410
本文鏈接:http://www.sikaile.net/tushudanganlunwen/3829410.html
最近更新
教材專著