融合網(wǎng)絡(luò)結(jié)構(gòu)和文本內(nèi)容的群體畫像構(gòu)建方法研究
發(fā)布時(shí)間:2021-11-20 06:39
信息網(wǎng)絡(luò)的迅速發(fā)展,使得用戶數(shù)據(jù)日漸增多,基于網(wǎng)絡(luò)數(shù)據(jù)進(jìn)行用戶畫像構(gòu)建研究,對精準(zhǔn)推薦等個(gè)性化服務(wù)研究領(lǐng)域具有重要意義。針對現(xiàn)有群體畫像構(gòu)建方法多基于用戶在網(wǎng)絡(luò)上發(fā)表的文本內(nèi)容,較少考慮網(wǎng)絡(luò)結(jié)構(gòu)信息所造成的用戶建模精度低、網(wǎng)絡(luò)群體相似性和緊密性差的問題,提出了一種融合網(wǎng)絡(luò)結(jié)構(gòu)和文本內(nèi)容的群體畫像構(gòu)建方法。首先,采用LINE模型的一階鄰近度和二階鄰近度建模局部和全局網(wǎng)絡(luò)結(jié)構(gòu),通過目標(biāo)函數(shù)優(yōu)化合并局部和全局結(jié)構(gòu)建模向量;借助注意力機(jī)制,在神經(jīng)網(wǎng)絡(luò)的隱藏層引入注意力矩陣對文本內(nèi)容的上下文進(jìn)行表示,進(jìn)而實(shí)現(xiàn)文本內(nèi)容建模;融合兩種模型并采用卷積神經(jīng)網(wǎng)絡(luò)方法訓(xùn)練,將網(wǎng)絡(luò)用戶表示為空間向量。其次,采用密度峰值聚類算法對用戶空間向量聚類,通過計(jì)算每個(gè)用戶的局部密度和距離,確定用戶類別標(biāo)簽,并利用結(jié)構(gòu)-內(nèi)容模塊度對聚類結(jié)果迭代優(yōu)化,實(shí)現(xiàn)網(wǎng)絡(luò)群體構(gòu)建。最后,采用LDA主題建模法進(jìn)行主題劃分,得到每個(gè)群體的關(guān)注話題標(biāo)簽,并利用可視化工具刻畫群體畫像。采用知乎、Cora和Hep Th三種數(shù)據(jù)集,進(jìn)行建模精度和群體構(gòu)建效果對比實(shí)驗(yàn)。本文方法同Deep Walk、LINE、Node2vec、SDNE、TADW六種...
【文章來源】:遼寧工程技術(shù)大學(xué)遼寧省
【文章頁數(shù)】:71 頁
【學(xué)位級別】:碩士
【部分圖文】:
群體畫像構(gòu)建總體流程
?囟砸丫?裳?慕詰闃馗捶夢剩?鋇鉸?閔瓚?的序列長度閾值。根據(jù)采樣情況,會(huì)得到一個(gè)概率公式,通過詞向量中的skip-gram模型對概率公式進(jìn)行優(yōu)化,最終得到所需的節(jié)點(diǎn)向量表示。1)隨機(jī)游走隨機(jī)游走是指,從網(wǎng)絡(luò)中的一個(gè)節(jié)點(diǎn)出發(fā),隨機(jī)選擇與當(dāng)前節(jié)點(diǎn)相連的下一個(gè)節(jié)點(diǎn)游走,不斷重復(fù)這個(gè)過程,直到滿足終止條件為止,最終生成一條連貫的網(wǎng)絡(luò)路徑。例如,圖2.2中的紅色路徑,即為一條隨機(jī)游走路徑。隨機(jī)游走只能對局部網(wǎng)絡(luò)結(jié)構(gòu)建模,對于含有成千上萬節(jié)點(diǎn)的大型網(wǎng)絡(luò)來說,可以多節(jié)點(diǎn)并行隨機(jī)游走,以提高游走采樣的效率。圖2.2DeepWalk隨機(jī)游走路徑Figure2.2RandomwalkpathofDeepWalk2)skip-gram模型對于隨機(jī)游走產(chǎn)生的概率公式,采用skip-gram模型進(jìn)行優(yōu)化。由于網(wǎng)絡(luò)嵌入思想源于文本嵌入,且具有相似特性,因此,在DeepWalk中通過引用詞向量模型,得到skip-gram優(yōu)化模型。所謂的詞向量模型,就是對于一個(gè)單詞序列),...,,(10niuwwww,當(dāng)知道單詞序
一階鄰近度和二階鄰近度Figure2.3First-orderproximityandsecond-orderproximity
【參考文獻(xiàn)】:
期刊論文
[1]基于網(wǎng)絡(luò)結(jié)構(gòu)和文本內(nèi)容的群體畫像構(gòu)建方法研究[J]. 邱云飛,張偉竹. 圖書情報(bào)工作. 2019(22)
[2]基于用戶畫像的數(shù)字圖書館精準(zhǔn)推薦服務(wù)體系構(gòu)建研究[J]. 張晗,畢強(qiáng),李潔,丁夢曉. 情報(bào)理論與實(shí)踐. 2019(11)
[3]基于大數(shù)據(jù)的用戶畫像構(gòu)建方法與運(yùn)用[J]. 譚浩,郭雅婷. 包裝工程. 2019(22)
[4]Inferring user profiles in social media by joint modeling of text and networks[J]. Ruifeng XU,Jiachen DU,Zhishan ZHAO,Yulan HE,Qinghong GAO,Lin GUI. Science China(Information Sciences). 2019(11)
[5]考慮全局和局部信息的科研人員科研行為立體精準(zhǔn)畫像構(gòu)建方法[J]. 張亞楠,黃晶麗,王剛. 情報(bào)學(xué)報(bào). 2019(10)
[6]融合用戶智能標(biāo)簽與社會(huì)化標(biāo)簽的推薦服務(wù)[J]. 賈偉,劉旭艷,徐彤陽. 情報(bào)科學(xué). 2019(10)
[7]基于輿情畫像的在線社交用戶信息傳播特征統(tǒng)計(jì)分析[J]. 劉海鷗,劉旭,姚蘇梅,謝姝琳. 現(xiàn)代情報(bào). 2019(09)
[8]學(xué)術(shù)用戶畫像的行為與興趣標(biāo)簽構(gòu)建與應(yīng)用[J]. 王仁武,張文慧. 現(xiàn)代情報(bào). 2019(09)
[9]社交媒體用戶畫像的構(gòu)建及資源聚合模型研究[J]. 徐海玲,張海濤,魏明珠,尹慧子. 圖書情報(bào)工作. 2019(09)
[10]國內(nèi)外圖書情報(bào)領(lǐng)域用戶畫像研究現(xiàn)狀及展望[J]. 張海濤,徐海玲,張梟慧,武慧娟. 圖書情報(bào)工作. 2019(07)
博士論文
[1]基于社交大數(shù)據(jù)的用戶信用畫像方法研究[D]. 郭光明.中國科學(xué)技術(shù)大學(xué) 2017
碩士論文
[1]基于動(dòng)態(tài)主題模型的微博用戶分類畫像應(yīng)用研究[D]. 任金玥.華東師范大學(xué) 2019
[2]屬性推理在用戶畫像系統(tǒng)的應(yīng)用研究[D]. 宋光晨.陜西師范大學(xué) 2019
[3]在線社交網(wǎng)絡(luò)中用戶畫像構(gòu)建及其應(yīng)用研究[D]. 汪強(qiáng)兵.南京理工大學(xué) 2018
[4]融入社交網(wǎng)絡(luò)信息的DIT用戶偏好預(yù)測模型[D]. 張長紅.浙江工商大學(xué) 2018
[5]基于文本挖掘的社交網(wǎng)絡(luò)用戶畫像建模與應(yīng)用[D]. 徐英楠.北京郵電大學(xué) 2016
本文編號:3506775
【文章來源】:遼寧工程技術(shù)大學(xué)遼寧省
【文章頁數(shù)】:71 頁
【學(xué)位級別】:碩士
【部分圖文】:
群體畫像構(gòu)建總體流程
?囟砸丫?裳?慕詰闃馗捶夢剩?鋇鉸?閔瓚?的序列長度閾值。根據(jù)采樣情況,會(huì)得到一個(gè)概率公式,通過詞向量中的skip-gram模型對概率公式進(jìn)行優(yōu)化,最終得到所需的節(jié)點(diǎn)向量表示。1)隨機(jī)游走隨機(jī)游走是指,從網(wǎng)絡(luò)中的一個(gè)節(jié)點(diǎn)出發(fā),隨機(jī)選擇與當(dāng)前節(jié)點(diǎn)相連的下一個(gè)節(jié)點(diǎn)游走,不斷重復(fù)這個(gè)過程,直到滿足終止條件為止,最終生成一條連貫的網(wǎng)絡(luò)路徑。例如,圖2.2中的紅色路徑,即為一條隨機(jī)游走路徑。隨機(jī)游走只能對局部網(wǎng)絡(luò)結(jié)構(gòu)建模,對于含有成千上萬節(jié)點(diǎn)的大型網(wǎng)絡(luò)來說,可以多節(jié)點(diǎn)并行隨機(jī)游走,以提高游走采樣的效率。圖2.2DeepWalk隨機(jī)游走路徑Figure2.2RandomwalkpathofDeepWalk2)skip-gram模型對于隨機(jī)游走產(chǎn)生的概率公式,采用skip-gram模型進(jìn)行優(yōu)化。由于網(wǎng)絡(luò)嵌入思想源于文本嵌入,且具有相似特性,因此,在DeepWalk中通過引用詞向量模型,得到skip-gram優(yōu)化模型。所謂的詞向量模型,就是對于一個(gè)單詞序列),...,,(10niuwwww,當(dāng)知道單詞序
一階鄰近度和二階鄰近度Figure2.3First-orderproximityandsecond-orderproximity
【參考文獻(xiàn)】:
期刊論文
[1]基于網(wǎng)絡(luò)結(jié)構(gòu)和文本內(nèi)容的群體畫像構(gòu)建方法研究[J]. 邱云飛,張偉竹. 圖書情報(bào)工作. 2019(22)
[2]基于用戶畫像的數(shù)字圖書館精準(zhǔn)推薦服務(wù)體系構(gòu)建研究[J]. 張晗,畢強(qiáng),李潔,丁夢曉. 情報(bào)理論與實(shí)踐. 2019(11)
[3]基于大數(shù)據(jù)的用戶畫像構(gòu)建方法與運(yùn)用[J]. 譚浩,郭雅婷. 包裝工程. 2019(22)
[4]Inferring user profiles in social media by joint modeling of text and networks[J]. Ruifeng XU,Jiachen DU,Zhishan ZHAO,Yulan HE,Qinghong GAO,Lin GUI. Science China(Information Sciences). 2019(11)
[5]考慮全局和局部信息的科研人員科研行為立體精準(zhǔn)畫像構(gòu)建方法[J]. 張亞楠,黃晶麗,王剛. 情報(bào)學(xué)報(bào). 2019(10)
[6]融合用戶智能標(biāo)簽與社會(huì)化標(biāo)簽的推薦服務(wù)[J]. 賈偉,劉旭艷,徐彤陽. 情報(bào)科學(xué). 2019(10)
[7]基于輿情畫像的在線社交用戶信息傳播特征統(tǒng)計(jì)分析[J]. 劉海鷗,劉旭,姚蘇梅,謝姝琳. 現(xiàn)代情報(bào). 2019(09)
[8]學(xué)術(shù)用戶畫像的行為與興趣標(biāo)簽構(gòu)建與應(yīng)用[J]. 王仁武,張文慧. 現(xiàn)代情報(bào). 2019(09)
[9]社交媒體用戶畫像的構(gòu)建及資源聚合模型研究[J]. 徐海玲,張海濤,魏明珠,尹慧子. 圖書情報(bào)工作. 2019(09)
[10]國內(nèi)外圖書情報(bào)領(lǐng)域用戶畫像研究現(xiàn)狀及展望[J]. 張海濤,徐海玲,張梟慧,武慧娟. 圖書情報(bào)工作. 2019(07)
博士論文
[1]基于社交大數(shù)據(jù)的用戶信用畫像方法研究[D]. 郭光明.中國科學(xué)技術(shù)大學(xué) 2017
碩士論文
[1]基于動(dòng)態(tài)主題模型的微博用戶分類畫像應(yīng)用研究[D]. 任金玥.華東師范大學(xué) 2019
[2]屬性推理在用戶畫像系統(tǒng)的應(yīng)用研究[D]. 宋光晨.陜西師范大學(xué) 2019
[3]在線社交網(wǎng)絡(luò)中用戶畫像構(gòu)建及其應(yīng)用研究[D]. 汪強(qiáng)兵.南京理工大學(xué) 2018
[4]融入社交網(wǎng)絡(luò)信息的DIT用戶偏好預(yù)測模型[D]. 張長紅.浙江工商大學(xué) 2018
[5]基于文本挖掘的社交網(wǎng)絡(luò)用戶畫像建模與應(yīng)用[D]. 徐英楠.北京郵電大學(xué) 2016
本文編號:3506775
本文鏈接:http://www.sikaile.net/kejilunwen/shengwushengchang/3506775.html
最近更新
教材專著