基于元路徑的對(duì)齊異構(gòu)社交網(wǎng)絡(luò)中的鏈路預(yù)測(cè)
本文關(guān)鍵詞:基于元路徑的對(duì)齊異構(gòu)社交網(wǎng)絡(luò)中的鏈路預(yù)測(cè)
更多相關(guān)文章: 對(duì)齊異構(gòu)社交網(wǎng)絡(luò) 鏈路預(yù)測(cè) 元路徑 特征選擇
【摘要】:隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展、智能終端的普及以及多種社交平臺(tái)的出現(xiàn),人們會(huì)參與到不同種類的社交網(wǎng)絡(luò)中,這導(dǎo)致只研究一個(gè)社交網(wǎng)絡(luò)向用戶進(jìn)行實(shí)體(用戶、商品、位置等)推薦的方法已不是最佳。近年來,研究領(lǐng)域出現(xiàn)了對(duì)齊異構(gòu)社交網(wǎng)絡(luò)(aligned heterogeneous social networks)這一網(wǎng)絡(luò)模型,該模型能夠建立多個(gè)社交網(wǎng)絡(luò)的連接,這使得利用多個(gè)社交網(wǎng)絡(luò)數(shù)據(jù)進(jìn)行推薦變得可能。然而對(duì)齊異構(gòu)社交網(wǎng)絡(luò)的推薦或預(yù)測(cè)工作仍處于起步階段,僅限于少量種類的數(shù)據(jù)集和對(duì)應(yīng)的用戶-用戶鏈路預(yù)測(cè)和用戶-位置鏈路預(yù)測(cè)。另外現(xiàn)有研究考慮的特征或因素過于簡(jiǎn)單,對(duì)于數(shù)據(jù)集中多種屬性的利用以及特征的處理和篩選并不成熟,預(yù)測(cè)空間較為局限,不適用于推薦場(chǎng)景,且預(yù)測(cè)結(jié)果不具有時(shí)間因果性。因此,本文提出部分對(duì)齊異構(gòu)社交網(wǎng)絡(luò)中的實(shí)體推薦問題,即用戶-實(shí)體的鏈路預(yù)測(cè)問題,主要分為以下研究?jī)?nèi)容:第一,提出了一個(gè)基于元路徑特征的對(duì)齊異構(gòu)社交網(wǎng)絡(luò)的鏈路預(yù)測(cè)框架。首先將該問題轉(zhuǎn)化為分類問題,并提出基于元路徑的自動(dòng)化特征提取方法;通過定義邊權(quán)值的多種計(jì)算方法進(jìn)一步擴(kuò)展元路徑特征個(gè)數(shù),生成基于元路徑的初始特征集合;然后通過特征提取算法進(jìn)行特征篩選,并生成最終的預(yù)測(cè)模型。第二,提出了兩階段逐步向前貪心的特征選擇算法。該算法設(shè)計(jì)時(shí)結(jié)合了計(jì)算復(fù)雜度低的過濾模型及性能指標(biāo)好的封裝模型的雙重優(yōu)勢(shì),從全體特征中選取特征子集。實(shí)驗(yàn)證明,該特征選擇方法較現(xiàn)有的特征選擇算法在計(jì)算時(shí)間、預(yù)測(cè)效果及模型復(fù)雜度上表現(xiàn)較好。第三,基于上述鏈路預(yù)測(cè)算法過程及關(guān)鍵步驟實(shí)現(xiàn)了對(duì)齊異構(gòu)社交網(wǎng)絡(luò)的實(shí)體推薦系統(tǒng),系統(tǒng)實(shí)現(xiàn)了對(duì)齊異構(gòu)社交網(wǎng)絡(luò)的數(shù)據(jù)抓取、特征定義及生成、邊權(quán)值計(jì)算、特征計(jì)算、特征選擇算法以及模型生成,系統(tǒng)還設(shè)計(jì)了一個(gè)可視化界面以向用戶展示推薦結(jié)果。利用原型系統(tǒng),本文抓取了Foursquare和Twitter的數(shù)據(jù)集,并進(jìn)行了Foursquare中用戶-用戶鏈路、用戶-位置鏈路以及Twitter中的關(guān)注者-被關(guān)注者鏈路的預(yù)測(cè)實(shí)驗(yàn)。從最終建模的特征種類可以看出,除包含常見的時(shí)間、空間和二三度好友因素的元路徑特征之外,錨鏈路、流行度、標(biāo)簽以及權(quán)值的多種計(jì)算方法產(chǎn)生的元路徑特征都起著重要的作用。實(shí)驗(yàn)通過Precision Recall、 F1值等指標(biāo)進(jìn)行評(píng)價(jià),證明本文的模型相對(duì)現(xiàn)有工作或者baseline具有較好的推薦效果。
【學(xué)位授予單位】:東南大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:TP393.09
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 ;基于位置的手機(jī)社交網(wǎng)絡(luò)“貝多”正式發(fā)布[J];中國(guó)新通信;2008年06期
2 曹增輝;;社交網(wǎng)絡(luò)更偏向于用戶工具[J];信息網(wǎng)絡(luò);2009年11期
3 ;美國(guó):印刷企業(yè)青睞社交網(wǎng)絡(luò)營(yíng)銷新方式[J];中國(guó)包裝工業(yè);2010年Z1期
4 李智惠;柳承燁;;韓國(guó)移動(dòng)社交網(wǎng)絡(luò)服務(wù)的類型分析與促進(jìn)方案[J];現(xiàn)代傳播(中國(guó)傳媒大學(xué)學(xué)報(bào));2010年08期
5 賈富;;改變一切的社交網(wǎng)絡(luò)[J];互聯(lián)網(wǎng)天地;2011年04期
6 譚拯;;社交網(wǎng)絡(luò):連接與發(fā)現(xiàn)[J];廣東通信技術(shù);2011年07期
7 陳一舟;;社交網(wǎng)絡(luò)的發(fā)展趨勢(shì)[J];傳媒;2011年12期
8 殷樂;;全球社交網(wǎng)絡(luò)新態(tài)勢(shì)及文化影響[J];新聞與寫作;2012年01期
9 許麗;;社交網(wǎng)絡(luò):孤獨(dú)年代的集體狂歡[J];上海信息化;2012年09期
10 李玲麗;吳新年;;科研社交網(wǎng)絡(luò)的發(fā)展現(xiàn)狀及趨勢(shì)分析[J];圖書館學(xué)研究;2013年01期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前10條
1 趙云龍;李艷兵;;社交網(wǎng)絡(luò)用戶的人格預(yù)測(cè)與關(guān)系強(qiáng)度研究[A];第七屆(2012)中國(guó)管理學(xué)年會(huì)商務(wù)智能分會(huì)場(chǎng)論文集(選編)[C];2012年
2 宮廣宇;李開軍;;對(duì)社交網(wǎng)絡(luò)中信息傳播的分析和思考——以人人網(wǎng)為例[A];首屆華中地區(qū)新聞與傳播學(xué)科研究生學(xué)術(shù)論壇獲獎(jiǎng)?wù)撐腫C];2010年
3 楊子鵬;喬麗娟;王夢(mèng)思;楊雪迎;孟子冰;張禹;;社交網(wǎng)絡(luò)與大學(xué)生焦慮緩解[A];心理學(xué)與創(chuàng)新能力提升——第十六屆全國(guó)心理學(xué)學(xué)術(shù)會(huì)議論文集[C];2013年
4 畢雪梅;;體育虛擬社區(qū)中的體育社交網(wǎng)絡(luò)解析[A];第九屆全國(guó)體育科學(xué)大會(huì)論文摘要匯編(4)[C];2011年
5 杜p,
本文編號(hào):1305718
本文鏈接:http://www.sikaile.net/guanlilunwen/ydhl/1305718.html