社交網(wǎng)絡(luò)節(jié)點(diǎn)分類技術(shù)研究
本文關(guān)鍵詞:社交網(wǎng)絡(luò)節(jié)點(diǎn)分類技術(shù)研究,由筆耕文化傳播整理發(fā)布。
【摘要】:隨著Internet的迅速發(fā)展,使得人們通過網(wǎng)絡(luò)進(jìn)行互聯(lián)的溝通方式也得了極大發(fā)展,這也形成了社交網(wǎng)絡(luò)這一新興的網(wǎng)絡(luò)基本形態(tài)。社交網(wǎng)絡(luò)是現(xiàn)實世界人與人之間溝通的網(wǎng)絡(luò)虛擬化,尤其是近年來社交網(wǎng)絡(luò)(如:Facebook、騰訊、微博)的迅猛發(fā)展,吸引了眾多領(lǐng)域?qū)W者對社交網(wǎng)絡(luò)中數(shù)據(jù)進(jìn)行挖掘分析的廣泛關(guān)注,從而促進(jìn)了以廣告宣傳、公共服務(wù)、營銷、學(xué)術(shù)交流等為目的的社交網(wǎng)絡(luò)研究。分類問題作為數(shù)據(jù)挖掘分析的一種方式,也被應(yīng)用在社交網(wǎng)絡(luò)之中,通過對網(wǎng)絡(luò)中節(jié)點(diǎn)進(jìn)行分類,通過標(biāo)簽對節(jié)點(diǎn)的這些興趣,愛好,關(guān)系或其他可能的特征進(jìn)行捕獲,可以得出對人口的價值觀、興趣的描述,節(jié)點(diǎn)的信仰以及標(biāo)政治或宗教信仰。通過分類技術(shù)對社交網(wǎng)絡(luò)中的節(jié)點(diǎn)進(jìn)行標(biāo)簽標(biāo)記,有利于深入分析對社交結(jié)構(gòu)特征以及應(yīng)用的延研究。對社交網(wǎng)絡(luò)中的節(jié)點(diǎn)進(jìn)行分類是文本研究方向,社交網(wǎng)絡(luò)中節(jié)點(diǎn)可以是代表現(xiàn)實中一個人也可以是某個學(xué)校這樣的一個整體,節(jié)點(diǎn)包含了大量的文本、圖片、音頻、視頻等數(shù)據(jù)以及屬性。節(jié)點(diǎn)分類主要分為單標(biāo)簽分類和多標(biāo)簽分類,由于社交網(wǎng)絡(luò)內(nèi)節(jié)點(diǎn)含有眾多數(shù)據(jù)以及屬性,單標(biāo)簽分類已經(jīng)不滿足于節(jié)點(diǎn)分類的要求,本文主要對節(jié)點(diǎn)進(jìn)行多標(biāo)簽分類。本文結(jié)合社交網(wǎng)絡(luò)節(jié)點(diǎn)特性,從兩個方面進(jìn)行了節(jié)點(diǎn)分類技術(shù)的研究,一個方向是根據(jù)節(jié)點(diǎn)自身屬性分類節(jié)點(diǎn),另一個是根據(jù)節(jié)點(diǎn)之間鏈接關(guān)系進(jìn)行分類。當(dāng)前根據(jù)節(jié)點(diǎn)屬性進(jìn)行分類的相關(guān)方法存在對數(shù)據(jù)樣本的原始屬性集進(jìn)行各種不同形式的約減,但分類沒有對不同的類標(biāo)簽或標(biāo)簽集使用不同的屬性集來加以區(qū)分,從而更好地挖掘標(biāo)簽間的區(qū)別與聯(lián)系。另外,由于社交節(jié)點(diǎn)之間存在錯綜復(fù)雜的關(guān)系,僅考慮節(jié)點(diǎn)自身屬性不能夠滿足節(jié)點(diǎn)分類要求,還要考慮節(jié)點(diǎn)之間關(guān)系。因此,本文提出兩種社交網(wǎng)絡(luò)節(jié)點(diǎn)分類方法。首先,本文基于節(jié)點(diǎn)屬性,提出了一種基于K近鄰節(jié)點(diǎn)屬性的多標(biāo)簽分類算法。算法主要思想是首先找出能夠體現(xiàn)出節(jié)點(diǎn)類標(biāo)簽的強(qiáng)相關(guān)屬性,以及不能體現(xiàn)節(jié)點(diǎn)特征的弱相關(guān)屬性,保留強(qiáng)相關(guān)性屬性,去掉弱相關(guān)屬性。以此為基礎(chǔ)計算未標(biāo)簽節(jié)點(diǎn)的K個近鄰,通過未標(biāo)簽節(jié)點(diǎn)的近鄰標(biāo)簽集,使用最大后驗概率計算該未標(biāo)簽節(jié)點(diǎn)屬于各個標(biāo)簽的概率,最終根據(jù)闕值得到未標(biāo)簽節(jié)點(diǎn)的標(biāo)簽集合。其次,本文結(jié)合節(jié)點(diǎn)關(guān)系,提出一種基于社區(qū)結(jié)構(gòu)性節(jié)點(diǎn)多標(biāo)簽隨機(jī)游走分類算法。算法主要思想是首先對網(wǎng)絡(luò)進(jìn)行社區(qū)劃分,然后將劃分社區(qū)多標(biāo)簽節(jié)點(diǎn)數(shù)據(jù)映射到圖上,通過圖來表示網(wǎng)絡(luò)中的節(jié)點(diǎn),節(jié)點(diǎn)之間的邊表示節(jié)點(diǎn)間的關(guān)系,通過隨機(jī)游走以及條件概率模型,節(jié)點(diǎn)與各個標(biāo)簽的相似性,計算出未標(biāo)簽節(jié)的從屬各個標(biāo)簽的概率分布情況,從而得到節(jié)點(diǎn)的分類集合。最后,本文通過在兩種數(shù)據(jù)集上進(jìn)行實驗,實驗結(jié)果表明本文提出的基于K近鄰的標(biāo)簽屬性相關(guān)算法與其屬性相比較能夠提高分類速度,得到良好的分類結(jié)果,此外基于社區(qū)結(jié)構(gòu)性節(jié)點(diǎn)多標(biāo)簽隨機(jī)游走算法與其他鏈接性分類算法相比在分類準(zhǔn)確程度上也得了很好的體現(xiàn)。
【關(guān)鍵詞】:社交網(wǎng)絡(luò) 多標(biāo)簽分類 K近鄰 隨機(jī)游走
【學(xué)位授予單位】:遼寧大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2015
【分類號】:TP311.13;TP393.09
【目錄】:
- 摘要4-6
- 英文摘要6-12
- 第1章 緒論12-19
- 1.1 研究背景及意義12-14
- 1.2 國內(nèi)外研究現(xiàn)狀14-16
- 1.2.1 基于屬性分類的研究現(xiàn)狀14-15
- 1.2.2 基于鏈接結(jié)構(gòu)的研究現(xiàn)狀15-16
- 1.3 本文主要工作與結(jié)構(gòu)安排16-19
- 1.3.1 主要工作16-17
- 1.3.2 論文結(jié)構(gòu)17-19
- 第2章 相關(guān)工作19-29
- 2.1 社交網(wǎng)絡(luò)相關(guān)概念和定義19-21
- 2.2 多標(biāo)簽分類21-24
- 2.3 經(jīng)典分類算法24-26
- 2.3.1 決策樹分類24-25
- 2.3.2 貝葉斯分類25-26
- 2.3.3 支持向量機(jī)26
- 2.4 鏈接分類算法26-28
- 2.4.1 迭代分類算法26-27
- 2.4.2 馬爾可夫邏輯網(wǎng)27-28
- 2.5 本章小結(jié)28-29
- 第3章 基于K近鄰節(jié)點(diǎn)屬性多標(biāo)簽分類算法29-40
- 3.1 問題描述29-30
- 3.2 基于K近鄰節(jié)點(diǎn)屬性的多標(biāo)簽分類算法30-38
- 3.2.1 概念與定義30-32
- 3.2.2 K近鄰算法32-34
- 3.2.3 算法思想34-36
- 3.2.4 算法設(shè)計36-38
- 3.3 算法分析38-39
- 3.4 本章小結(jié)39-40
- 第4章 基于社區(qū)結(jié)構(gòu)性節(jié)點(diǎn)多標(biāo)簽隨機(jī)游走算法40-50
- 4.1 問題描述40-41
- 4.2 基于社區(qū)結(jié)構(gòu)性節(jié)點(diǎn)多標(biāo)簽隨機(jī)游走算法41-48
- 4.2.1 概念與定義41-42
- 4.2.2 隨機(jī)游走模型42-44
- 4.2.3 算法思想44-46
- 4.2.4 算法設(shè)計46-48
- 4.3 算法分析48-49
- 4.4 本章小結(jié)49-50
- 第5章 實驗結(jié)果與分析50-56
- 5.1 實驗數(shù)據(jù)集50-51
- 5.2 實驗方案51-52
- 5.2.1 基于K近鄰節(jié)點(diǎn)屬性的多標(biāo)簽分類算法51
- 5.2.2 基于社區(qū)結(jié)構(gòu)性節(jié)點(diǎn)多標(biāo)簽隨機(jī)游走算法51-52
- 5.3 實驗結(jié)果與分析52-55
- 5.3.1 基于K近鄰節(jié)點(diǎn)屬性的多標(biāo)簽分類算法52-53
- 5.3.2 基于社區(qū)結(jié)構(gòu)性節(jié)點(diǎn)多標(biāo)簽隨機(jī)游走算法53-55
- 5.4 本章小結(jié)55-56
- 第6章 總結(jié)和展望56-58
- 6.1 本文工作內(nèi)容總結(jié)56-57
- 6.2 展望57-58
- 致謝58-59
- 參考文獻(xiàn)59-62
- 攻讀學(xué)位期間發(fā)表的學(xué)術(shù)論文及參加科研情況62-63
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 王若愚;方芳;葉昭;;流量分類技術(shù)精細(xì)管理網(wǎng)絡(luò)[J];中國教育網(wǎng)絡(luò);2012年02期
2 馬明成;莫曉俊;姜洪臣;徐波;;音頻分類技術(shù)在廣播質(zhì)量評估中的應(yīng)用[J];廣播與電視技術(shù);2010年10期
3 黃樹成;曲亞輝;;數(shù)據(jù)流分類技術(shù)研究綜述[J];計算機(jī)應(yīng)用研究;2009年10期
4 張俊,石功軍,王中平;信息處理過程中的分類技術(shù)[J];聲學(xué)技術(shù);2003年04期
5 張李,涂曉東,何誠;流分類技術(shù)的研究[J];電子科技大學(xué)學(xué)報;2004年06期
6 李洋;趙驊;;基于信息熵和決策分類技術(shù)的郵件識別研究[J];計算機(jī)科學(xué);2008年02期
7 夏雪;肖德寶;顧婷;;基于本體的報警分類技術(shù)在報警評估過程中的應(yīng)用與實現(xiàn)(英文)[J];北京交通大學(xué)學(xué)報;2008年06期
8 黃敏;何中市;;分類技術(shù)在高職教學(xué)質(zhì)量評價分析中的應(yīng)用[J];計算機(jī)工程與設(shè)計;2012年03期
9 王與;劉洋;;分類技術(shù)在高校教學(xué)管理中的應(yīng)用[J];滁州學(xué)院學(xué)報;2011年05期
10 段巍巍;許海濱;;基于分類技術(shù)的目標(biāo)客戶輔助定位方法研究[J];江蘇通信;2008年03期
中國重要會議論文全文數(shù)據(jù)庫 前1條
1 梁曉雯;閔友鋼;;音樂情感分類技術(shù)在媒體資產(chǎn)管理中的應(yīng)用[A];中國新聞技術(shù)工作者聯(lián)合會2008年學(xué)術(shù)年會論文集(下)[C];2008年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前1條
1 畢夏安;高性能包分類技術(shù)及其應(yīng)用研究[D];湖南大學(xué);2012年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 周方;社交網(wǎng)絡(luò)節(jié)點(diǎn)分類技術(shù)研究[D];遼寧大學(xué);2015年
2 叢蓉;基于采樣的網(wǎng)絡(luò)流量分類技術(shù)研究[D];北京郵電大學(xué);2012年
3 朱秋香;流分類技術(shù)研究及其原型系統(tǒng)的實現(xiàn)[D];東南大學(xué);2004年
4 張海笑;數(shù)據(jù)挖掘分類技術(shù)在高校教學(xué)中的應(yīng)用研究[D];廣東工業(yè)大學(xué);2005年
5 常慧;分類技術(shù)在稅收管理中的應(yīng)用[D];鄭州大學(xué);2003年
6 蔣杰;基于分類技術(shù)的電子支付平臺作弊賬戶的識別模型研究[D];浙江工業(yè)大學(xué);2012年
7 陳錚;基于音樂流派分類技術(shù)的音樂庫分類檢索系統(tǒng)的研究與實現(xiàn)[D];華東師范大學(xué);2012年
8 代麗;DFI流量分類技術(shù)的研究和實現(xiàn)[D];北京郵電大學(xué);2011年
9 楊傳耀;數(shù)字圖書館及其分類技術(shù)的研究[D];福州大學(xué);2004年
10 王國華;智能監(jiān)控中目標(biāo)檢測與分類技術(shù)的研究[D];安徽大學(xué);2012年
本文關(guān)鍵詞:社交網(wǎng)絡(luò)節(jié)點(diǎn)分類技術(shù)研究,由筆耕文化傳播整理發(fā)布。
,本文編號:336233
本文鏈接:http://www.sikaile.net/guanlilunwen/ydhl/336233.html