基于多粒度結(jié)構(gòu)的網(wǎng)絡(luò)表示學(xué)習(xí)方法研究
發(fā)布時(shí)間:2020-12-21 11:18
隨著大數(shù)據(jù)時(shí)代的來(lái)臨,社交網(wǎng)絡(luò)等迅速發(fā)展并產(chǎn)生海量且關(guān)系復(fù)雜的網(wǎng)絡(luò)數(shù)據(jù)且隱含很多重要且有價(jià)值的信息。面對(duì)海量數(shù)據(jù),傳統(tǒng)的鄰接矩陣等向量表示形式存在向量稀疏、計(jì)算復(fù)雜度高的問(wèn)題,而網(wǎng)絡(luò)表示學(xué)習(xí)將海量數(shù)據(jù)轉(zhuǎn)化為低維稠密的向量表示并將其作為常用的機(jī)器學(xué)習(xí)算法的輸入進(jìn)行網(wǎng)絡(luò)分析任務(wù),使得快速高效的進(jìn)行網(wǎng)絡(luò)分析成為可能,因此具有重要的研究意義。網(wǎng)絡(luò)表示學(xué)習(xí)的核心思想是在保留網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)特征的基礎(chǔ)上找到一個(gè)映射函數(shù),將網(wǎng)絡(luò)中的節(jié)點(diǎn)轉(zhuǎn)化為低維稠密的表示學(xué)習(xí)向量,進(jìn)而用于后續(xù)的網(wǎng)絡(luò)分析任務(wù)。已有的基于單粒度結(jié)構(gòu)的網(wǎng)絡(luò)表示方法主要包括基于矩陣分解的表示學(xué)習(xí)方法,基于隨機(jī)游走的表示學(xué)習(xí)方法,基于深度神經(jīng)網(wǎng)絡(luò)的表示學(xué)習(xí)方法等。然而,復(fù)雜網(wǎng)絡(luò)的一系列的研究證實(shí),現(xiàn)實(shí)世界中的許多網(wǎng)絡(luò)呈現(xiàn)出一種多粒度結(jié)構(gòu),且利用隨機(jī)游走方式挖掘網(wǎng)絡(luò)的結(jié)構(gòu)特征存在僅捕獲低階結(jié)構(gòu)而忽略網(wǎng)絡(luò)的高階結(jié)構(gòu)特征的缺點(diǎn),因此本研究在保留網(wǎng)絡(luò)局部結(jié)構(gòu)的基礎(chǔ)上,引入多粒度結(jié)構(gòu)特征提升網(wǎng)絡(luò)的網(wǎng)絡(luò)分析任務(wù)的準(zhǔn)確率。綜上所述,本文的主要研究工作包括:1.本文首先對(duì)網(wǎng)絡(luò)表示學(xué)習(xí)的背景知識(shí)做出簡(jiǎn)潔的介紹,充分調(diào)研國(guó)內(nèi)外有關(guān)網(wǎng)絡(luò)表示學(xué)習(xí)問(wèn)題的研究現(xiàn)狀以及基...
【文章來(lái)源】: 孫仙 安徽大學(xué)
【文章頁(yè)數(shù)】:60 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
網(wǎng)絡(luò)表示學(xué)習(xí)過(guò)程
鄭?渲形藜嘍講糠擲?米遠(yuǎn)?嗦肫?來(lái)重建節(jié)點(diǎn)的鄰域,有監(jiān)督部分當(dāng)嵌入空間的節(jié)點(diǎn)之間的距離相距較遠(yuǎn)時(shí)利用Laplacian特征映射[31]進(jìn)行映射,其框架如圖1.2[32]所示。DNGR結(jié)合隨機(jī)沖浪和深度自動(dòng)編碼器構(gòu)建模型,在輸入圖上使用隨機(jī)沖浪模型生成概率共生矩陣,并輸入到疊加去噪的自編碼器中獲得網(wǎng)絡(luò)表示向量。圖卷積網(wǎng)絡(luò)(GCNs)[37]通過(guò)迭代地合并節(jié)點(diǎn)鄰域嵌入,并利用映射函數(shù)和前一輪的映射函數(shù)來(lái)獲得新一輪的網(wǎng)絡(luò)嵌入。除此之外,有研究學(xué)者提出利用圖卷積和網(wǎng)絡(luò)節(jié)點(diǎn)的標(biāo)簽信息來(lái)獲得非監(jiān)督嵌入[38-43]的方法。圖1.2SDNE算法的框架Fig.1.2TheframeworkofSDNE隨著嵌入技術(shù)在自然語(yǔ)言處理領(lǐng)域取得重要突破,word2vec中的Skip-gram模型很大程度上影響網(wǎng)絡(luò)嵌入的最新進(jìn)展,它的輸入是由自然語(yǔ)言中的句子組成的文本語(yǔ)料庫(kù),輸出是語(yǔ)料庫(kù)中每個(gè)單詞的潛在向量表示[44]。受此設(shè)置啟發(fā),基于隨機(jī)游走的網(wǎng)絡(luò)表示學(xué)習(xí)方法受到越來(lái)越多學(xué)者的關(guān)注。DeepWalk[6]通過(guò)考慮通過(guò)隨機(jī)游動(dòng)在網(wǎng)絡(luò)上遍歷的節(jié)點(diǎn)路徑作為句子和學(xué)習(xí)節(jié)點(diǎn)表示,通過(guò)最大化預(yù)測(cè)其在步行序列中的上下文節(jié)點(diǎn)的可能性。隨機(jī)游動(dòng)已被用來(lái)逼近圖中的許多性質(zhì),包括節(jié)點(diǎn)中心性[45]和相似度[46]。隨著DeepWalk的出現(xiàn),越來(lái)越多的專(zhuān)家學(xué)者也將目光聚焦在基于隨機(jī)游走的表示學(xué)習(xí)方法研究。LINE[17]保留網(wǎng)絡(luò)中節(jié)點(diǎn)的一階相似性和二階近鄰性來(lái)分別優(yōu)化以獲得網(wǎng)絡(luò)表示向量。與DeepWalk不同,Node2Vec[18]將DFS和BFS探索結(jié)合在隨機(jī)漫游框架中。
安徽大學(xué)碩士學(xué)位論文7圖1.3論文的主要研究?jī)?nèi)容Fig.1.3Themainresearchcontentsofthedissertation1.3.2組織結(jié)構(gòu)針對(duì)上述研究?jī)?nèi)容,本文五大章節(jié)的具體結(jié)構(gòu)安排如下:第一章:緒論。本章介紹網(wǎng)絡(luò)表示學(xué)習(xí)問(wèn)題的主要研究背景及應(yīng)用意義;然后從本文的研究角度出發(fā),闡述網(wǎng)絡(luò)表示學(xué)習(xí)問(wèn)題不同解決方法下的國(guó)內(nèi)外研究現(xiàn)狀;最后對(duì)本文的研究?jī)?nèi)容和組織結(jié)構(gòu)進(jìn)行整體的介紹。第二章:相關(guān)理論知識(shí)。本章首先對(duì)網(wǎng)絡(luò)表示學(xué)習(xí)問(wèn)題進(jìn)行定義;然后詳細(xì)介紹本文所提算法的基礎(chǔ)模型,這是和本文密切相關(guān)的前人工作基礎(chǔ);接著介紹網(wǎng)絡(luò)表示學(xué)習(xí)問(wèn)題在本文中所使用的評(píng)價(jià)標(biāo)準(zhǔn);最后給出本章的總結(jié)。第三章:基于多粒度多粒度社團(tuán)結(jié)構(gòu)的網(wǎng)絡(luò)表示學(xué)習(xí)方法。首先對(duì)所研究的問(wèn)題進(jìn)行分析與定義,根據(jù)研究所面臨的挑戰(zhàn),給出相應(yīng)的解決方案。首先基于復(fù)雜網(wǎng)絡(luò)具有層次性社團(tuán)結(jié)構(gòu)的特點(diǎn),構(gòu)造多粒度網(wǎng)絡(luò),獲取網(wǎng)絡(luò)的多粒度社團(tuán)結(jié)構(gòu)特征信息。然后將粗粒度層的結(jié)構(gòu)特征向量作為上一層較細(xì)粒度的結(jié)構(gòu)特征向量的初始值來(lái)進(jìn)行特征傳遞以保留網(wǎng)絡(luò)的局部結(jié)構(gòu)和層間結(jié)構(gòu)特征。最后,基于該網(wǎng)絡(luò)表示向量,在多組公共數(shù)據(jù)集上進(jìn)行網(wǎng)絡(luò)分析任務(wù),以驗(yàn)證所提出的算法的有效性與適用性。第四章:基于多粒度高階結(jié)構(gòu)的網(wǎng)絡(luò)表示學(xué)習(xí)方法。首先對(duì)所研究的問(wèn)題進(jìn)行分析
【參考文獻(xiàn)】:
期刊論文
[1]大規(guī)模復(fù)雜信息網(wǎng)絡(luò)表示學(xué)習(xí):概念、方法與挑戰(zhàn)[J]. 齊金山,梁循,李志宇,陳燕方,許媛. 計(jì)算機(jī)學(xué)報(bào). 2018(10)
[2]網(wǎng)絡(luò)表示學(xué)習(xí)綜述[J]. 涂存超,楊成,劉知遠(yuǎn),孫茂松. 中國(guó)科學(xué):信息科學(xué). 2017(08)
本文編號(hào):2929739
【文章來(lái)源】: 孫仙 安徽大學(xué)
【文章頁(yè)數(shù)】:60 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
網(wǎng)絡(luò)表示學(xué)習(xí)過(guò)程
鄭?渲形藜嘍講糠擲?米遠(yuǎn)?嗦肫?來(lái)重建節(jié)點(diǎn)的鄰域,有監(jiān)督部分當(dāng)嵌入空間的節(jié)點(diǎn)之間的距離相距較遠(yuǎn)時(shí)利用Laplacian特征映射[31]進(jìn)行映射,其框架如圖1.2[32]所示。DNGR結(jié)合隨機(jī)沖浪和深度自動(dòng)編碼器構(gòu)建模型,在輸入圖上使用隨機(jī)沖浪模型生成概率共生矩陣,并輸入到疊加去噪的自編碼器中獲得網(wǎng)絡(luò)表示向量。圖卷積網(wǎng)絡(luò)(GCNs)[37]通過(guò)迭代地合并節(jié)點(diǎn)鄰域嵌入,并利用映射函數(shù)和前一輪的映射函數(shù)來(lái)獲得新一輪的網(wǎng)絡(luò)嵌入。除此之外,有研究學(xué)者提出利用圖卷積和網(wǎng)絡(luò)節(jié)點(diǎn)的標(biāo)簽信息來(lái)獲得非監(jiān)督嵌入[38-43]的方法。圖1.2SDNE算法的框架Fig.1.2TheframeworkofSDNE隨著嵌入技術(shù)在自然語(yǔ)言處理領(lǐng)域取得重要突破,word2vec中的Skip-gram模型很大程度上影響網(wǎng)絡(luò)嵌入的最新進(jìn)展,它的輸入是由自然語(yǔ)言中的句子組成的文本語(yǔ)料庫(kù),輸出是語(yǔ)料庫(kù)中每個(gè)單詞的潛在向量表示[44]。受此設(shè)置啟發(fā),基于隨機(jī)游走的網(wǎng)絡(luò)表示學(xué)習(xí)方法受到越來(lái)越多學(xué)者的關(guān)注。DeepWalk[6]通過(guò)考慮通過(guò)隨機(jī)游動(dòng)在網(wǎng)絡(luò)上遍歷的節(jié)點(diǎn)路徑作為句子和學(xué)習(xí)節(jié)點(diǎn)表示,通過(guò)最大化預(yù)測(cè)其在步行序列中的上下文節(jié)點(diǎn)的可能性。隨機(jī)游動(dòng)已被用來(lái)逼近圖中的許多性質(zhì),包括節(jié)點(diǎn)中心性[45]和相似度[46]。隨著DeepWalk的出現(xiàn),越來(lái)越多的專(zhuān)家學(xué)者也將目光聚焦在基于隨機(jī)游走的表示學(xué)習(xí)方法研究。LINE[17]保留網(wǎng)絡(luò)中節(jié)點(diǎn)的一階相似性和二階近鄰性來(lái)分別優(yōu)化以獲得網(wǎng)絡(luò)表示向量。與DeepWalk不同,Node2Vec[18]將DFS和BFS探索結(jié)合在隨機(jī)漫游框架中。
安徽大學(xué)碩士學(xué)位論文7圖1.3論文的主要研究?jī)?nèi)容Fig.1.3Themainresearchcontentsofthedissertation1.3.2組織結(jié)構(gòu)針對(duì)上述研究?jī)?nèi)容,本文五大章節(jié)的具體結(jié)構(gòu)安排如下:第一章:緒論。本章介紹網(wǎng)絡(luò)表示學(xué)習(xí)問(wèn)題的主要研究背景及應(yīng)用意義;然后從本文的研究角度出發(fā),闡述網(wǎng)絡(luò)表示學(xué)習(xí)問(wèn)題不同解決方法下的國(guó)內(nèi)外研究現(xiàn)狀;最后對(duì)本文的研究?jī)?nèi)容和組織結(jié)構(gòu)進(jìn)行整體的介紹。第二章:相關(guān)理論知識(shí)。本章首先對(duì)網(wǎng)絡(luò)表示學(xué)習(xí)問(wèn)題進(jìn)行定義;然后詳細(xì)介紹本文所提算法的基礎(chǔ)模型,這是和本文密切相關(guān)的前人工作基礎(chǔ);接著介紹網(wǎng)絡(luò)表示學(xué)習(xí)問(wèn)題在本文中所使用的評(píng)價(jià)標(biāo)準(zhǔn);最后給出本章的總結(jié)。第三章:基于多粒度多粒度社團(tuán)結(jié)構(gòu)的網(wǎng)絡(luò)表示學(xué)習(xí)方法。首先對(duì)所研究的問(wèn)題進(jìn)行分析與定義,根據(jù)研究所面臨的挑戰(zhàn),給出相應(yīng)的解決方案。首先基于復(fù)雜網(wǎng)絡(luò)具有層次性社團(tuán)結(jié)構(gòu)的特點(diǎn),構(gòu)造多粒度網(wǎng)絡(luò),獲取網(wǎng)絡(luò)的多粒度社團(tuán)結(jié)構(gòu)特征信息。然后將粗粒度層的結(jié)構(gòu)特征向量作為上一層較細(xì)粒度的結(jié)構(gòu)特征向量的初始值來(lái)進(jìn)行特征傳遞以保留網(wǎng)絡(luò)的局部結(jié)構(gòu)和層間結(jié)構(gòu)特征。最后,基于該網(wǎng)絡(luò)表示向量,在多組公共數(shù)據(jù)集上進(jìn)行網(wǎng)絡(luò)分析任務(wù),以驗(yàn)證所提出的算法的有效性與適用性。第四章:基于多粒度高階結(jié)構(gòu)的網(wǎng)絡(luò)表示學(xué)習(xí)方法。首先對(duì)所研究的問(wèn)題進(jìn)行分析
【參考文獻(xiàn)】:
期刊論文
[1]大規(guī)模復(fù)雜信息網(wǎng)絡(luò)表示學(xué)習(xí):概念、方法與挑戰(zhàn)[J]. 齊金山,梁循,李志宇,陳燕方,許媛. 計(jì)算機(jī)學(xué)報(bào). 2018(10)
[2]網(wǎng)絡(luò)表示學(xué)習(xí)綜述[J]. 涂存超,楊成,劉知遠(yuǎn),孫茂松. 中國(guó)科學(xué):信息科學(xué). 2017(08)
本文編號(hào):2929739
本文鏈接:http://www.sikaile.net/shoufeilunwen/benkebiyelunwen/2929739.html
最近更新
教材專(zhuān)著