差分隱私圖聚類與生成技術研究
發(fā)布時間:2021-09-07 12:38
隨著信息技術的飛速發(fā)展和便攜式移動互聯(lián)設備的廣泛使用,大量的個人用戶數(shù)據(jù)被互聯(lián)網(wǎng)服務商所廣泛搜集,例如由各類App所產(chǎn)生的位置數(shù)據(jù)、社交網(wǎng)絡數(shù)據(jù)、個人健康狀態(tài)數(shù)據(jù)等等。這些數(shù)據(jù)的搜集一方面能使得服務提供商能為用戶提供更好的個性化推薦服務,但另一方面也給用戶隱私帶來了前所未有的挑戰(zhàn),一旦數(shù)據(jù)泄露就可能會威脅到用戶的財產(chǎn)甚至生命安全。最近幾年頻繁發(fā)生的大規(guī)模數(shù)據(jù)泄漏事件進一步加深了人們對用戶隱私數(shù)據(jù)泄露方面的擔憂。因此,如何在保證隱私數(shù)據(jù)安全的前提下充分挖掘并利用數(shù)據(jù)也已成了網(wǎng)絡安全領域的一個研究熱點。差分隱私技術可以精細量化隱私保護水平,又能在一定程度上保留數(shù)據(jù)的可用性,已成為隱私保護領域事實上的標準,得到了學術界和工業(yè)界的廣泛關注。針對各種網(wǎng)絡信息系統(tǒng)產(chǎn)生的大量圖數(shù)據(jù)在實際應用中所面臨的隱私泄露問題,本文主要研究了差分隱私下的圖數(shù)據(jù)聚類和合成圖生成技術,并取得以下成果:1.針對圖數(shù)據(jù)聚類分析過程中的隱私泄露問題,以一個經(jīng)典的圖聚類算法SCAN(Structural Clustering Algorithm for Networks)為基礎,通過定義相關圖的邊差分隱私,并合理測定計算圖中...
【文章來源】:戰(zhàn)略支援部隊信息工程大學河南省
【文章頁數(shù)】:45 頁
【學位級別】:碩士
【部分圖文】:
不同隱私預算對NMI值的影響
第三章基于結構相似度的差分隱私圖聚類算法第19頁果顯著增加,ARI值和NMI值都可達80%左右。再隨著隱私預算的增大,ARI值和NMI值都緩慢增加,DP-SCAN算法的聚類效果也隨之緩慢增加。圖3.3給出了在隱私預算=10,閾值μ=5時,不同數(shù)據(jù)集上鄰域β對ARI值的影響。我們可以看出,ARI值隨著鄰域β的增大而先減小后增大。當鄰域β=0.6左右時,ARI值達到最小值,DP-SCAN算法的聚類結果與SCAN算法的聚類結果相差較大。因為SCAN算法的適當鄰域β值為0.7,鄰域β值在0.5到0.8之間通常足以獲得良好的聚類結果,然后在此時DP-SCAN算法加入隱私預算引入噪聲機制會大大降低聚類效果。(a)CA-AstroPh-ARI值(b)CA-CondMat-ARI值(c)Email-Enron-ARI值圖3.3不同鄰域?qū)RI值的影響圖3.4給出了在隱私預算=10,閾值μ=5時,不同數(shù)據(jù)集上鄰域β對NMI值的影響。我們可以看出,NMI值同ARI值一樣,都隨著鄰域β的增大而先減小后增大。當鄰域β=0.6左右時,NMI值達到最小值,DP-SCAN算法的聚類結果與SCAN算法的聚類結果相差較大。(a)CA-AstroPh-NMI值(b)CA-CondMat-NMI值(c)Email-Enron-NMI值圖3.4不同鄰域?qū)MI值的影響綜上所述,結合圖3.3和圖3.4的分析可知,當鄰域β逐漸增大時,ARI值和NMI值都先減小后增大。當鄰域β在0.5到0.8之間時,SCAN算法有良好的聚類效果,但引入噪聲機制的DP-SCAN算法的聚類效果較差,評估指標ARI值和NMI值都較校3.5本章小結本章重點研究了基于結構相似度的差分隱私圖聚類算法的設計問題。針對經(jīng)典的圖聚
第三章基于結構相似度的差分隱私圖聚類算法第19頁果顯著增加,ARI值和NMI值都可達80%左右。再隨著隱私預算的增大,ARI值和NMI值都緩慢增加,DP-SCAN算法的聚類效果也隨之緩慢增加。圖3.3給出了在隱私預算=10,閾值μ=5時,不同數(shù)據(jù)集上鄰域β對ARI值的影響。我們可以看出,ARI值隨著鄰域β的增大而先減小后增大。當鄰域β=0.6左右時,ARI值達到最小值,DP-SCAN算法的聚類結果與SCAN算法的聚類結果相差較大。因為SCAN算法的適當鄰域β值為0.7,鄰域β值在0.5到0.8之間通常足以獲得良好的聚類結果,然后在此時DP-SCAN算法加入隱私預算引入噪聲機制會大大降低聚類效果。(a)CA-AstroPh-ARI值(b)CA-CondMat-ARI值(c)Email-Enron-ARI值圖3.3不同鄰域?qū)RI值的影響圖3.4給出了在隱私預算=10,閾值μ=5時,不同數(shù)據(jù)集上鄰域β對NMI值的影響。我們可以看出,NMI值同ARI值一樣,都隨著鄰域β的增大而先減小后增大。當鄰域β=0.6左右時,NMI值達到最小值,DP-SCAN算法的聚類結果與SCAN算法的聚類結果相差較大。(a)CA-AstroPh-NMI值(b)CA-CondMat-NMI值(c)Email-Enron-NMI值圖3.4不同鄰域?qū)MI值的影響綜上所述,結合圖3.3和圖3.4的分析可知,當鄰域β逐漸增大時,ARI值和NMI值都先減小后增大。當鄰域β在0.5到0.8之間時,SCAN算法有良好的聚類效果,但引入噪聲機制的DP-SCAN算法的聚類效果較差,評估指標ARI值和NMI值都較校3.5本章小結本章重點研究了基于結構相似度的差分隱私圖聚類算法的設計問題。針對經(jīng)典的圖聚
【參考文獻】:
期刊論文
[1]基于邊介數(shù)模型的差分隱私保護方案[J]. 黃海平,王凱,湯雄,張東軍. 通信學報. 2019(05)
[2]Publishing Social Graphs with Differential Privacy Guarantees Based on wPINQ[J]. LI Xiaoye,YANG Jing,SUN Zhenlong,ZHANG Jianpei. Chinese Journal of Electronics. 2019(02)
[3]點差分隱私下圖數(shù)據(jù)的度直方圖發(fā)布方法[J]. 張宇軒,魏江宏,李霽,劉文芬,胡學先. 計算機研究與發(fā)展. 2019(03)
[4]基于差分隱私保護的社交網(wǎng)絡發(fā)布圖生成模型[J]. 王俊麗,柳先輝,管敏. 同濟大學學報(自然科學版). 2017(08)
[5]基于差分隱私保護的DP-DBScan聚類算法研究[J]. 吳偉民,黃煥坤. 計算機工程與科學. 2015(04)
[6]差分隱私保護及其應用[J]. 熊平,朱天清,王曉峰. 計算機學報. 2014(01)
[7]差分隱私保護k-means聚類方法研究[J]. 李楊,郝志峰,溫雯,謝光強. 計算機科學. 2013(03)
本文編號:3389562
【文章來源】:戰(zhàn)略支援部隊信息工程大學河南省
【文章頁數(shù)】:45 頁
【學位級別】:碩士
【部分圖文】:
不同隱私預算對NMI值的影響
第三章基于結構相似度的差分隱私圖聚類算法第19頁果顯著增加,ARI值和NMI值都可達80%左右。再隨著隱私預算的增大,ARI值和NMI值都緩慢增加,DP-SCAN算法的聚類效果也隨之緩慢增加。圖3.3給出了在隱私預算=10,閾值μ=5時,不同數(shù)據(jù)集上鄰域β對ARI值的影響。我們可以看出,ARI值隨著鄰域β的增大而先減小后增大。當鄰域β=0.6左右時,ARI值達到最小值,DP-SCAN算法的聚類結果與SCAN算法的聚類結果相差較大。因為SCAN算法的適當鄰域β值為0.7,鄰域β值在0.5到0.8之間通常足以獲得良好的聚類結果,然后在此時DP-SCAN算法加入隱私預算引入噪聲機制會大大降低聚類效果。(a)CA-AstroPh-ARI值(b)CA-CondMat-ARI值(c)Email-Enron-ARI值圖3.3不同鄰域?qū)RI值的影響圖3.4給出了在隱私預算=10,閾值μ=5時,不同數(shù)據(jù)集上鄰域β對NMI值的影響。我們可以看出,NMI值同ARI值一樣,都隨著鄰域β的增大而先減小后增大。當鄰域β=0.6左右時,NMI值達到最小值,DP-SCAN算法的聚類結果與SCAN算法的聚類結果相差較大。(a)CA-AstroPh-NMI值(b)CA-CondMat-NMI值(c)Email-Enron-NMI值圖3.4不同鄰域?qū)MI值的影響綜上所述,結合圖3.3和圖3.4的分析可知,當鄰域β逐漸增大時,ARI值和NMI值都先減小后增大。當鄰域β在0.5到0.8之間時,SCAN算法有良好的聚類效果,但引入噪聲機制的DP-SCAN算法的聚類效果較差,評估指標ARI值和NMI值都較校3.5本章小結本章重點研究了基于結構相似度的差分隱私圖聚類算法的設計問題。針對經(jīng)典的圖聚
第三章基于結構相似度的差分隱私圖聚類算法第19頁果顯著增加,ARI值和NMI值都可達80%左右。再隨著隱私預算的增大,ARI值和NMI值都緩慢增加,DP-SCAN算法的聚類效果也隨之緩慢增加。圖3.3給出了在隱私預算=10,閾值μ=5時,不同數(shù)據(jù)集上鄰域β對ARI值的影響。我們可以看出,ARI值隨著鄰域β的增大而先減小后增大。當鄰域β=0.6左右時,ARI值達到最小值,DP-SCAN算法的聚類結果與SCAN算法的聚類結果相差較大。因為SCAN算法的適當鄰域β值為0.7,鄰域β值在0.5到0.8之間通常足以獲得良好的聚類結果,然后在此時DP-SCAN算法加入隱私預算引入噪聲機制會大大降低聚類效果。(a)CA-AstroPh-ARI值(b)CA-CondMat-ARI值(c)Email-Enron-ARI值圖3.3不同鄰域?qū)RI值的影響圖3.4給出了在隱私預算=10,閾值μ=5時,不同數(shù)據(jù)集上鄰域β對NMI值的影響。我們可以看出,NMI值同ARI值一樣,都隨著鄰域β的增大而先減小后增大。當鄰域β=0.6左右時,NMI值達到最小值,DP-SCAN算法的聚類結果與SCAN算法的聚類結果相差較大。(a)CA-AstroPh-NMI值(b)CA-CondMat-NMI值(c)Email-Enron-NMI值圖3.4不同鄰域?qū)MI值的影響綜上所述,結合圖3.3和圖3.4的分析可知,當鄰域β逐漸增大時,ARI值和NMI值都先減小后增大。當鄰域β在0.5到0.8之間時,SCAN算法有良好的聚類效果,但引入噪聲機制的DP-SCAN算法的聚類效果較差,評估指標ARI值和NMI值都較校3.5本章小結本章重點研究了基于結構相似度的差分隱私圖聚類算法的設計問題。針對經(jīng)典的圖聚
【參考文獻】:
期刊論文
[1]基于邊介數(shù)模型的差分隱私保護方案[J]. 黃海平,王凱,湯雄,張東軍. 通信學報. 2019(05)
[2]Publishing Social Graphs with Differential Privacy Guarantees Based on wPINQ[J]. LI Xiaoye,YANG Jing,SUN Zhenlong,ZHANG Jianpei. Chinese Journal of Electronics. 2019(02)
[3]點差分隱私下圖數(shù)據(jù)的度直方圖發(fā)布方法[J]. 張宇軒,魏江宏,李霽,劉文芬,胡學先. 計算機研究與發(fā)展. 2019(03)
[4]基于差分隱私保護的社交網(wǎng)絡發(fā)布圖生成模型[J]. 王俊麗,柳先輝,管敏. 同濟大學學報(自然科學版). 2017(08)
[5]基于差分隱私保護的DP-DBScan聚類算法研究[J]. 吳偉民,黃煥坤. 計算機工程與科學. 2015(04)
[6]差分隱私保護及其應用[J]. 熊平,朱天清,王曉峰. 計算機學報. 2014(01)
[7]差分隱私保護k-means聚類方法研究[J]. 李楊,郝志峰,溫雯,謝光強. 計算機科學. 2013(03)
本文編號:3389562
本文鏈接:http://www.sikaile.net/shoufeilunwen/xixikjs/3389562.html
最近更新
教材專著