天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 軟件論文 >

支持隱私計(jì)算的非結(jié)構(gòu)化大數(shù)據(jù)查詢處理

發(fā)布時(shí)間:2021-01-25 18:27
  如今信息廣泛流通,大數(shù)據(jù)已成為不可或缺的時(shí)代產(chǎn)物,借助大數(shù)據(jù)技術(shù)展現(xiàn)出的優(yōu)勢(shì)愈發(fā)顯著。這也促使人們需要不斷探索更高效的新技術(shù)對(duì)大數(shù)據(jù)進(jìn)行處理,包括數(shù)據(jù)的存儲(chǔ)、查詢和分析等。其中,大數(shù)據(jù)查詢處理在信息整合篩選等過程占有重要地位。然而,當(dāng)人們從大數(shù)據(jù)技術(shù)中受益時(shí),保護(hù)個(gè)人隱私也變得越來越困難,非法泄露個(gè)人信息或利用數(shù)據(jù)挖掘分析潛在的敏感數(shù)據(jù)等現(xiàn)象頻發(fā),導(dǎo)致個(gè)人隱私岌岌可危,因此隱私保護(hù)亟待得到更多的關(guān)注。經(jīng)研究發(fā)現(xiàn),在大數(shù)據(jù)查詢領(lǐng)域中對(duì)相似性連接查詢的研究大多面向查詢時(shí)間優(yōu)化,而其作為數(shù)據(jù)處理中的基本操作之一,在提升查詢效率的同時(shí)也應(yīng)關(guān)注個(gè)人隱私的保護(hù),因?yàn)閮蓚(gè)或多個(gè)文件之間的連接更容易識(shí)別出個(gè)體身份造成信息泄露。相似連接需耗費(fèi)大量資源和時(shí)間,在滿足高效性的前提下平衡數(shù)據(jù)機(jī)密性和可用性也是一項(xiàng)挑戰(zhàn)。綜合以上考慮因素,一種基于MapReduce的隱私保護(hù)相似性連接查詢(以下簡(jiǎn)稱PSJoin)設(shè)法給出了一個(gè)解決方案。具體而言,PSJoin確保了在相似性連接查詢過程中和結(jié)果發(fā)布后的數(shù)據(jù)隱私性,該工作重點(diǎn)研究隱私泄露問題,定義了隱私相似連接查詢,并搭建整體框架,提出一種隱私全局排序策略來處理前綴過... 

【文章來源】:華中科技大學(xué)湖北省 211工程院校 985工程院校 教育部直屬院校

【文章頁數(shù)】:58 頁

【學(xué)位級(jí)別】:碩士

【部分圖文】:

支持隱私計(jì)算的非結(jié)構(gòu)化大數(shù)據(jù)查詢處理


DPGO性能測(cè)試

條形圖,相對(duì)誤差,隱私保護(hù)


華 中 科 技 大 學(xué) 碩 士 學(xué) 位 論 文圍從 0.25 到 1,RE 與 的條形圖見圖 4.2,RE 普遍較低,說明相似對(duì)的輸出受到擾動(dòng)的影響較小,相似對(duì)的統(tǒng)計(jì)數(shù)有很高的準(zhǔn)確性,呈現(xiàn)這種形勢(shì)主要是因?yàn)?DPGO對(duì)相似對(duì)的數(shù)量幾乎沒有影響,參見圖 4.1,而本文提出的差分隱私相似度函數(shù)是在相似值上實(shí)施的擾動(dòng),因此,像相似記錄號(hào)、相似對(duì)數(shù)目等的查詢操作仍然可以得到準(zhǔn)確答復(fù)。額外的,如果有對(duì)這方面的隱私保護(hù)需求,本課題也可以為該查詢提供差分隱私保護(hù)策略,即是在輸出結(jié)果數(shù)目上進(jìn)行擾動(dòng),不過需要修正隱私保護(hù)全局敏感度,還可以采用 3.1 章節(jié)中提到主要針對(duì)非數(shù)值型輸出的指數(shù)機(jī)制,由于實(shí)際結(jié)果顯示的效果類似以及篇幅所限,本文忽略了詳細(xì)的描述。

數(shù)據(jù)集,運(yùn)行時(shí)間,相似度函數(shù),隱私


(c) CITESEERX 數(shù)據(jù)集 (d) DBLP+數(shù)據(jù)集圖 4.3 PSJoin 的性能測(cè)試4.3 擴(kuò)展性分析為了評(píng)估所提出方法的查詢效率及可擴(kuò)展性,本節(jié)測(cè)量了 PSJoin 在不同數(shù)據(jù)集上不同階段的運(yùn)行時(shí)間。設(shè)置了四個(gè)典型相似性閾值 ,范圍從 0.4 到 1。根據(jù)前面的研究發(fā)現(xiàn),2 對(duì) PSJoin 算法的運(yùn)行時(shí)間影響不大,差分隱私相似度函數(shù)和 BSJoin的相似度函數(shù)的時(shí)間復(fù)雜度都是平方量級(jí)的,因此本實(shí)驗(yàn)可以忽略其值的變化對(duì)查詢時(shí)間的影響,將其設(shè)定為 = 1.0。但是,實(shí)驗(yàn)發(fā)現(xiàn) DPGO 與執(zhí)行時(shí)間是密切相關(guān)的,因?yàn)樗鼘⒅苯涌刂魄熬Y過濾的效果,候選集的大小影響著需要進(jìn)行相似度計(jì)算的次數(shù),進(jìn)而對(duì)查詢時(shí)間造成影響。因此,本實(shí)驗(yàn)設(shè)定了1 等于 0.5 或 0.75,在相同的因素下比較了四個(gè)不同數(shù)據(jù)集的查詢時(shí)間。圖 4.4 和圖 4.5 顯示了四個(gè)數(shù)據(jù)集上 PSJoin 的運(yùn)行時(shí)間,圖 4.4 中 設(shè)置為 0.5,圖 4.5 中 設(shè)置為 0.75。為了進(jìn)一步明確隱私相似連接查詢不同階段的運(yùn)行時(shí)間,本

【參考文獻(xiàn)】:
期刊論文
[1]大數(shù)據(jù)相似性連接查詢技術(shù)研究進(jìn)展[J]. 馬友忠,張智輝,林春杰.  計(jì)算機(jī)應(yīng)用. 2018(04)
[2]大數(shù)據(jù)安全與隱私保護(hù)研究進(jìn)展[J]. 曹珍富,董曉蕾,周俊,沈佳辰,寧建廷,鞏俊卿.  計(jì)算機(jī)研究與發(fā)展. 2016(10)



本文編號(hào):2999679

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/2999679.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶dc84b***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com