天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 軟件論文 >

基于負數據庫的隱私保護k-means聚類算法研究

發(fā)布時間:2022-09-30 21:14
  在大數據時代,用戶的隱私保護是一個關鍵問題。作為數據挖掘的經典算法,原始k-means算法常用于對明文數據進行聚類分析,沒有考慮到隱私保護的問題。已有工作研究支持隱私保護的k-means算法,但是一般有計算成本高(例如加密算法),精度損失大(例如數據擾動方法),通訊成本高(例如安全多方計算)等缺點。負數據庫作為一種新型的數據表示方法,存儲的是原始數據庫補集中的信息,其難以逆轉的特性可以用于保護原始數據的隱私。負數據庫支持距離度量,可以被應用到k-means聚類分析中保護隱私。負數據庫上現有的隱私保護k-means算法只能支持基于海明距離的相似度計算,但是現實中很多數據的相似度計算都是基于歐式距離的,這大大限制了該方法的適用范圍。并且該方法將實數轉化為二進制編碼,編碼的長度取決于數據庫中不同實數值的數目,這使得該方法僅適用于結構簡單、屬性值少的數據,實用性較差。針對上述情況,本文利用歐氏距離二進制數編碼方式中編碼位數只與屬性值大小相關的特點,提出了面向負數據庫的歐氏距離計算公式。在此基礎之上,提出了一種新的基于負數據庫的隱私保護k-means聚類算法,并改進了負數據庫的生成算法以進一步提... 

【文章頁數】:59 頁

【學位級別】:碩士

【文章目錄】:
摘要
Abstract
符號和名詞解釋
第1章 緒論
    1.1 研究背景及意義
    1.2 國內外研究現狀
        1.2.1 支持隱私保護的k-means聚類分析
        1.2.2 負數據庫概述及應用
        1.2.3 負數據庫生成算法
    1.3 本文主要內容和結構
第2章 基于K-NDB的隱私保護k-means算法
    2.1 相關工作
        2.1.1 k-means聚類算法
        2.1.2 K-hidden負數據庫生成算法
    2.2 面向負數據庫的歐氏距離估算方法
        2.2.1 理論推導
        2.2.2 實驗驗證
    2.3 隱私保護的k-means聚類算法
        2.3.1 算法設計
        2.3.2 實驗驗證
    2.4 本章小結
第3章 基于QK-NDB的隱私保護k-means算法
    3.1 QK-hidden負數據庫生成算法
    3.2 細粒度的隱私保護k-means算法
    3.3 實驗
        3.3.1 誤差實驗
        3.3.2 對比實驗
    3.4 小結
第4章 總結和展望
    4.1 總結
    4.2 展望
致謝
參考文獻
攻讀碩士學位期間主要的工作


【參考文獻】:
期刊論文
[1]大數據時代的個人隱私保護[J]. 劉雅輝,張鐵贏,靳小龍,程學旗.  計算機研究與發(fā)展. 2015(01)
[2]MD5加密算法的研究及應用[J]. 魏曉玲.  信息技術. 2010(07)

博士論文
[1]信息負表示的若干應用方案研究[D]. 趙冬冬.中國科學技術大學 2016
[2]負數據庫生成算法及應用研究[D]. 劉然.中國科學技術大學 2013

碩士論文
[1]隱私保護聚類挖掘方法的研究[D]. 徐一鳳.哈爾濱工程大學 2010



本文編號:3684285

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/3684285.html


Copyright(c)文論論文網All Rights Reserved | 網站地圖 |

版權申明:資料由用戶18c52***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com