面向最優(yōu)效用的機(jī)器學(xué)習(xí)隱私模型
[Abstract]:Because of the development of various technologies, privacy issues have become a high demand, because more and more personal data are shared through different organizations, devices, and the Internet of things, which brings risks to the privacy and use of personal data. Especially when confidentiality is realized, the utility of data set is decreasing. Therefore, the new problem is to keep the privacy of a larger data set while preserving multi-utility. In this study, a new privacy model is established. The model uses Flash sorting algorithm and K _ anonymity combined with C4.5 classification technology to protect privacy data while preserving the optimal utility of data sets. The first step of this method is to use powerful data privacy grant technology on statistical data sets with 30162 records and attributes, and select the best K-anonymous data set using flash sorting algorithm. Set the privacy level to 2, and then make the dataset as useful as possible through the C 4.5 classification process. Further, by reducing the size of the statistical data set by half (15081 records), then using the same method to test. Then reduce the number of attributes, using the same algorithm for testing. The results of this study reveal some important results. Compared with other studies, the method in this paper is able to maintain the accuracy of the data. The results show that the data set is 90.77% useful, and when the size of the data set is reduced to half, The loss of data utility is only 0.5. When the attribute of data set is reduced, the loss of utility is only 2.28. When the size of the data set is large, the loss is 1.24 when compared with the original non-anonymous data set. Although it provides a high precision result, it can not obtain the maximum expectation on a larger data set. The results show that our method can provide the lowest utility value and attribute reduction number when reducing the number of data sets. The study predicts that changing privacy methods and using different types of classifiers will produce better results in the future, especially when dealing with larger data sets.
【學(xué)位授予單位】:哈爾濱工業(yè)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2017
【分類號(hào)】:TP309;TP181
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 郭慶,陳純;基于整合效用的多議題協(xié)商優(yōu)化[J];軟件學(xué)報(bào);2004年05期
2 何振峰,熊范綸;基于限制的分類效用及其應(yīng)用[J];小型微型計(jì)算機(jī)系統(tǒng);2004年12期
3 夏娜;蔣建國;于春華;吳瓊;;一種基于利益均衡的聯(lián)盟形成策略[J];控制與決策;2005年12期
4 尹翔;蔣建國;夏娜;蘇兆品;張國富;;基于模糊評(píng)判的Agent聯(lián)盟效用分配[J];計(jì)算機(jī)工程與應(yīng)用;2006年30期
5 徐選華;陳曉紅;王紅偉;;一種面向效用值偏好信息的大群體決策方法[J];控制與決策;2009年03期
6 余光柱;李克清;易先軍;邵世煌;;一種基于劃分的高效用長項(xiàng)集挖掘算法[J];計(jì)算機(jī)工程與應(yīng)用;2007年29期
7 鄧寒冰;張霞;劉積仁;;效用驅(qū)動(dòng)的多agent合作機(jī)制[J];通信學(xué)報(bào);2013年07期
8 孔健;;試論圖書館效益的計(jì)量方法[J];圖書館學(xué)研究;1990年03期
9 閆愛梅;程曉榮;王玉輝;;基于學(xué)習(xí)的多Agent多議題協(xié)商優(yōu)化研究[J];計(jì)算機(jī)工程與應(yīng)用;2008年02期
10 劉勘;郭洋;潘演;;基于多維效用合并的信息系統(tǒng)評(píng)價(jià)研究[J];情報(bào)理論與實(shí)踐;2012年03期
相關(guān)會(huì)議論文 前10條
1 王克強(qiáng);劉紅梅;;土地對(duì)農(nóng)民的效用研究——兼論土地資產(chǎn)特性的演化規(guī)律[A];不動(dòng)產(chǎn)開發(fā)與投資和不動(dòng)產(chǎn)金融——2005年海峽兩岸土地學(xué)術(shù)研討會(huì)論文集[C];2005年
2 吳鵬;;習(xí)慣、偏好與效用[A];中國制度經(jīng)濟(jì)學(xué)年會(huì)論文集[C];2003年
3 王玨;;歸納機(jī)器學(xué)習(xí)[A];2001年中國智能自動(dòng)化會(huì)議論文集(上冊(cè))[C];2001年
4 王昊;李銀波;紀(jì)志梁;;利用機(jī)器學(xué)習(xí)方法預(yù)測(cè)嚴(yán)重藥物不良反應(yīng)-呼吸困難[A];中國化學(xué)會(huì)第28屆學(xué)術(shù)年會(huì)第13分會(huì)場(chǎng)摘要集[C];2012年
5 吳滄浦;;智能系統(tǒng)與機(jī)器學(xué)習(xí)的新領(lǐng)域[A];西部大開發(fā) 科教先行與可持續(xù)發(fā)展——中國科協(xié)2000年學(xué)術(shù)年會(huì)文集[C];2000年
6 周晴杰;徐立鴻;吳啟迪;;機(jī)器學(xué)習(xí)串級(jí)結(jié)構(gòu)的初步探討[A];1998年中國控制會(huì)議論文集[C];1998年
7 李剛;郭崇慧;林鴻飛;楊志豪;唐煥文;;基于詞典法和機(jī)器學(xué)習(xí)法相結(jié)合的蛋白質(zhì)名識(shí)別[A];大連理工大學(xué)生物醫(yī)學(xué)工程學(xué)術(shù)論文集(第2卷)[C];2005年
8 徐禮勝;李乃民;王寬全;張冬雨;耿斌;姜曉睿;陳超海;羅貴存;;機(jī)器學(xué)習(xí)在中醫(yī)計(jì)算機(jī)診斷識(shí)別系統(tǒng)中的應(yīng)用思考[A];第一屆全國中西醫(yī)結(jié)合診斷學(xué)術(shù)會(huì)議論文選集[C];2006年
9 蔡健平;林世平;;基于機(jī)器學(xué)習(xí)的詞語和句子極性分析[A];第三屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2007年
10 黃金鐵;李景銀;周建常;;對(duì)高爐爐況評(píng)價(jià)模型參數(shù)的機(jī)器學(xué)習(xí)——一個(gè)三類線性模式分類器的實(shí)現(xiàn)[A];1995中國控制與決策學(xué)術(shù)年會(huì)論文集[C];1995年
相關(guān)重要報(bào)紙文章 前10條
1 何志高;效用雖主觀 測(cè)定有方法[N];醫(yī)藥經(jīng)濟(jì)報(bào);2001年
2 記者 劉小微;環(huán)境風(fēng)險(xiǎn)管理“利器”效用值得期待[N];金融時(shí)報(bào);2013年
3 美國加州州立大學(xué)(長堤)商學(xué)院教授 美國華裔教授學(xué)者學(xué)會(huì)(南加州)秘書長 孫滌;財(cái)富與滿足成正比嗎?[N];上海證券報(bào);2012年
4 黎驪/文 [美] Tom M.Mitchell 著;機(jī)器學(xué)習(xí)與智能化社會(huì)[N];中國郵政報(bào);2003年
5 IBM大數(shù)據(jù)專家 James Kobielus 范范 編譯;機(jī)器學(xué)習(xí)已成為大數(shù)據(jù)基石[N];網(wǎng)絡(luò)世界;2014年
6 本報(bào)記者 房琳琳;合久必分:分布式“機(jī)器學(xué)習(xí)”應(yīng)運(yùn)而生[N];科技日?qǐng)?bào);2014年
7 雨辰;機(jī)器學(xué)習(xí)類圖書為什么火爆[N];中華讀書報(bào);2014年
8 王素琴邋劉曉林 通訊員 王新華;宇如聰強(qiáng)調(diào)用好16個(gè)新數(shù)據(jù)集產(chǎn)品[N];中國氣象報(bào);2008年
9 記者 劉浪 通訊員 廖雅琴;中國首套數(shù)字化“可視人”數(shù)據(jù)集在渝通過成果鑒定[N];重慶日?qǐng)?bào);2003年
10 通訊員廖雅琴記者馮競;“國人數(shù)字化可視人體數(shù)據(jù)集”完成[N];科技日?qǐng)?bào);2003年
相關(guān)博士學(xué)位論文 前10條
1 伍紅艷;健康效用值測(cè)量研究[D];沈陽藥科大學(xué);2012年
2 董春茹;機(jī)器學(xué)習(xí)中的權(quán)重學(xué)習(xí)與差分演化[D];華南理工大學(xué);2015年
3 姚明臣;機(jī)器學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)中的若干問題研究[D];大連理工大學(xué);2016年
4 Maxim Pecionchin;[D];對(duì)外經(jīng)濟(jì)貿(mào)易大學(xué);2016年
5 杜宇;基于深度機(jī)器學(xué)習(xí)的體態(tài)與手勢(shì)感知計(jì)算關(guān)鍵技術(shù)研究[D];浙江大學(xué);2017年
6 鐘錦紅;群智學(xué)習(xí)若干問題研究[D];中國科學(xué)技術(shù)大學(xué);2017年
7 趙東;基于群智能優(yōu)化的機(jī)器學(xué)習(xí)方法研究及應(yīng)用[D];吉林大學(xué);2017年
8 魯路;基于機(jī)器學(xué)習(xí)優(yōu)化分子對(duì)接篩選腎衰營養(yǎng)膠囊有效成分[D];南方醫(yī)科大學(xué);2017年
9 趙玉鵬;機(jī)器學(xué)習(xí)的哲學(xué)探索[D];大連理工大學(xué);2010年
10 胡巍;面向格結(jié)構(gòu)的機(jī)器學(xué)習(xí)[D];上海交通大學(xué);2009年
相關(guān)碩士學(xué)位論文 前10條
1 徐喜卿;乳腺癌患者不同健康效用值測(cè)量方式的比較研究[D];山東大學(xué);2015年
2 江詠絮;g-期望下的效用優(yōu)化[D];上海交通大學(xué);2015年
3 王蕊;基于效用矩陣和索引的top-k高效用項(xiàng)目集挖掘研究[D];東北大學(xué);2013年
4 楊o,
本文編號(hào):2271066
本文鏈接:http://www.sikaile.net/kejilunwen/zidonghuakongzhilunwen/2271066.html