基于數(shù)據(jù)挖掘的識(shí)別社交網(wǎng)站Sybil攻擊的算法研究
發(fā)布時(shí)間:2021-10-15 21:10
隨著在線社交網(wǎng)絡(luò)技術(shù)的快速發(fā)展,網(wǎng)絡(luò)社交已經(jīng)成為大多數(shù)人必不可少的生活方式。在利益的驅(qū)動(dòng)下,針對(duì)社交網(wǎng)絡(luò)的攻擊也變得越來(lái)越頻繁。與單個(gè)用戶相比,由多個(gè)用戶合謀發(fā)起的Sybil攻擊破壞性更強(qiáng)。Sybil用戶團(tuán)體特點(diǎn)是組織性和結(jié)構(gòu)性都很強(qiáng),團(tuán)體內(nèi)的用戶會(huì)幾乎同時(shí)段對(duì)相同目標(biāo)店鋪發(fā)起Sybil攻擊,這種Sybil攻擊能夠在較短時(shí)間內(nèi)對(duì)目標(biāo)店鋪聲譽(yù)評(píng)分造成巨大變化,聲譽(yù)評(píng)分急劇上升或是下降取決于Sybil活動(dòng)的雇傭者是店鋪本身還是其競(jìng)爭(zhēng)對(duì)手。無(wú)論結(jié)果如何,都對(duì)正常的市場(chǎng)秩序造成了損害。因此需要一種有效的識(shí)別在線社交網(wǎng)絡(luò)中Sybil攻擊的方法。本論文主要研究了如何有效識(shí)別社交網(wǎng)絡(luò)中的Sybil攻擊的算法。本文以用戶評(píng)價(jià)類社交網(wǎng)站大眾點(diǎn)評(píng)網(wǎng)為研究對(duì)象,設(shè)計(jì)了基于改進(jìn)的邏輯回歸算法的識(shí)別社交網(wǎng)站的Sybil攻擊的方案。首先爬取大眾點(diǎn)評(píng)網(wǎng)上一段時(shí)間內(nèi)用戶對(duì)排名靠前商家的評(píng)論數(shù)據(jù),獲得了用戶評(píng)價(jià)數(shù)據(jù)集。數(shù)據(jù)的采集用到了網(wǎng)上現(xiàn)有的采集工具。其次對(duì)獲取的數(shù)據(jù)集進(jìn)行了數(shù)據(jù)清洗工作,包括對(duì)數(shù)據(jù)集里面的缺失值、異常值、重復(fù)數(shù)據(jù)等臟數(shù)據(jù)進(jìn)行處理。獲得可以使用的評(píng)價(jià)數(shù)據(jù)集,為接下來(lái)的特征分析、模型構(gòu)建和實(shí)驗(yàn)驗(yàn)證等工作...
【文章來(lái)源】:南京郵電大學(xué)江蘇省
【文章頁(yè)數(shù)】:50 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
總體評(píng)分各分段人數(shù)分布圖
南京郵電大學(xué)專業(yè)學(xué)位碩士研究生學(xué)位論文第四章社交網(wǎng)站數(shù)據(jù)挖掘分析25數(shù)據(jù)各字段說(shuō)明如下:用戶ID,字段類型為long,字段表示為Review_ID,字段為九位數(shù)字,如377313283代表其中一個(gè)用戶;點(diǎn)評(píng)餐廳名,字段類型為string,字段表示為Merchant,如:廣東道至正餐廳(區(qū)莊店);餐廳評(píng)分(包括整體評(píng)分,味道、環(huán)境、服務(wù)分項(xiàng)評(píng)分),字段類型均為int,字段表示分別為Rating、Score_taste、Score_environment、Score_service,評(píng)分從0到5分別表示滿意程度,分?jǐn)?shù)越高表示用戶越滿意;如圖4.1到4.4分別為各項(xiàng)評(píng)分人數(shù)分布圖。圖4.1總體評(píng)分各分段人數(shù)分布圖圖4.2口味評(píng)分各分段人數(shù)分布圖
南京郵電大學(xué)專業(yè)學(xué)位碩士研究生學(xué)位論文第四章社交網(wǎng)站數(shù)據(jù)挖掘分析26圖4.3環(huán)境評(píng)分各分段人數(shù)分布圖圖4.4服務(wù)評(píng)分各分段人數(shù)分布圖從總體評(píng)分和各項(xiàng)評(píng)分分段分布圖來(lái)看,評(píng)分3及以上的人數(shù)為大多數(shù),評(píng)分3以下的人數(shù)占比較校且總體評(píng)分和各分項(xiàng)評(píng)分在各分段的人數(shù)分布趨勢(shì)一致。點(diǎn)評(píng)時(shí)間,字段類型為time,字段表示為Time,如2018年10月1日;點(diǎn)評(píng)獲得點(diǎn)贊數(shù)和評(píng)論數(shù),字段類型均為int,字段表示為Num_thumbs_up和Num_response;
【參考文獻(xiàn)】:
期刊論文
[1]基于詞向量和增量聚類的短文本聚類算法[J]. 楊波,楊文忠,殷亞博,何雪琴,袁婷婷,劉澤洋. 計(jì)算機(jī)工程與設(shè)計(jì). 2019(10)
[2]機(jī)器學(xué)習(xí)及其相關(guān)算法簡(jiǎn)介[J]. 周昀鍇. 科技傳播. 2019(06)
[3]社交網(wǎng)絡(luò)中基于模塊度最大化的標(biāo)簽傳播算法的研究[J]. 陳晶,萬(wàn)云. 通信學(xué)報(bào). 2017(02)
[4]利用加權(quán)用戶關(guān)系圖的譜分析探測(cè)大規(guī)模電子商務(wù)水軍團(tuán)體[J]. 韓忠明,楊珂,譚旭升. 計(jì)算機(jī)學(xué)報(bào). 2017(04)
[5]針對(duì)有向社交網(wǎng)絡(luò)的Sybil檢測(cè)方法[J]. 王永程,孟艷紅. 西安電子科技大學(xué)學(xué)報(bào). 2016(02)
[6]一種基于邏輯回歸算法的水軍識(shí)別方法[J]. 張良,朱湘,李愛(ài)平,王志華,魯鵬. 信息安全與技術(shù). 2015(04)
[7]網(wǎng)絡(luò)水軍識(shí)別研究[J]. 莫倩,楊珂. 軟件學(xué)報(bào). 2014(07)
[8]基于Web數(shù)據(jù)挖掘的網(wǎng)站知識(shí)獲取及應(yīng)用——以大眾點(diǎn)評(píng)網(wǎng)為例[J]. 尤建新,孟銀薇. 上海大學(xué)學(xué)報(bào)(自然科學(xué)版). 2014(03)
[9]基于語(yǔ)言結(jié)構(gòu)和情感極性的虛假評(píng)論識(shí)別[J]. 任亞峰,尹蘭,姬東鴻. 計(jì)算機(jī)科學(xué)與探索. 2014(03)
[10]基于自適應(yīng)聚類的虛假評(píng)論檢測(cè)[J]. 宋海霞,嚴(yán)馨,余正濤,石林賓,蘇斐. 南京大學(xué)學(xué)報(bào)(自然科學(xué)版). 2013(04)
博士論文
[1]垃圾短信過(guò)濾關(guān)鍵技術(shù)研究[D]. 黃文良.浙江大學(xué) 2008
碩士論文
[1]基于改進(jìn)階梯網(wǎng)絡(luò)算法的廣告轉(zhuǎn)化率預(yù)測(cè)[D]. 李巖.江蘇科技大學(xué) 2019
[2]眾包營(yíng)銷中微博與水軍的聯(lián)合檢測(cè)[D]. 倪澤陽(yáng).東南大學(xué) 2018
[3]基于機(jī)器學(xué)習(xí)的水軍識(shí)別及話題影響力分析研究[D]. 高云雪.北京工業(yè)大學(xué) 2018
[4]基于淘寶用戶評(píng)價(jià)情感分析的綜合排序方法[D]. 李圓圓.華中科技大學(xué) 2018
[5]社交網(wǎng)絡(luò)女巫攻擊防御策略研究[D]. 司書山.重慶郵電大學(xué) 2018
[6]基于微博的一種用戶影響力度量方法研究及實(shí)現(xiàn)[D]. 沈徽.燕山大學(xué) 2015
[7]C2C電子商務(wù)中虛假評(píng)價(jià)用戶的識(shí)別方法研究[D]. 許敏.南京師范大學(xué) 2014
本文編號(hào):3438629
【文章來(lái)源】:南京郵電大學(xué)江蘇省
【文章頁(yè)數(shù)】:50 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
總體評(píng)分各分段人數(shù)分布圖
南京郵電大學(xué)專業(yè)學(xué)位碩士研究生學(xué)位論文第四章社交網(wǎng)站數(shù)據(jù)挖掘分析25數(shù)據(jù)各字段說(shuō)明如下:用戶ID,字段類型為long,字段表示為Review_ID,字段為九位數(shù)字,如377313283代表其中一個(gè)用戶;點(diǎn)評(píng)餐廳名,字段類型為string,字段表示為Merchant,如:廣東道至正餐廳(區(qū)莊店);餐廳評(píng)分(包括整體評(píng)分,味道、環(huán)境、服務(wù)分項(xiàng)評(píng)分),字段類型均為int,字段表示分別為Rating、Score_taste、Score_environment、Score_service,評(píng)分從0到5分別表示滿意程度,分?jǐn)?shù)越高表示用戶越滿意;如圖4.1到4.4分別為各項(xiàng)評(píng)分人數(shù)分布圖。圖4.1總體評(píng)分各分段人數(shù)分布圖圖4.2口味評(píng)分各分段人數(shù)分布圖
南京郵電大學(xué)專業(yè)學(xué)位碩士研究生學(xué)位論文第四章社交網(wǎng)站數(shù)據(jù)挖掘分析26圖4.3環(huán)境評(píng)分各分段人數(shù)分布圖圖4.4服務(wù)評(píng)分各分段人數(shù)分布圖從總體評(píng)分和各項(xiàng)評(píng)分分段分布圖來(lái)看,評(píng)分3及以上的人數(shù)為大多數(shù),評(píng)分3以下的人數(shù)占比較校且總體評(píng)分和各分項(xiàng)評(píng)分在各分段的人數(shù)分布趨勢(shì)一致。點(diǎn)評(píng)時(shí)間,字段類型為time,字段表示為Time,如2018年10月1日;點(diǎn)評(píng)獲得點(diǎn)贊數(shù)和評(píng)論數(shù),字段類型均為int,字段表示為Num_thumbs_up和Num_response;
【參考文獻(xiàn)】:
期刊論文
[1]基于詞向量和增量聚類的短文本聚類算法[J]. 楊波,楊文忠,殷亞博,何雪琴,袁婷婷,劉澤洋. 計(jì)算機(jī)工程與設(shè)計(jì). 2019(10)
[2]機(jī)器學(xué)習(xí)及其相關(guān)算法簡(jiǎn)介[J]. 周昀鍇. 科技傳播. 2019(06)
[3]社交網(wǎng)絡(luò)中基于模塊度最大化的標(biāo)簽傳播算法的研究[J]. 陳晶,萬(wàn)云. 通信學(xué)報(bào). 2017(02)
[4]利用加權(quán)用戶關(guān)系圖的譜分析探測(cè)大規(guī)模電子商務(wù)水軍團(tuán)體[J]. 韓忠明,楊珂,譚旭升. 計(jì)算機(jī)學(xué)報(bào). 2017(04)
[5]針對(duì)有向社交網(wǎng)絡(luò)的Sybil檢測(cè)方法[J]. 王永程,孟艷紅. 西安電子科技大學(xué)學(xué)報(bào). 2016(02)
[6]一種基于邏輯回歸算法的水軍識(shí)別方法[J]. 張良,朱湘,李愛(ài)平,王志華,魯鵬. 信息安全與技術(shù). 2015(04)
[7]網(wǎng)絡(luò)水軍識(shí)別研究[J]. 莫倩,楊珂. 軟件學(xué)報(bào). 2014(07)
[8]基于Web數(shù)據(jù)挖掘的網(wǎng)站知識(shí)獲取及應(yīng)用——以大眾點(diǎn)評(píng)網(wǎng)為例[J]. 尤建新,孟銀薇. 上海大學(xué)學(xué)報(bào)(自然科學(xué)版). 2014(03)
[9]基于語(yǔ)言結(jié)構(gòu)和情感極性的虛假評(píng)論識(shí)別[J]. 任亞峰,尹蘭,姬東鴻. 計(jì)算機(jī)科學(xué)與探索. 2014(03)
[10]基于自適應(yīng)聚類的虛假評(píng)論檢測(cè)[J]. 宋海霞,嚴(yán)馨,余正濤,石林賓,蘇斐. 南京大學(xué)學(xué)報(bào)(自然科學(xué)版). 2013(04)
博士論文
[1]垃圾短信過(guò)濾關(guān)鍵技術(shù)研究[D]. 黃文良.浙江大學(xué) 2008
碩士論文
[1]基于改進(jìn)階梯網(wǎng)絡(luò)算法的廣告轉(zhuǎn)化率預(yù)測(cè)[D]. 李巖.江蘇科技大學(xué) 2019
[2]眾包營(yíng)銷中微博與水軍的聯(lián)合檢測(cè)[D]. 倪澤陽(yáng).東南大學(xué) 2018
[3]基于機(jī)器學(xué)習(xí)的水軍識(shí)別及話題影響力分析研究[D]. 高云雪.北京工業(yè)大學(xué) 2018
[4]基于淘寶用戶評(píng)價(jià)情感分析的綜合排序方法[D]. 李圓圓.華中科技大學(xué) 2018
[5]社交網(wǎng)絡(luò)女巫攻擊防御策略研究[D]. 司書山.重慶郵電大學(xué) 2018
[6]基于微博的一種用戶影響力度量方法研究及實(shí)現(xiàn)[D]. 沈徽.燕山大學(xué) 2015
[7]C2C電子商務(wù)中虛假評(píng)價(jià)用戶的識(shí)別方法研究[D]. 許敏.南京師范大學(xué) 2014
本文編號(hào):3438629
本文鏈接:http://www.sikaile.net/kejilunwen/shengwushengchang/3438629.html
最近更新
教材專著