基于模板檢測(cè)的違法網(wǎng)站識(shí)別方法
本文選題:模板檢測(cè) 切入點(diǎn):違法網(wǎng)站識(shí)別 出處:《南京理工大學(xué)學(xué)報(bào)》2015年03期
【摘要】:為高效識(shí)別違法網(wǎng)站,該文提出了一種新方法。從HTTP POST提取特征值,計(jì)算網(wǎng)站間相似度,對(duì)網(wǎng)站進(jìn)行聚類并抽取違法網(wǎng)站模板用來(lái)識(shí)別違法網(wǎng)站。應(yīng)用圖挖掘技術(shù)過(guò)濾合法網(wǎng)站,提升識(shí)別效率。以賭博網(wǎng)站為例,在真實(shí)環(huán)境中對(duì)該方法進(jìn)行了大規(guī)模實(shí)驗(yàn)和評(píng)估。實(shí)驗(yàn)結(jié)果表明:該方法檢測(cè)出賭博網(wǎng)站的精確度為1;與URL、HTML和語(yǔ)義特征相比,HTTP POST特征值的F-Measure最好;應(yīng)用圖挖掘技術(shù)可以有效過(guò)濾合法網(wǎng)站,提高整個(gè)流程運(yùn)行效率20%。
[Abstract]:In order to identify illegal websites efficiently, this paper proposes a new method, which extracts feature values from HTTP POST and calculates the similarity between websites. Clustering websites and extracting template of illegal websites to identify illegal websites. Apply map mining technology to filter legitimate websites, improve identification efficiency. Take gambling websites as an example, The experimental results show that the accuracy of this method is 1. Compared with URLG HTML and semantic features, this method has the best F-Measure feature value. The application of graph mining technology can effectively filter legitimate websites and improve the efficiency of the whole process.
【作者單位】: 上海交通大學(xué)軟件學(xué)院;公安部第三研究所;
【基金】:國(guó)家自然科學(xué)基金(61472242) 公安部第三研究所開放基金(C13610)
【分類號(hào)】:TP393.092
【參考文獻(xiàn)】
相關(guān)期刊論文 前4條
1 王濤;余順爭(zhēng);;基于統(tǒng)計(jì)學(xué)習(xí)的掛馬網(wǎng)頁(yè)實(shí)時(shí)檢測(cè)[J];計(jì)算機(jī)科學(xué);2011年01期
2 倪平;陳正果;歐陽(yáng)雄弈;王冬;;Web惡意代碼主動(dòng)檢測(cè)與分析系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J];計(jì)算機(jī)應(yīng)用;2011年S2期
3 黃華軍;錢亮;王耀鈞;;基于異常特征的釣魚網(wǎng)站URL檢測(cè)技術(shù)[J];信息網(wǎng)絡(luò)安全;2012年01期
4 李洋;劉飚;封化民;;基于機(jī)器學(xué)習(xí)的網(wǎng)頁(yè)惡意代碼檢測(cè)方法[J];北京電子科技學(xué)院學(xué)報(bào);2012年04期
【共引文獻(xiàn)】
相關(guān)期刊論文 前10條
1 王成;;解析各類惡意網(wǎng)頁(yè)和IE漏洞對(duì)策分析[J];計(jì)算機(jī)光盤軟件與應(yīng)用;2012年18期
2 趙伯琪;;淺談企業(yè)信息安全治理框架[J];信息安全與技術(shù);2013年05期
3 劉洪玉;;PDT警用數(shù)字集群技術(shù)發(fā)展及應(yīng)用[J];信息安全與技術(shù);2013年07期
4 楊曦;;云計(jì)算背景下計(jì)算機(jī)安全問(wèn)題及對(duì)策[J];信息安全與技術(shù);2013年08期
5 宋明秋;曹曉蕓;;基于敏感特征的網(wǎng)絡(luò)釣魚網(wǎng)站檢測(cè)方法[J];大連理工大學(xué)學(xué)報(bào);2013年06期
6 信學(xué)峰;汪棟;韓永飛;;流氓軟件的檢測(cè)與攔截技術(shù)的研究[J];電腦與信息技術(shù);2014年04期
7 王亞沁;;基于服務(wù)的網(wǎng)絡(luò)釣魚綜合防范體系的研究[J];計(jì)算機(jī)光盤軟件與應(yīng)用;2014年11期
8 陳莊;劉龍飛;;融合域名注冊(cè)信息的惡意網(wǎng)站檢測(cè)方法研究[J];計(jì)算機(jī)光盤軟件與應(yīng)用;2015年01期
9 趙躍華;胡向濤;;網(wǎng)絡(luò)釣魚攻擊的防御技術(shù)及防御框架設(shè)計(jì)[J];計(jì)算機(jī)應(yīng)用研究;2013年06期
10 黃超;李毅;麻榮寬;馬建勛;;網(wǎng)頁(yè)漏洞挖掘系統(tǒng)設(shè)計(jì)[J];信息網(wǎng)絡(luò)安全;2012年09期
相關(guān)會(huì)議論文 前10條
1 范紅;胡志昂;杜大海;王冠;;數(shù)據(jù)取證設(shè)備一致性評(píng)價(jià)及標(biāo)準(zhǔn)體系研究[A];第29次全國(guó)計(jì)算機(jī)安全學(xué)術(shù)交流會(huì)論文集[C];2014年
2 鄭飛;張蕾;;基于分類的中文微博熱點(diǎn)話題發(fā)現(xiàn)方法研究[A];第29次全國(guó)計(jì)算機(jī)安全學(xué)術(shù)交流會(huì)論文集[C];2014年
3 穆宣社;王守銀;;4G無(wú)線多媒體協(xié)同通信系統(tǒng)安全保密子系統(tǒng)的構(gòu)建[A];第29次全國(guó)計(jì)算機(jī)安全學(xué)術(shù)交流會(huì)論文集[C];2014年
4 郭陳陽(yáng);朱燕軍;何素平;;移動(dòng)互聯(lián)網(wǎng)金融犯罪淺析[A];第29次全國(guó)計(jì)算機(jī)安全學(xué)術(shù)交流會(huì)論文集[C];2014年
5 孫海舟;周長(zhǎng)倫;韓曉龍;;基于信息安全等級(jí)保護(hù)的交換機(jī)安全威脅防范方法[A];第二屆全國(guó)信息安全等級(jí)保護(hù)技術(shù)大會(huì)會(huì)議論文集[C];2013年
6 唐大壽;;淺談ARP欺騙的危害性[A];第二屆全國(guó)信息安全等級(jí)保護(hù)技術(shù)大會(huì)會(huì)議論文集[C];2013年
7 胡帆;趙明霄;邱洪軍;姚雙才;;統(tǒng)計(jì)信息系統(tǒng)層次區(qū)域安全保護(hù)等級(jí)劃分過(guò)程及方法[A];第二屆全國(guó)信息安全等級(jí)保護(hù)技術(shù)大會(huì)會(huì)議論文集[C];2013年
8 郭敏;;等級(jí)測(cè)評(píng)項(xiàng)目控制研究[A];第二屆全國(guó)信息安全等級(jí)保護(hù)技術(shù)大會(huì)會(huì)議論文集[C];2013年
9 徐穎胤;;淺談科研單位桌面云應(yīng)用安全與管理[A];第二屆全國(guó)信息安全等級(jí)保護(hù)技術(shù)大會(huì)會(huì)議論文集[C];2013年
10 殷睿;;企業(yè)網(wǎng)絡(luò)集中打印安全管理模式研究[A];第二屆全國(guó)信息安全等級(jí)保護(hù)技術(shù)大會(huì)會(huì)議論文集[C];2013年
相關(guān)碩士學(xué)位論文 前7條
1 粱興開;基于腳本安全的防御技術(shù)研究[D];杭州電子科技大學(xué);2012年
2 李洋;頁(yè)面木馬及其安全威脅的監(jiān)測(cè)與防范[D];北京交通大學(xué);2012年
3 李曉光;網(wǎng)頁(yè)木馬檢測(cè)系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];北京郵電大學(xué);2013年
4 王耀鈞;融合半脆弱水印和URL檢測(cè)的網(wǎng)絡(luò)釣魚主動(dòng)防御機(jī)制[D];中南林業(yè)科技大學(xué);2013年
5 陳欣;一種基于支持向量機(jī)的垃圾微博識(shí)別方法[D];安徽工業(yè)大學(xué);2013年
6 戴仲政;基于腳本引擎的惡意網(wǎng)頁(yè)檢測(cè)系統(tǒng)[D];華南理工大學(xué);2014年
7 魏玉良;基于主動(dòng)探測(cè)的仿冒網(wǎng)站檢測(cè)系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[D];哈爾濱工業(yè)大學(xué);2014年
【二級(jí)參考文獻(xiàn)】
相關(guān)期刊論文 前5條
1 Ю.И.ВОРОТНИЦКИЙ;謝金寶;;基于源代碼分析的Web惡意代碼探測(cè)方法[J];計(jì)算機(jī)與信息技術(shù);2010年Z1期
2 齊冬梅,杜亞軍,李戰(zhàn)勝;個(gè)性化智能搜索引擎爬行蟲算法[J];計(jì)算機(jī)應(yīng)用;2004年S2期
3 李曉冬;李毅超;;基于AEC的惡意代碼檢測(cè)系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J];計(jì)算機(jī)應(yīng)用;2007年06期
4 孫曉妍;王洋;祝躍飛;武東英;;基于客戶端蜜罐的惡意網(wǎng)頁(yè)檢測(cè)系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J];計(jì)算機(jī)應(yīng)用;2007年07期
5 唐彰國(guó);李煥洲;鐘明全;張健;;改進(jìn)的進(jìn)程行為檢測(cè)模型及實(shí)現(xiàn)[J];計(jì)算機(jī)應(yīng)用;2010年01期
相關(guān)碩士學(xué)位論文 前1條
1 王松;基于學(xué)習(xí)的惡意網(wǎng)頁(yè)智能檢測(cè)系統(tǒng)[D];南京理工大學(xué);2011年
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 路迎晨,李兵;一個(gè)計(jì)算隱馬氏模型相似度的改進(jìn)方法[J];信息與電子工程;2004年04期
2 徐德智;吳軍慶;陳建二;趙于前;;一種基于概念信息量的相似度傳播算法[J];計(jì)算機(jī)科學(xué);2009年06期
3 葉永林;楊學(xué)強(qiáng);傅海洋;;裝備元數(shù)據(jù)相似度計(jì)算方法研究[J];計(jì)算機(jī)仿真;2010年04期
4 胡科強(qiáng);袁志勇;周浩;唐揚(yáng);;基于距離相似度的數(shù)據(jù)關(guān)聯(lián)算法分析[J];武漢理工大學(xué)學(xué)報(bào);2011年10期
5 張德龍;楊鵬;;相似度技術(shù)在資料信息化中的應(yīng)用研究[J];電子設(shè)計(jì)工程;2013年03期
6 應(yīng)文豪;王士同;;基于相似度差的大間隔快速學(xué)習(xí)模型[J];計(jì)算機(jī)科學(xué);2013年08期
7 蔡波斯;陳翔;;基于行為相似度的微博社區(qū)發(fā)現(xiàn)研究[J];計(jì)算機(jī)工程;2013年08期
8 馬小軍;趙偉;;改進(jìn)相似度的分布式個(gè)性化推薦[J];計(jì)算機(jī)工程與應(yīng)用;2014年04期
9 張星;劉帥;;基于空間向量的電子作業(yè)相似度檢測(cè)的設(shè)計(jì)與實(shí)現(xiàn)[J];福建電腦;2014年02期
10 黨宏社,韓崇昭,段戰(zhàn)勝;一種基于模糊量相似度測(cè)量的模糊數(shù)據(jù)關(guān)聯(lián)方法[J];武漢理工大學(xué)學(xué)報(bào)(交通科學(xué)與工程版);2003年01期
相關(guān)會(huì)議論文 前10條
1 劉海波;鄭德權(quán);趙鐵軍;;基于相似度線性加權(quán)方法的檢索結(jié)果聚類研究[A];中國(guó)計(jì)算語(yǔ)言學(xué)研究前沿進(jìn)展(2009-2011)[C];2011年
2 劉曉平;陸勁挺;;任意功能樹的物元相似度求解方法[A];全國(guó)第21屆計(jì)算機(jī)技術(shù)與應(yīng)用學(xué)術(shù)會(huì)議(CACIS·2010)暨全國(guó)第2屆安全關(guān)鍵技術(shù)與應(yīng)用學(xué)術(shù)會(huì)議論文集[C];2010年
3 陸勁挺;路強(qiáng);劉曉平;;對(duì)比相似度計(jì)算方法及其在功能樹擴(kuò)展中的應(yīng)用[A];計(jì)算機(jī)技術(shù)與應(yīng)用進(jìn)展·2007——全國(guó)第18屆計(jì)算機(jī)技術(shù)與應(yīng)用(CACIS)學(xué)術(shù)會(huì)議論文集[C];2007年
4 董刊生;方金云;;基于向量距離的詞序相似度算法[A];第四屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集(上)[C];2008年
5 洪文學(xué);王金甲;常鳳香;宋佳霖;劉文遠(yuǎn);王立強(qiáng);;基于圖形特征增強(qiáng)的相似度分類器的研究[A];中國(guó)生物醫(yī)學(xué)工程進(jìn)展——2007中國(guó)生物醫(yī)學(xué)工程聯(lián)合學(xué)術(shù)年會(huì)論文集(上冊(cè))[C];2007年
6 王茜;張衛(wèi)星;;基于分類樹相似度加權(quán)的協(xié)同過(guò)濾算法[A];2008年計(jì)算機(jī)應(yīng)用技術(shù)交流會(huì)論文集[C];2008年
7 雷慶;吳揚(yáng)揚(yáng);;一種基于語(yǔ)義信息計(jì)算XML文檔相似度的新方法[A];第二十一屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2004年
8 羅辛;歐陽(yáng)元新;熊璋;袁滿;;通過(guò)相似度支持度優(yōu)化基于K近鄰的協(xié)同過(guò)濾算法[A];NDBC2010第27屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集A輯一[C];2010年
9 葉正;林鴻飛;楊志豪;;基于問(wèn)句相似度的中文FAQ問(wèn)答系統(tǒng)研究[A];第三屆學(xué)生計(jì)算語(yǔ)言學(xué)研討會(huì)論文集[C];2006年
10 王健;劉衍珩;焦玉;;VANETs信任傳播建模[A];中國(guó)通信學(xué)會(huì)通信軟件技術(shù)委員會(huì)2009年學(xué)術(shù)會(huì)議論文集[C];2009年
相關(guān)重要報(bào)紙文章 前1條
1 王伽 衛(wèi)江;出入境證件照片應(yīng)及時(shí)更換[N];中國(guó)國(guó)門時(shí)報(bào);2008年
相關(guān)博士學(xué)位論文 前9條
1 張明西;信息網(wǎng)絡(luò)中的相似度搜索問(wèn)題研究[D];復(fù)旦大學(xué);2013年
2 武威;異質(zhì)數(shù)據(jù)相似度學(xué)習(xí)及其在網(wǎng)絡(luò)搜索中的應(yīng)用[D];北京大學(xué);2012年
3 朱娜斐;基于RTT相似度的網(wǎng)絡(luò)延遲估測(cè)理論和方法[D];北京工業(yè)大學(xué);2012年
4 錢鵬飛;基于模糊相似度的異構(gòu)本體映射、合并及校驗(yàn)方法的研究[D];上海交通大學(xué);2008年
5 馬海平;基于概率生成模型的相似度建模技術(shù)研究及應(yīng)用[D];中國(guó)科學(xué)技術(shù)大學(xué);2013年
6 劉守群;海量網(wǎng)絡(luò)視頻快速檢索關(guān)鍵技術(shù)研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2010年
7 夏云慶;IHSMTS系統(tǒng)中啟發(fā)式類比翻譯處理機(jī)制(HATM)的設(shè)計(jì)與實(shí)現(xiàn)[D];中國(guó)科學(xué)院研究生院(計(jì)算技術(shù)研究所);2001年
8 姜雅文;復(fù)雜網(wǎng)絡(luò)社區(qū)發(fā)現(xiàn)若干問(wèn)題研究[D];北京交通大學(xué);2014年
9 張磊;個(gè)性化推薦和搜索中若干關(guān)鍵問(wèn)題的研究[D];北京郵電大學(xué);2009年
相關(guān)碩士學(xué)位論文 前10條
1 李磊;虛擬教學(xué)實(shí)驗(yàn)方案相似度的分析和度量[D];華中科技大學(xué);2009年
2 裴運(yùn)亮;基于切詞和語(yǔ)義的中文相似度研究與應(yīng)用[D];電子科技大學(xué);2011年
3 譚夏;基于軟集相似度理論的醫(yī)學(xué)診斷系統(tǒng)[D];西北師范大學(xué);2014年
4 荊路;基于本體的文本相似度研究與實(shí)現(xiàn)[D];沈陽(yáng)工業(yè)大學(xué);2009年
5 張東君;網(wǎng)絡(luò)輿情文摘生成技術(shù)中相似度與聚類的研究[D];哈爾濱工程大學(xué);2009年
6 劉青磊;漢語(yǔ)詞語(yǔ)及句子相似度算法研究與應(yīng)用[D];電子科技大學(xué);2011年
7 伍星宇;基于相似度的社區(qū)發(fā)現(xiàn)算法研究[D];華中科技大學(xué);2012年
8 劉文龍;基于加權(quán)信息熵相似度的協(xié)同過(guò)濾算法研究[D];天津師范大學(xué);2013年
9 李培;基于《知網(wǎng)》的文本相似度研究[D];河北工業(yè)大學(xué);2012年
10 嚴(yán)東賓;基于MULTI-TASK LASSO的英文詞對(duì)間關(guān)系相似度算法[D];華東師范大學(xué);2013年
,本文編號(hào):1663255
本文鏈接:http://www.sikaile.net/guanlilunwen/ydhl/1663255.html