JavaScript中基于規(guī)則的廣告腳本檢測(cè)
本文選題:JavaScript + 廣告腳本檢測(cè); 參考:《南京郵電大學(xué)》2017年碩士論文
【摘要】:隨著互聯(lián)網(wǎng)的迅猛發(fā)展,網(wǎng)絡(luò)廣告成為互聯(lián)網(wǎng)最重要的商業(yè)模式之一。網(wǎng)絡(luò)廣告在促進(jìn)互聯(lián)網(wǎng)發(fā)展的同時(shí),也帶來(lái)了用戶(hù)信息泄露、影響用戶(hù)網(wǎng)頁(yè)瀏覽體驗(yàn)等負(fù)面問(wèn)題。為了屏蔽網(wǎng)頁(yè)中出現(xiàn)的廣告,Adblock、Ghostery等廣告屏蔽軟件層出不窮,他們大多使用模式匹配的方法,將網(wǎng)頁(yè)中的URL和選擇器屬性與已知的廣告相關(guān)黑名單列表進(jìn)行匹配再進(jìn)行過(guò)濾,但是對(duì)于新出現(xiàn)的廣告相關(guān)字段以及經(jīng)過(guò)混淆的廣告則無(wú)法檢測(cè)。本文經(jīng)過(guò)對(duì)動(dòng)態(tài)廣告生成原理的分析發(fā)現(xiàn),第三方腳本庫(kù)中自動(dòng)執(zhí)行的JavaScript腳本,往往與動(dòng)態(tài)廣告的加載有關(guān)。文章使用JavaScript的動(dòng)態(tài)插樁工具Jalangi對(duì)符合條件的腳本函數(shù)獲取其完整的函數(shù)調(diào)用鏈信息。首先在JavaScript函數(shù)中動(dòng)態(tài)綁定一個(gè)用于存儲(chǔ)調(diào)用路徑的屬性,對(duì)相關(guān)函數(shù)調(diào)用路徑進(jìn)行追蹤和保存;然后,在插樁過(guò)程中對(duì)于setTimeout()、set Interval()、call()、apply()等特殊函數(shù),根據(jù)函數(shù)的特點(diǎn)不同進(jìn)行不同的處理以保證函數(shù)調(diào)用鏈路的完整傳遞;最終,根據(jù)廣告相關(guān)JavaScript調(diào)用路徑獲得廣告相關(guān)和廣告無(wú)關(guān)的腳本文件。在構(gòu)造分類(lèi)器階段,本文首先對(duì)經(jīng)過(guò)動(dòng)態(tài)插樁得到的廣告相關(guān)JavaScript文件進(jìn)行分析,并總結(jié)出用于區(qū)分廣告相關(guān)和廣告無(wú)關(guān)的JavaScript靜態(tài)特征;再根據(jù)靜態(tài)特征根據(jù)已經(jīng)檢測(cè)到的廣告相關(guān)腳本文件進(jìn)行分類(lèi)器的訓(xùn)練;最后使用新的腳本文件測(cè)試集對(duì)分類(lèi)器的效果進(jìn)行驗(yàn)證。實(shí)驗(yàn)證明該分類(lèi)器對(duì)廣告腳本文件檢測(cè)的準(zhǔn)確率達(dá)到了93.86%,整個(gè)分類(lèi)器可以較有效的對(duì)廣告相關(guān)JavaScript腳本文件進(jìn)行識(shí)別,便于在網(wǎng)頁(yè)加載前對(duì)腳本文件進(jìn)行屏蔽并阻止廣告的顯示,彌補(bǔ)了Adblock等廣告屏蔽插件的不足。
[Abstract]:With the rapid development of the Internet, Internet advertising has become one of the most important business models. While promoting the development of Internet, network advertisement also brings negative problems such as user information leakage and web browsing experience. In order to block ads, such as Adblockor Ghostery, they often use pattern matching methods to match and filter the URL and selector attributes in the web pages with known lists of advertising related blacklists. But new advertising related fields and confused ads are undetectable. Based on the analysis of the principle of dynamic advertisement generation, it is found that the JavaScript script executed automatically in the third party script library is often related to the loading of dynamic advertisement. In this paper, Jalangi, a dynamic piling tool of JavaScript, is used to obtain the complete function call chain information for the qualified script function. First, dynamically bind a property used to store the call path in the JavaScript function to trace and save the call path of the related function; then, for special functions such as setTimeOutout during the piling process, According to the characteristics of the function, different processing is carried out to ensure the complete transfer of the function call link; finally, according to the Advertising related JavaScript call path, the Advertising and Advertising independent script files are obtained. In the stage of classifier construction, this paper firstly analyzes the advertising related JavaScript files obtained by dynamic piling, and sums up the static features of JavaScript used to distinguish advertising relevance from advertising independence. Then the classifier is trained according to the static features according to the detected advertisement related script files. Finally, the new script file test set is used to verify the effect of the classifier. Experimental results show that the classifier can detect the advertisement script file with the accuracy rate of 93.86. The whole classifier can recognize the advertisement related JavaScript script file effectively, and it is convenient to block the script file and prevent the display of the advertisement before loading the web page. Make up for Adblock and other advertising blocking plug-in deficiencies.
【學(xué)位授予單位】:南京郵電大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2017
【分類(lèi)號(hào)】:TP393.092;TP312.2
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 周輝騰;用JavaScript自動(dòng)選擇留言板[J];上海微型計(jì)算機(jī);2000年Z3期
2 孫小淋;;基于JavaScript的消息管理機(jī)制探討[J];軟件;2013年07期
3 洪留榮,賀蘊(yùn)普,于娟;用JavaScript實(shí)現(xiàn)WEB數(shù)據(jù)庫(kù)的交并集查詢(xún)[J];計(jì)算機(jī)系統(tǒng)應(yīng)用;1999年04期
4 張志遠(yuǎn);JavaScript與客戶(hù)端安全[J];東莞理工學(xué)院學(xué)報(bào);2002年02期
5 陳曉勇,沈良瓊;JavaScript在科學(xué)設(shè)計(jì)與計(jì)算中的應(yīng)用[J];西南科技大學(xué)學(xué)報(bào)(自然科學(xué)版);2002年03期
6 柯琦;;JavaScript程序設(shè)計(jì)基礎(chǔ)課程教學(xué)淺析[J];教育教學(xué)論壇;2013年05期
7 ;千里之堤會(huì)毀于一穴嗎? Java、JavaScript的漏洞既有可能減小障礙,也會(huì)發(fā)生重大問(wèn)題[J];每周電腦報(bào);1997年37期
8 汪迎春;;基于JavaScript技術(shù)的網(wǎng)頁(yè)課程設(shè)計(jì)項(xiàng)目設(shè)計(jì)[J];信息與電腦(理論版);2013年10期
9 田會(huì);;JavaScript與Java在Web開(kāi)發(fā)中的應(yīng)用與區(qū)別[J];電子技術(shù)與軟件工程;2014年09期
10 李軼;;基于JavaScript的面向?qū)ο蟪绦蛟O(shè)計(jì)研究[J];江漢大學(xué)學(xué)報(bào)(自然科學(xué)版);2010年03期
相關(guān)會(huì)議論文 前2條
1 段壽建;張旭潔;胡紹波;李忠態(tài);;基于JavaScript和PHP的多級(jí)聯(lián)動(dòng)下拉菜單的設(shè)計(jì)與實(shí)現(xiàn)[A];AECC專(zhuān)題學(xué)術(shù)研討會(huì)論文集[C];2007年
2 查維康;;使用AutoCAD腳本文件[A];面向21世紀(jì)的圖學(xué)教育——第十二屆全國(guó)圖學(xué)教育研討會(huì)暨第三屆制圖CAI課件演示交流會(huì)論文集[C];2000年
相關(guān)重要報(bào)紙文章 前10條
1 浙江 潘賢林;用 JavaScript 批量瀏覽圖片[N];電腦報(bào);2001年
2 趙澤欣;老道的JavaScript精華子集[N];中華讀書(shū)報(bào);2012年
3 鄧飛;JavaScript網(wǎng)頁(yè)特效[N];中國(guó)電腦教育報(bào);2002年
4 于翔;JavaScript升級(jí)引發(fā)微軟、Mozilla論戰(zhàn)[N];網(wǎng)絡(luò)世界;2007年
5 福建 蔣濟(jì)舟;生成SQL Server數(shù)據(jù)庫(kù)腳本四法[N];電腦報(bào);2004年
6 于振海;窗口布局我來(lái)定[N];中國(guó)電腦教育報(bào);2003年
7 廣東 智軒;做個(gè)RPG游戲主人翁[N];電腦報(bào);2004年
8 ;CAD大考場(chǎng)[N];電腦報(bào);2004年
9 湖北 劉吉華;用登錄腳本實(shí)現(xiàn)通知分發(fā)[N];電腦報(bào);2002年
10 ;組策略的簡(jiǎn)單應(yīng)用[N];網(wǎng)絡(luò)世界;2006年
相關(guān)碩士學(xué)位論文 前10條
1 趙晨;JavaScript中基于規(guī)則的廣告腳本檢測(cè)[D];南京郵電大學(xué);2017年
2 林水明;不透明謂詞在JavaScript代碼保護(hù)的應(yīng)用研究[D];廣東工業(yè)大學(xué);2016年
3 黎遇軍;使用離線profile提升JavaScript程序的類(lèi)型可預(yù)測(cè)性[D];中國(guó)科學(xué)技術(shù)大學(xué);2017年
4 吳通;基于程序分析和機(jī)器學(xué)習(xí)的JavaScript代碼推薦研究[D];上海交通大學(xué);2014年
5 郭小福;嵌入式JavaScript引擎的優(yōu)化與實(shí)現(xiàn)[D];電子科技大學(xué);2012年
6 柯宏;嵌入式JavaScript解釋器在機(jī)頂盒中的設(shè)計(jì)與實(shí)現(xiàn)[D];華中科技大學(xué);2007年
7 張銳;嵌入式JavaScript引擎即時(shí)編譯器的研究與設(shè)計(jì)[D];電子科技大學(xué);2011年
8 徐青;JavaScript惡意代碼檢測(cè)技術(shù)研究[D];西南交通大學(xué);2014年
9 余啟洋;嵌入式JavaScript引擎并行化研究與設(shè)計(jì)[D];電子科技大學(xué);2013年
10 謝錦春;基于腳本的三維場(chǎng)景合成和驗(yàn)證系統(tǒng)[D];浙江大學(xué);2013年
,本文編號(hào):1900869
本文鏈接:http://www.sikaile.net/guanlilunwen/ydhl/1900869.html