網(wǎng)頁內(nèi)容分級系統(tǒng)的設計與實現(xiàn)
本文關(guān)鍵詞:網(wǎng)頁內(nèi)容分級系統(tǒng)的設計與實現(xiàn),由筆耕文化傳播整理發(fā)布。
【摘要】:隨著互聯(lián)網(wǎng)在社會各個領(lǐng)域的普及和應用,互聯(lián)網(wǎng)已經(jīng)成為人類社會不可或缺的重要組成部分。通過互聯(lián)網(wǎng)傳播的網(wǎng)頁內(nèi)容形式多樣,如何對這些內(nèi)容,特別是有害內(nèi)容進行有效監(jiān)管,是互聯(lián)網(wǎng)研究的重要課題。本論文首先分析了世界各國在治理互聯(lián)網(wǎng)有害信息方面所采取的各種措施,然后從技術(shù)角度出發(fā),依據(jù)內(nèi)容分級管理體系思想,結(jié)合支持向量機(Support Vector Machine,SVM)網(wǎng)頁內(nèi)容分類算法,提出了一種把網(wǎng)頁內(nèi)容分級和網(wǎng)頁自動分級標記相結(jié)合的信息過濾系統(tǒng):該系統(tǒng)以分級標準中的分級條目作為網(wǎng)頁自動分級標記的依據(jù),根據(jù)提前訓練好的分級模板,對用戶請求的未分級網(wǎng)頁進行自動分級標記,系統(tǒng)最后依據(jù)內(nèi)容分級過濾規(guī)則對有害信息進行過濾。在系統(tǒng)實現(xiàn)過程中,論文還引入了一些可行的安全措施,保證整個系統(tǒng)安全高效地運行。 歸納起來,本論文主要做了以下幾方面的研究工作: (1)論文分析了網(wǎng)頁內(nèi)容分級和當前主流過濾技術(shù)在世界各國的研究與實施現(xiàn)狀,針對阻礙網(wǎng)頁分級實施的各種不利因素,提出了一種把網(wǎng)頁內(nèi)容分級與網(wǎng)頁自動分級標記相結(jié)合的信息過濾系統(tǒng); (2)編程實現(xiàn)了對未分級網(wǎng)頁的自動分級標記。該過程主要包括網(wǎng)頁信息的提取與轉(zhuǎn)換、網(wǎng)頁特征向量計算、分類訓練、網(wǎng)頁分類以及分級標簽生成等幾部分。論文還搜集了相關(guān)網(wǎng)頁數(shù)據(jù),進行了實驗驗證; (3)為保證分級標簽與相關(guān)網(wǎng)頁信息的一致性和分級標簽的安全性,系統(tǒng)在生成分級標簽的同時,生成了對應網(wǎng)頁的信息摘要,并將其作為分級標簽的一部分儲存在分級標簽中,而且還對分級標簽采取了數(shù)字簽名,論文給出了詳細的實現(xiàn)步驟和方法。
【關(guān)鍵詞】:內(nèi)容分級 分級標簽 文本分類 支持向量機
【學位授予單位】:北京交通大學
【學位級別】:碩士
【學位授予年份】:2015
【分類號】:TP393.092
【目錄】:
- 致謝5-6
- 摘要6-7
- ABSTRACT7-8
- 目錄8-10
- 1 引言10-13
- 2 內(nèi)容過濾的概念及其分類13-16
- 2.1 內(nèi)容過濾的基本概念及特征13
- 2.2 內(nèi)容過濾在網(wǎng)絡安全架構(gòu)中的位置及作用13-14
- 2.3 內(nèi)容過濾的分類14-16
- 2.3.1 服務器端過濾和客戶端過濾14
- 2.3.2 主動過濾和被動過濾14-15
- 2.3.3 基于URL的過濾和基于關(guān)鍵詞的過濾15
- 2.3.4 智能文本過濾方法15-16
- 3 內(nèi)容分級管理體系16-29
- 3.1 內(nèi)容分級過濾系統(tǒng)的工作原理16-17
- 3.2 分級標準17-18
- 3.2.1 分級詞匯17
- 3.2.2 分級標記17-18
- 3.2.3 分級操作方法18
- 3.3 分級標簽18-22
- 3.3.1 分級標簽的格式18-19
- 3.3.2 分級標簽的分類及作用范圍19-20
- 3.3.3 分級標簽的傳輸20-21
- 3.3.4 分級標簽的生成過程21-22
- 3.4 標簽局(LABEL BUREAU)22-24
- 3.5 分級過濾規(guī)則描述語言24-25
- 3.6 內(nèi)容分級的使用方式25-26
- 3.7 我國網(wǎng)絡內(nèi)容分級的發(fā)展及現(xiàn)狀26-29
- 4 網(wǎng)頁內(nèi)容分級系統(tǒng)的設計29-39
- 4.1 當前常用過濾軟件的功能及局限性29-31
- 4.2 內(nèi)容分級過濾系統(tǒng)存在的問題31-32
- 4.3 一種安全的網(wǎng)頁內(nèi)容分級過濾系統(tǒng)32-33
- 4.4 網(wǎng)頁內(nèi)容分級系統(tǒng)的工作流圖33-34
- 4.5 分級標簽的一致性與安全性的實現(xiàn)34-37
- 4.5.1 主要實現(xiàn)步驟35-37
- 4.5.2 具體實現(xiàn)方法及對系統(tǒng)的影響分析37
- 4.6 網(wǎng)頁內(nèi)容分級系統(tǒng)的部署方式37-39
- 5 文本網(wǎng)頁自動分級系統(tǒng)實現(xiàn)39-52
- 5.1 分類的相關(guān)概念39-40
- 5.1.1 文本分類的概念39-40
- 5.1.2 分類的劃分40
- 5.2 文本分類主要技術(shù)及分類過程40-50
- 5.2.1 文本表示40-41
- 5.2.2 特征項的選擇41-42
- 5.2.3 分類算法42-45
- 5.2.4 網(wǎng)頁的預處理45-49
- 5.2.5 文本自動分類的過程49-50
- 5.3 自動分級系統(tǒng)功能模塊及主要工作過程50-52
- 6 實驗與討論52-58
- 7 結(jié)束語58-59
- 參考文獻59-61
- 作者簡歷及攻讀碩士學位期間取得的研究成果61-63
- 學位論文數(shù)據(jù)集63
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 龔德和;;獲取網(wǎng)頁內(nèi)容方法多[J];電腦知識與技術(shù)(經(jīng)驗技巧);2007年04期
2 陳欣;卓力;;面向敏感網(wǎng)頁識別的網(wǎng)頁內(nèi)容獲取方案的設計與實現(xiàn)[J];測控技術(shù);2009年05期
3 邱江濤;唐常杰;李川;朱軍;;基于塊分布的新聞網(wǎng)頁內(nèi)容提取[J];吉林大學學報(工學版);2009年05期
4 一嘯;;精彩內(nèi)容 瞬間分享[J];電腦迷;2010年10期
5 繼華;;時空穿梭 快速找回以前看過的網(wǎng)頁內(nèi)容[J];電腦迷;2010年16期
6 張寶政;;網(wǎng)頁內(nèi)容防采集策略的研究[J];數(shù)字技術(shù)與應用;2010年05期
7 解姝;葉施仁;肖春;;社會媒體網(wǎng)頁內(nèi)容的分割與抽取[J];計算機工程;2011年21期
8 王悠悠;吳中博;;網(wǎng)頁內(nèi)容提取工具的設計與實現(xiàn)[J];電腦知識與技術(shù);2011年32期
9 王國慶;;如伺保存和修改網(wǎng)頁內(nèi)容[J];廣東電腦與電訊;1999年08期
10 齊志勇;;輕松截取無邊框網(wǎng)頁內(nèi)容[J];河北教育(教學版);2006年06期
中國重要會議論文全文數(shù)據(jù)庫 前2條
1 李連霞;馬軍;陳竹敏;;基于多特征的網(wǎng)頁內(nèi)容提取研究[A];第三屆和諧人機環(huán)境聯(lián)合學術(shù)會議(HHME2007)論文集[C];2007年
2 張建標;肖創(chuàng)柏;;網(wǎng)頁內(nèi)容實時監(jiān)控審計系統(tǒng)的設計與實現(xiàn)[A];第十九次全國計算機安全學術(shù)交流會論文集[C];2004年
中國重要報紙全文數(shù)據(jù)庫 前10條
1 李點;衛(wèi)星可加快網(wǎng)頁內(nèi)容傳送[N];北京科技報;2001年
2 ;世紀互聯(lián)推內(nèi)容加強服務[N];中國電子報;2000年
3 浙江 姚愷豐;屏蔽非打印元素二法[N];電腦報;2004年
4 實習生 馬霞;無障礙閱讀系統(tǒng):讓互聯(lián)網(wǎng)不再有“盲區(qū)”[N];科技日報;2011年
5 ;學生上網(wǎng)的保護[N];中國電腦教育報;2003年
6 王潔;新手問答[N];中國電腦教育報;2003年
7 李峰 曹誠志;加強反腐倡廉網(wǎng)絡宣教的思考[N];中國紀檢監(jiān)察報;2005年
8 張常偉邋羅朱 本報記者 唐先武;用網(wǎng)絡貫穿的文化“快車道”[N];科技日報;2008年
9 Xman;熊寶寶圖標的EXE文件[N];電腦報;2002年
10 釗;香港網(wǎng)瞅準電視上網(wǎng)[N];中華工商時報;2000年
中國碩士學位論文全文數(shù)據(jù)庫 前10條
1 史正群;網(wǎng)頁內(nèi)容分級系統(tǒng)的設計與實現(xiàn)[D];北京交通大學;2015年
2 苗苗;基于頁面分塊的網(wǎng)頁內(nèi)容提取的研究與實現(xiàn)[D];武漢理工大學;2010年
3 馬曉蘭;網(wǎng)頁內(nèi)容分級過濾系統(tǒng)研究[D];華東師范大學;2004年
4 李連霞;基于多特征的HTML網(wǎng)頁內(nèi)容提取的研究[D];山東大學;2008年
5 張強;網(wǎng)頁內(nèi)容獲取及基于意圖的聚類[D];北京郵電大學;2010年
6 周洪喜;基于人工標注技術(shù)的網(wǎng)頁內(nèi)容抽取系統(tǒng)開發(fā)[D];復旦大學;2010年
7 解姝;社會媒體網(wǎng)頁內(nèi)容分割與主題頻繁簇的抽取[D];湘潭大學;2011年
8 張瓊;Web主題網(wǎng)頁內(nèi)容安全監(jiān)管研究[D];西安電子科技大學;2008年
9 羅超然;一種通用的網(wǎng)頁內(nèi)容抽取模塊的設計與實現(xiàn)[D];北京郵電大學;2015年
10 王阿婷;基于概念集合的網(wǎng)頁內(nèi)容過濾方法的研究[D];北京交通大學;2010年
本文關(guān)鍵詞:網(wǎng)頁內(nèi)容分級系統(tǒng)的設計與實現(xiàn),由筆耕文化傳播整理發(fā)布。
,本文編號:418540
本文鏈接:http://www.sikaile.net/guanlilunwen/ydhl/418540.html