天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

網(wǎng)絡(luò)PDF文檔敏感內(nèi)容防控系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)

發(fā)布時(shí)間:2024-04-02 21:54
  隨著信息技術(shù)的飛速發(fā)展,網(wǎng)絡(luò)充斥在我們生活的各個(gè)角落。在帶給人們種種便利的同時(shí),互聯(lián)網(wǎng)也成為涉及色情、暴力、反動等不良敏感文本迅速傳播的媒介。PDF作為一種輕便的文檔形式,越來越多地出現(xiàn)在網(wǎng)絡(luò)傳輸中,其中攜帶的不良文本信息的傳播,不僅污染網(wǎng)絡(luò)環(huán)境,也危害著社會的和諧穩(wěn)定。然而,針對PDF文本內(nèi)容防控的研究還沒有完全成熟,如何高效準(zhǔn)確地辨別PDF文檔中文本內(nèi)容的敏感性是一個(gè)重要課題。由于PDF文檔漢字編碼的特殊性且缺少足夠的開源資源,目前國內(nèi)針對在線網(wǎng)絡(luò)環(huán)境下中文PDF文檔敏感內(nèi)容防控方面的研究還不充足,所以展開針對網(wǎng)絡(luò)傳輸?shù)腜DF文檔的敏感內(nèi)容防控仍然是網(wǎng)絡(luò)安全領(lǐng)域函待解決的關(guān)鍵問題。由于PDF文檔的敏感內(nèi)容防控系統(tǒng)需要在實(shí)時(shí)在線網(wǎng)絡(luò)環(huán)境下運(yùn)行,所以在PDF文檔解析及敏感性判別的過程中,對處理速率和識別準(zhǔn)確度等有很高的要求。本文在實(shí)現(xiàn)網(wǎng)絡(luò)PDF文檔敏感內(nèi)容防控系統(tǒng)的基礎(chǔ)上,提出了PDF文檔stream流標(biāo)簽快速定位算法SLQP算法和文本內(nèi)容流高效匹配算法PB-WM算法,以及基于注意力的雙向區(qū)域LSTM網(wǎng)絡(luò)模型進(jìn)行目標(biāo)情感分析來優(yōu)化系統(tǒng)的識別準(zhǔn)確度。對于內(nèi)容標(biāo)簽的定位,實(shí)際上即為一種特殊...

【文章頁數(shù)】:80 頁

【學(xué)位級別】:碩士

【文章目錄】:
摘要
abstract
第1章 緒論
    1.1 課題研究背景及意義
    1.2 國內(nèi)外研究現(xiàn)狀及存在問題
    1.3 論文主要工作及內(nèi)容安排
第2章 PDF文檔解析及stream標(biāo)簽快速定位技術(shù)
    2.1 PDF文檔解析技術(shù)
        2.1.1 PDF文檔結(jié)構(gòu)
            2.1.1.1 PDF物理組織結(jié)構(gòu)
            2.1.1.2 PDF邏輯組織結(jié)構(gòu)
        2.1.2 PDF對象和內(nèi)容流
        2.1.3 PDF漢字編碼及轉(zhuǎn)碼映射表
    2.2 PDF文檔stream標(biāo)簽快速定位技術(shù)
        2.2.1 PDF文檔文本內(nèi)容流定位問題
        2.2.2 PDF文檔stream標(biāo)簽快速定位算法
        2.2.3 實(shí)驗(yàn)結(jié)果與分析
            2.2.3.1 實(shí)驗(yàn)環(huán)境
            2.2.3.2 PDF文檔stream標(biāo)簽定位模擬實(shí)驗(yàn)及分析
    2.3 本章小結(jié)
第3章 PDF文本內(nèi)容多模式匹配算法研究
    3.1 經(jīng)典多模式匹配算法
        3.1.1 AC算法
        3.1.2 ACBM算法
        3.1.3 WM算法
    3.2 一種適用于中文PDF文本內(nèi)容的高效多模式匹配算法
        3.2.1 WM算法在PDF文本匹配中的算法分析
        3.2.2 PB-WM算法
        3.2.3 算法性能分析
            3.2.3.1 實(shí)驗(yàn)環(huán)境
            3.2.3.2 中文PDF文本內(nèi)容匹配模擬實(shí)驗(yàn)及分析
    3.3 基于Word2vec的詞匯相似匹配
        3.3.1 詞向量和語言模型
        3.3.2 Word2vec模型
        3.3.3 詞匯相似匹配
    3.4 本章小結(jié)
第4章 目標(biāo)情感分析模型研究與實(shí)現(xiàn)
    4.1 特定目標(biāo)情感分析
    4.2 基于注意力機(jī)制和LSTM網(wǎng)絡(luò)的目標(biāo)情感分析模型
        4.2.1 LSTM
        4.2.2 注意力機(jī)制
        4.2.3 基于注意力的雙向區(qū)域LSTM網(wǎng)絡(luò)模型
    4.3 實(shí)驗(yàn)結(jié)果與分析
        4.3.1 實(shí)驗(yàn)環(huán)境及數(shù)據(jù)處理
        4.3.2 特定目標(biāo)情感分析模擬實(shí)驗(yàn)及分析
    4.4 本章小結(jié)
第5章 PDF文檔敏感內(nèi)容防控系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)
    5.1 系統(tǒng)流程和框架設(shè)計(jì)
    5.2 系統(tǒng)模塊分析
        5.2.1 TCP反向代理模塊
        5.2.2 HTTP協(xié)議解析模塊
        5.2.3 PDF文本內(nèi)容敏感識別模塊
        5.2.4 界面模塊
    5.3 系統(tǒng)測試與分析
        5.3.1 PDF文本敏感詞匹配測試
        5.3.2 PDF文本敏感詞情感傾向性測試
        5.3.3 系統(tǒng)性能測試
    5.4 本章小結(jié)
結(jié)論
致謝
參考文獻(xiàn)
攻讀碩士期間發(fā)表的論文及科研成果



本文編號:3946259

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/shengwushengchang/3946259.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶c2fea***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com