天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 信息工程論文 >

基于NLP的RFC規(guī)則提取關(guān)鍵技術(shù)研究

發(fā)布時間:2020-03-21 23:03
【摘要】:隨著網(wǎng)絡(luò)應(yīng)用和加密安全技術(shù)的快速發(fā)展,加密通信逐漸成為網(wǎng)絡(luò)傳遞消息的主要方式,保證加密通信的證書驗證系統(tǒng)已經(jīng)應(yīng)用到各大具備網(wǎng)絡(luò)通信的應(yīng)用中。然而,加密通信使用的證書結(jié)構(gòu)一般比較復(fù)雜,并且證書的屬性之間存在多重限制條件,F(xiàn)有的加密證書驗證系統(tǒng)難以做到實現(xiàn)全部限制條件,從而導(dǎo)致非法證書入侵。為了確保用戶可以在網(wǎng)絡(luò)中安全地獲取證書,本文設(shè)計并實現(xiàn)了一套加密證書驗證系統(tǒng)的驗證工具RFCcertNLP,該工具充分利用了NLP(Natural Language Processing,自然語言處理)技術(shù)在信息提取方面的優(yōu)異特性。具體而言,RFCcertNLP利用NLP技術(shù)的分詞、分句以及詞性標記解決了定義X.509證書的RFC文檔數(shù)據(jù)不規(guī)則問題;利用關(guān)系提取模型讓信息提取過程更加智能。在數(shù)據(jù)預(yù)處理階段,本文以RFC文檔為輸入文本,通過設(shè)計算法提取不規(guī)則的RFC文檔中的語句。NLP技術(shù)主要體現(xiàn)在三個方面:根據(jù)模式匹配去除頁眉頁腳以及無用信息;利用NLP的分詞、分句能力獲取完整語句;使用NLP的詞性標記能力分類語句。在信息提取階段,本文設(shè)計了一個程度,條件類,條件值,結(jié)果類,結(jié)果值的五元組來定義RFC規(guī)則,并利用End-to-end模型直接從單一語句中提取關(guān)系實例。在提取關(guān)系時,將五元組中的代詞利用NLP技術(shù)的代詞消解模型替換為屬性名詞,提升了關(guān)系提取的信息可用性。并使用Dropout層來降低模型的過擬合程度。根據(jù)以上設(shè)計,本文實現(xiàn)了基于NLP的RFC規(guī)則提取,并從規(guī)則語句提取算法的性能、機器學(xué)習(xí)模型的表現(xiàn)以及系統(tǒng)的發(fā)現(xiàn)漏洞能力三個方面做了對比實驗。測試表明,本文實現(xiàn)的工具在三個方面都有很好的表現(xiàn)。在規(guī)則語句提取方面,本文實現(xiàn)的算法在時間復(fù)雜度和空間復(fù)雜度上相比于RFCcert有很大提升。在規(guī)則提取方面,本文實現(xiàn)的算法在精確率和召回率上得到了比較好的結(jié)果。在證書驗證系統(tǒng)驗證方面,RFCcertNLP利用32條規(guī)則產(chǎn)生了89個證書。其中,在與RFCcert相同的21條規(guī)則中,RFCcertNLP發(fā)現(xiàn)了38個漏洞而RFCcert僅僅發(fā)現(xiàn)了24個?偟膩碚f,工具從總體上提升了現(xiàn)有工具的處理效率并成功發(fā)現(xiàn)了更多現(xiàn)有證書驗證系統(tǒng)的漏洞。
【圖文】:

字母符號,提取規(guī)則,空格,單詞


使用了正則表達式去尋找相關(guān)頁眉頁腳所在的行,并將其刪除。在刪除頁眉頁腳后,所得到的信息即為分句的主要對象。圖3.3 提取規(guī)則算法在分句過程中,由于包含很多無用的非字母符號(主要是空格和回車)。因此,本文想到的策略是先分詞,將所有的行里面的單詞都聚合成一個單詞集。因為這些單詞是有序的。因此,算法只要找到每一句的結(jié)尾單詞即可將這些單詞分句;谶@樣的思想,算法將 line 數(shù)據(jù)中的多余非字母字符刪除并且只保留一個單詞集。當(dāng)然算法還在初始化過程中定義了 ASN.1 結(jié)構(gòu)體的形式、關(guān)鍵字字典以及自然語言表達的形式。在初始化結(jié)束以后,算法開始對語句進行提取信息。提取的過程在算法第 10-22 行。最外層的循環(huán)就是剛剛所講到的遍歷單詞。在遍歷單詞的時候,如果發(fā)現(xiàn)這個單詞符合章節(jié)定義(算法 12-14 行),那么我們就將當(dāng)前章節(jié)換成這個單詞。如果發(fā)現(xiàn)這個單詞為自然語言結(jié)尾

消費者,生產(chǎn)者,分類算法,語句


由于在 SSL\TLS 的實現(xiàn)中所有的消費者規(guī)則驗證都是必須實現(xiàn)的,因此規(guī)則驗證也主要集中于消費者規(guī)則。圖3.4 適用范圍分類算法區(qū)分消費者規(guī)則和生產(chǎn)者規(guī)則的方法就在于規(guī)則語句中的描述。在進行認真的觀察后,本文提出了和 RFCcert 相似的基于搜索的規(guī)則劃分方法。例如,主語為 CA 的大多是生產(chǎn)者規(guī)則。而賓語為 CA 的大多是消費者規(guī)則。因此,本文設(shè)計了基于 NLP詞性標記的語句實體識別算法。根據(jù) NLP 的詞性標記功能,可以確定一個句子的主語和賓語。根據(jù)主語賓語的主體含義來判斷當(dāng)前語句的規(guī)則類型。規(guī)則分類算法如圖 3.4 所示。與 RFCcert 不同的是,,本文首創(chuàng)性的提出了自然語言處理的方法。算法的 1-5 行是算法的初始化階段。提取了規(guī)則集,確定了生產(chǎn)者的名次定義,消費者的名詞定義以及初始化了生產(chǎn)者規(guī)則集和消費者規(guī)則集。初始化結(jié)束后
【學(xué)位授予單位】:西安電子科技大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2019
【分類號】:TN918;TP391.1

【相似文獻】

相關(guān)期刊論文 前10條

1 徐倫;;德育滲透 規(guī)則先行[J];中國學(xué)校體育;2017年04期

2 王燕;李明;;基于擴展概念格的分類規(guī)則獲取算法[J];計算機應(yīng)用;2007年10期

3 黃治國;張?zhí)煳?;基于極大團的不完備系統(tǒng)規(guī)則獲取方法[J];重慶郵電大學(xué)學(xué)報(自然科學(xué)版);2017年02期

4 任睿思;魏玲;祁建軍;;三支類背景上的規(guī)則獲取[J];計算機科學(xué);2018年10期

5 辛素飛;辛自強;林崇德;;潛規(guī)則認同及其與信任的關(guān)系[J];中國社會心理學(xué)評論;2017年02期

6 王麗娟;楊習(xí)貝;楊靜宇;吳陳;;基于多粒度理論的不完備決策規(guī)則獲取[J];南京理工大學(xué)學(xué)報;2013年01期

7 陳靜雯;馬福民;張騰飛;曾永鋼;;基于最大粒的悲觀鄰域多粒度粗糙集規(guī)則獲取算法[J];模式識別與人工智能;2017年11期

8 范新明;;基于交互式隸屬函數(shù)調(diào)整的模糊神經(jīng)網(wǎng)絡(luò)[J];內(nèi)江師范學(xué)院學(xué)報;2009年08期

9 程玉勝;張佑生;胡學(xué)鋼;章曉良;;基于任意分割的串行進位鏈規(guī)則獲取的計算流程[J];電子學(xué)報;2009年12期

10 代建華,潘云鶴;一種基于分類一致性的決策規(guī)則獲取算法[J];控制與決策;2004年10期

相關(guān)會議論文 前7條

1 汪凌;;基于相容矩陣計算的不完備決策系統(tǒng)規(guī)則獲取算法[A];第六屆ABB杯全國自動化系統(tǒng)工程師論文大賽論文集[C];2013年

2 王欣;陽春華;秦斌;;基于支持向量機的模糊規(guī)則獲取及其在鐵水硅含量預(yù)報中的應(yīng)用[A];2009中國儀器儀表與測控技術(shù)大會論文集[C];2009年

3 呂韶義;劉復(fù)巖;;基于決策樹的規(guī)則獲取[A];第七屆計算機模擬與信息技術(shù)學(xué)術(shù)會議論文集[C];1999年

4 ;基于模式?jīng)_突的多數(shù)據(jù)庫系統(tǒng)全局規(guī)則獲取(英文)[A];第十八屆全國數(shù)據(jù)庫學(xué)術(shù)會議論文集(技術(shù)報告篇)[C];2001年

5 王啟志;王曉霞;;基于粗糙集理論的磨削燒傷故障識別[A];2007'中國儀器儀表與測控技術(shù)交流大會論文集(二)[C];2007年

6 王啟志;王曉霞;;基于粗糙集理論的磨削燒傷故障識別[A];中國儀器儀表學(xué)會第九屆青年學(xué)術(shù)會議論文集[C];2007年

7 王紅軍;徐小力;韓秋實;;旋轉(zhuǎn)注水機組故障知識獲取的粗糙集模型研究[A];第八屆全國設(shè)備與維修工程學(xué)術(shù)會議、第十三屆全國設(shè)備監(jiān)測與診斷學(xué)術(shù)會議論文集[C];2008年

相關(guān)重要報紙文章 前9條

1 記者 羅沙;最高法出臺辦法嚴查法警當(dāng)掮客[N];新華每日電訊;2014年

2 記者 王文碩;嚴肅查處干警充當(dāng)訴訟掮客[N];人民公安報;2014年

3 顧遠山;以嚴明法治遏制“訴訟掮客”[N];中國紀檢監(jiān)察報;2014年

4 王慧娟;嚴防法院干警淪為“訴訟掮客”[N];河南法制報;2014年

5 特約評論員 魯兵海;法制發(fā)力打擊“訴訟掮客”[N];民主與法制時報;2014年

6 本報記者 劉平;市場規(guī)則如何與WTO接軌[N];中國信息報;2001年

7 ;著力解決群眾身邊不正之風(fēng)和腐敗問題[N];遼源日報;2016年

8 正澤;對訴訟掮客露頭就打[N];人民日報;2014年

9 本報記者 劉宇;別再讓“關(guān)系”牽著鼻子走[N];山西日報;2014年

相關(guān)博士學(xué)位論文 前4條

1 程玉勝;基于粗糙集理論的知識不確定性度量與規(guī)則獲取方法研究[D];合肥工業(yè)大學(xué);2007年

2 張國軍;基于粗糙集的相對屬性約簡算法及決策方法研究[D];華中科技大學(xué);2010年

3 蘇健;基于粗糙集的數(shù)據(jù)挖掘與決策支持方法研究[D];浙江大學(xué);2002年

4 馬麗;基于不確定性理論的概念格生成與知識獲取的若干問題研究[D];河北師范大學(xué);2016年

相關(guān)碩士學(xué)位論文 前10條

1 韓文政;基于NLP的RFC規(guī)則提取關(guān)鍵技術(shù)研究[D];西安電子科技大學(xué);2019年

2 劉一;基于時間粒度的時序關(guān)聯(lián)規(guī)則挖掘研究[D];蘭州交通大學(xué);2018年

3 桑妍麗;基于粗糙集的近似分布約簡與決策規(guī)則獲取[D];山西大學(xué);2005年

4 張婕;大學(xué)生對潛規(guī)則態(tài)度及行為意向初探[D];曲阜師范大學(xué);2017年

5 朱治春;基于類背景的雙向規(guī)則獲取[D];西北大學(xué);2015年

6 莫京蘭;復(fù)雜序信息系統(tǒng)的屬性約簡與規(guī)則獲取研究[D];廣西大學(xué);2013年

7 李明霞;基于規(guī)則控制的區(qū)間參數(shù)優(yōu)化方法及應(yīng)用[D];華北理工大學(xué);2017年

8 劉延卿;知識挖掘在時序信號分析系統(tǒng)中的應(yīng)用[D];大連交通大學(xué);2010年

9 吳紹兵;基于遺傳算法的模糊規(guī)則獲取研究[D];云南師范大學(xué);2005年

10 陳春霖;多知識抽取系統(tǒng)的設(shè)計與實現(xiàn)[D];大連海事大學(xué);2014年



本文編號:2594065

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/xinxigongchenglunwen/2594065.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶f7cd7***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com