天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 信息工程論文 >

基于NLP的RFC規(guī)則提取關(guān)鍵技術(shù)研究

發(fā)布時(shí)間:2020-03-21 23:03
【摘要】:隨著網(wǎng)絡(luò)應(yīng)用和加密安全技術(shù)的快速發(fā)展,加密通信逐漸成為網(wǎng)絡(luò)傳遞消息的主要方式,保證加密通信的證書(shū)驗(yàn)證系統(tǒng)已經(jīng)應(yīng)用到各大具備網(wǎng)絡(luò)通信的應(yīng)用中。然而,加密通信使用的證書(shū)結(jié)構(gòu)一般比較復(fù)雜,并且證書(shū)的屬性之間存在多重限制條件,F(xiàn)有的加密證書(shū)驗(yàn)證系統(tǒng)難以做到實(shí)現(xiàn)全部限制條件,從而導(dǎo)致非法證書(shū)入侵。為了確保用戶(hù)可以在網(wǎng)絡(luò)中安全地獲取證書(shū),本文設(shè)計(jì)并實(shí)現(xiàn)了一套加密證書(shū)驗(yàn)證系統(tǒng)的驗(yàn)證工具RFCcertNLP,該工具充分利用了NLP(Natural Language Processing,自然語(yǔ)言處理)技術(shù)在信息提取方面的優(yōu)異特性。具體而言,RFCcertNLP利用NLP技術(shù)的分詞、分句以及詞性標(biāo)記解決了定義X.509證書(shū)的RFC文檔數(shù)據(jù)不規(guī)則問(wèn)題;利用關(guān)系提取模型讓信息提取過(guò)程更加智能。在數(shù)據(jù)預(yù)處理階段,本文以RFC文檔為輸入文本,通過(guò)設(shè)計(jì)算法提取不規(guī)則的RFC文檔中的語(yǔ)句。NLP技術(shù)主要體現(xiàn)在三個(gè)方面:根據(jù)模式匹配去除頁(yè)眉頁(yè)腳以及無(wú)用信息;利用NLP的分詞、分句能力獲取完整語(yǔ)句;使用NLP的詞性標(biāo)記能力分類(lèi)語(yǔ)句。在信息提取階段,本文設(shè)計(jì)了一個(gè)程度,條件類(lèi),條件值,結(jié)果類(lèi),結(jié)果值的五元組來(lái)定義RFC規(guī)則,并利用End-to-end模型直接從單一語(yǔ)句中提取關(guān)系實(shí)例。在提取關(guān)系時(shí),將五元組中的代詞利用NLP技術(shù)的代詞消解模型替換為屬性名詞,提升了關(guān)系提取的信息可用性。并使用Dropout層來(lái)降低模型的過(guò)擬合程度。根據(jù)以上設(shè)計(jì),本文實(shí)現(xiàn)了基于NLP的RFC規(guī)則提取,并從規(guī)則語(yǔ)句提取算法的性能、機(jī)器學(xué)習(xí)模型的表現(xiàn)以及系統(tǒng)的發(fā)現(xiàn)漏洞能力三個(gè)方面做了對(duì)比實(shí)驗(yàn)。測(cè)試表明,本文實(shí)現(xiàn)的工具在三個(gè)方面都有很好的表現(xiàn)。在規(guī)則語(yǔ)句提取方面,本文實(shí)現(xiàn)的算法在時(shí)間復(fù)雜度和空間復(fù)雜度上相比于RFCcert有很大提升。在規(guī)則提取方面,本文實(shí)現(xiàn)的算法在精確率和召回率上得到了比較好的結(jié)果。在證書(shū)驗(yàn)證系統(tǒng)驗(yàn)證方面,RFCcertNLP利用32條規(guī)則產(chǎn)生了89個(gè)證書(shū)。其中,在與RFCcert相同的21條規(guī)則中,RFCcertNLP發(fā)現(xiàn)了38個(gè)漏洞而RFCcert僅僅發(fā)現(xiàn)了24個(gè)?偟膩(lái)說(shuō),工具從總體上提升了現(xiàn)有工具的處理效率并成功發(fā)現(xiàn)了更多現(xiàn)有證書(shū)驗(yàn)證系統(tǒng)的漏洞。
【圖文】:

字母符號(hào),提取規(guī)則,空格,單詞


使用了正則表達(dá)式去尋找相關(guān)頁(yè)眉頁(yè)腳所在的行,并將其刪除。在刪除頁(yè)眉頁(yè)腳后,所得到的信息即為分句的主要對(duì)象。圖3.3 提取規(guī)則算法在分句過(guò)程中,由于包含很多無(wú)用的非字母符號(hào)(主要是空格和回車(chē))。因此,本文想到的策略是先分詞,將所有的行里面的單詞都聚合成一個(gè)單詞集。因?yàn)檫@些單詞是有序的。因此,算法只要找到每一句的結(jié)尾單詞即可將這些單詞分句。基于這樣的思想,算法將 line 數(shù)據(jù)中的多余非字母字符刪除并且只保留一個(gè)單詞集。當(dāng)然算法還在初始化過(guò)程中定義了 ASN.1 結(jié)構(gòu)體的形式、關(guān)鍵字字典以及自然語(yǔ)言表達(dá)的形式。在初始化結(jié)束以后,算法開(kāi)始對(duì)語(yǔ)句進(jìn)行提取信息。提取的過(guò)程在算法第 10-22 行。最外層的循環(huán)就是剛剛所講到的遍歷單詞。在遍歷單詞的時(shí)候,如果發(fā)現(xiàn)這個(gè)單詞符合章節(jié)定義(算法 12-14 行),那么我們就將當(dāng)前章節(jié)換成這個(gè)單詞。如果發(fā)現(xiàn)這個(gè)單詞為自然語(yǔ)言結(jié)尾

消費(fèi)者,生產(chǎn)者,分類(lèi)算法,語(yǔ)句


由于在 SSL\TLS 的實(shí)現(xiàn)中所有的消費(fèi)者規(guī)則驗(yàn)證都是必須實(shí)現(xiàn)的,因此規(guī)則驗(yàn)證也主要集中于消費(fèi)者規(guī)則。圖3.4 適用范圍分類(lèi)算法區(qū)分消費(fèi)者規(guī)則和生產(chǎn)者規(guī)則的方法就在于規(guī)則語(yǔ)句中的描述。在進(jìn)行認(rèn)真的觀察后,本文提出了和 RFCcert 相似的基于搜索的規(guī)則劃分方法。例如,主語(yǔ)為 CA 的大多是生產(chǎn)者規(guī)則。而賓語(yǔ)為 CA 的大多是消費(fèi)者規(guī)則。因此,本文設(shè)計(jì)了基于 NLP詞性標(biāo)記的語(yǔ)句實(shí)體識(shí)別算法。根據(jù) NLP 的詞性標(biāo)記功能,可以確定一個(gè)句子的主語(yǔ)和賓語(yǔ)。根據(jù)主語(yǔ)賓語(yǔ)的主體含義來(lái)判斷當(dāng)前語(yǔ)句的規(guī)則類(lèi)型。規(guī)則分類(lèi)算法如圖 3.4 所示。與 RFCcert 不同的是,,本文首創(chuàng)性的提出了自然語(yǔ)言處理的方法。算法的 1-5 行是算法的初始化階段。提取了規(guī)則集,確定了生產(chǎn)者的名次定義,消費(fèi)者的名詞定義以及初始化了生產(chǎn)者規(guī)則集和消費(fèi)者規(guī)則集。初始化結(jié)束后
【學(xué)位授予單位】:西安電子科技大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2019
【分類(lèi)號(hào)】:TN918;TP391.1

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 徐倫;;德育滲透 規(guī)則先行[J];中國(guó)學(xué)校體育;2017年04期

2 王燕;李明;;基于擴(kuò)展概念格的分類(lèi)規(guī)則獲取算法[J];計(jì)算機(jī)應(yīng)用;2007年10期

3 黃治國(guó);張?zhí)煳?;基于極大團(tuán)的不完備系統(tǒng)規(guī)則獲取方法[J];重慶郵電大學(xué)學(xué)報(bào)(自然科學(xué)版);2017年02期

4 任睿思;魏玲;祁建軍;;三支類(lèi)背景上的規(guī)則獲取[J];計(jì)算機(jī)科學(xué);2018年10期

5 辛素飛;辛自強(qiáng);林崇德;;潛規(guī)則認(rèn)同及其與信任的關(guān)系[J];中國(guó)社會(huì)心理學(xué)評(píng)論;2017年02期

6 王麗娟;楊習(xí)貝;楊靜宇;吳陳;;基于多粒度理論的不完備決策規(guī)則獲取[J];南京理工大學(xué)學(xué)報(bào);2013年01期

7 陳靜雯;馬福民;張騰飛;曾永鋼;;基于最大粒的悲觀鄰域多粒度粗糙集規(guī)則獲取算法[J];模式識(shí)別與人工智能;2017年11期

8 范新明;;基于交互式隸屬函數(shù)調(diào)整的模糊神經(jīng)網(wǎng)絡(luò)[J];內(nèi)江師范學(xué)院學(xué)報(bào);2009年08期

9 程玉勝;張佑生;胡學(xué)鋼;章曉良;;基于任意分割的串行進(jìn)位鏈規(guī)則獲取的計(jì)算流程[J];電子學(xué)報(bào);2009年12期

10 代建華,潘云鶴;一種基于分類(lèi)一致性的決策規(guī)則獲取算法[J];控制與決策;2004年10期

相關(guān)會(huì)議論文 前7條

1 汪凌;;基于相容矩陣計(jì)算的不完備決策系統(tǒng)規(guī)則獲取算法[A];第六屆ABB杯全國(guó)自動(dòng)化系統(tǒng)工程師論文大賽論文集[C];2013年

2 王欣;陽(yáng)春華;秦斌;;基于支持向量機(jī)的模糊規(guī)則獲取及其在鐵水硅含量預(yù)報(bào)中的應(yīng)用[A];2009中國(guó)儀器儀表與測(cè)控技術(shù)大會(huì)論文集[C];2009年

3 呂韶義;劉復(fù)巖;;基于決策樹(shù)的規(guī)則獲取[A];第七屆計(jì)算機(jī)模擬與信息技術(shù)學(xué)術(shù)會(huì)議論文集[C];1999年

4 ;基于模式?jīng)_突的多數(shù)據(jù)庫(kù)系統(tǒng)全局規(guī)則獲取(英文)[A];第十八屆全國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2001年

5 王啟志;王曉霞;;基于粗糙集理論的磨削燒傷故障識(shí)別[A];2007'中國(guó)儀器儀表與測(cè)控技術(shù)交流大會(huì)論文集(二)[C];2007年

6 王啟志;王曉霞;;基于粗糙集理論的磨削燒傷故障識(shí)別[A];中國(guó)儀器儀表學(xué)會(huì)第九屆青年學(xué)術(shù)會(huì)議論文集[C];2007年

7 王紅軍;徐小力;韓秋實(shí);;旋轉(zhuǎn)注水機(jī)組故障知識(shí)獲取的粗糙集模型研究[A];第八屆全國(guó)設(shè)備與維修工程學(xué)術(shù)會(huì)議、第十三屆全國(guó)設(shè)備監(jiān)測(cè)與診斷學(xué)術(shù)會(huì)議論文集[C];2008年

相關(guān)重要報(bào)紙文章 前9條

1 記者 羅沙;最高法出臺(tái)辦法嚴(yán)查法警當(dāng)掮客[N];新華每日電訊;2014年

2 記者 王文碩;嚴(yán)肅查處干警充當(dāng)訴訟掮客[N];人民公安報(bào);2014年

3 顧遠(yuǎn)山;以嚴(yán)明法治遏制“訴訟掮客”[N];中國(guó)紀(jì)檢監(jiān)察報(bào);2014年

4 王慧娟;嚴(yán)防法院干警淪為“訴訟掮客”[N];河南法制報(bào);2014年

5 特約評(píng)論員 魯兵海;法制發(fā)力打擊“訴訟掮客”[N];民主與法制時(shí)報(bào);2014年

6 本報(bào)記者 劉平;市場(chǎng)規(guī)則如何與WTO接軌[N];中國(guó)信息報(bào);2001年

7 ;著力解決群眾身邊不正之風(fēng)和腐敗問(wèn)題[N];遼源日?qǐng)?bào);2016年

8 正澤;對(duì)訴訟掮客露頭就打[N];人民日?qǐng)?bào);2014年

9 本報(bào)記者 劉宇;別再讓“關(guān)系”牽著鼻子走[N];山西日?qǐng)?bào);2014年

相關(guān)博士學(xué)位論文 前4條

1 程玉勝;基于粗糙集理論的知識(shí)不確定性度量與規(guī)則獲取方法研究[D];合肥工業(yè)大學(xué);2007年

2 張國(guó)軍;基于粗糙集的相對(duì)屬性約簡(jiǎn)算法及決策方法研究[D];華中科技大學(xué);2010年

3 蘇健;基于粗糙集的數(shù)據(jù)挖掘與決策支持方法研究[D];浙江大學(xué);2002年

4 馬麗;基于不確定性理論的概念格生成與知識(shí)獲取的若干問(wèn)題研究[D];河北師范大學(xué);2016年

相關(guān)碩士學(xué)位論文 前10條

1 韓文政;基于NLP的RFC規(guī)則提取關(guān)鍵技術(shù)研究[D];西安電子科技大學(xué);2019年

2 劉一;基于時(shí)間粒度的時(shí)序關(guān)聯(lián)規(guī)則挖掘研究[D];蘭州交通大學(xué);2018年

3 桑妍麗;基于粗糙集的近似分布約簡(jiǎn)與決策規(guī)則獲取[D];山西大學(xué);2005年

4 張婕;大學(xué)生對(duì)潛規(guī)則態(tài)度及行為意向初探[D];曲阜師范大學(xué);2017年

5 朱治春;基于類(lèi)背景的雙向規(guī)則獲取[D];西北大學(xué);2015年

6 莫京蘭;復(fù)雜序信息系統(tǒng)的屬性約簡(jiǎn)與規(guī)則獲取研究[D];廣西大學(xué);2013年

7 李明霞;基于規(guī)則控制的區(qū)間參數(shù)優(yōu)化方法及應(yīng)用[D];華北理工大學(xué);2017年

8 劉延卿;知識(shí)挖掘在時(shí)序信號(hào)分析系統(tǒng)中的應(yīng)用[D];大連交通大學(xué);2010年

9 吳紹兵;基于遺傳算法的模糊規(guī)則獲取研究[D];云南師范大學(xué);2005年

10 陳春霖;多知識(shí)抽取系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];大連海事大學(xué);2014年



本文編號(hào):2594065

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/2594065.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶(hù)f7cd7***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com