基于深度學(xué)習(xí)的網(wǎng)絡(luò)敏感信息感知研究
發(fā)布時(shí)間:2021-11-28 09:11
網(wǎng)絡(luò)信息服務(wù)范圍逐步擴(kuò)大,呈現(xiàn)出明顯的智慧化與精細(xì)化特征。頻繁的互聯(lián)網(wǎng)行為產(chǎn)生大量信息,導(dǎo)致網(wǎng)絡(luò)信息量龐大難以處理;網(wǎng)絡(luò)空間具備開(kāi)放性、強(qiáng)交互性、高隱蔽性且傳播速度快等特點(diǎn),已成為不法分子開(kāi)展危害社會(huì)公共安全活動(dòng)的主戰(zhàn)場(chǎng),對(duì)國(guó)家安全部門在網(wǎng)絡(luò)治理模塊的行動(dòng)策略及手段提出了更高要求。本文著眼于海量網(wǎng)絡(luò)信息中的文本信息類型,提出一種基于深度學(xué)習(xí)方法的網(wǎng)絡(luò)敏感信息感知方法及模型,針對(duì)網(wǎng)絡(luò)文本信息分別開(kāi)展特征提取與中文命名實(shí)體識(shí)別。在繁雜的網(wǎng)絡(luò)信息中,存在大量敏感性文本信息,文本信息自身具有一詞多義、歧義、斷句不明晰等問(wèn)題,在文本分析處理過(guò)程中造成極大的噪聲干擾,加之網(wǎng)絡(luò)空間中信息流速快,致使情報(bào)分析部門不能迅速獲取或攔截信息,也很難從中剖析出大量有價(jià)值、可利用的信息。盡管大數(shù)據(jù)技術(shù)日趨成熟,也成功應(yīng)用于各行各業(yè),但針對(duì)大規(guī)模雜亂的文本數(shù)據(jù),大數(shù)據(jù)技術(shù)顯然已達(dá)不到數(shù)據(jù)處理高效性與精準(zhǔn)性的要求,故而選取深度學(xué)習(xí)方法,在提升效率的同時(shí)更全面地獲取深層信息。首先選取了稀疏自編碼器提取網(wǎng)絡(luò)短文本特征,利用稀疏自編碼器的主動(dòng)學(xué)習(xí)過(guò)程,使目標(biāo)短文本由高維向量轉(zhuǎn)化為低維向量,剔除干擾項(xiàng),確保低維向量中包含原...
【文章來(lái)源】:湖北工業(yè)大學(xué)湖北省
【文章頁(yè)數(shù)】:70 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
涉恐人名、地名、組織機(jī)構(gòu)名詞云
【參考文獻(xiàn)】:
期刊論文
[1]基于多語(yǔ)義因子分層聚類的文本特征提取方法[J]. 王靖,柳青,張德海,趙華,楊云. 計(jì)算機(jī)應(yīng)用研究. 2020(10)
[2]面向多標(biāo)簽文本分類的深度主題特征提取[J]. 陳文實(shí),劉心惠,魯明羽. 模式識(shí)別與人工智能. 2019(09)
[3]基于CRF的藏文地名識(shí)別技術(shù)研究[J]. 頭旦才讓,仁青東主,尼瑪扎西. 計(jì)算機(jī)工程與應(yīng)用. 2019(18)
[4]基于BiLSTM-CRF的商情實(shí)體識(shí)別模型[J]. 張應(yīng)成,楊洋,蔣瑞,全兵,張利君,任曉雷. 計(jì)算機(jī)工程. 2019(05)
[5]基于BLSTM-CRF模型的安全漏洞領(lǐng)域命名實(shí)體識(shí)別[J]. 張若彬,劉嘉勇,何祥. 四川大學(xué)學(xué)報(bào)(自然科學(xué)版). 2019(03)
[6]基于深度主動(dòng)學(xué)習(xí)的信息安全領(lǐng)域命名實(shí)體識(shí)別研究[J]. 彭嘉毅,方勇,黃誠(chéng),劉亮,姜政偉. 四川大學(xué)學(xué)報(bào)(自然科學(xué)版). 2019(03)
[7]植物屬性文本的命名實(shí)體識(shí)別方法研究[J]. 李冬梅,檀穩(wěn). 計(jì)算機(jī)科學(xué)與探索. 2019(12)
[8]深度學(xué)習(xí)實(shí)體關(guān)系抽取研究綜述[J]. 鄂海紅,張文靜,肖思琪,程瑞,胡鶯夕,周筱松,牛佩晴. 軟件學(xué)報(bào). 2019(06)
[9]基于深度學(xué)習(xí)的文本表示方法[J]. 李楓林,柯佳. 情報(bào)科學(xué). 2019(01)
[10]基于CNN和BiLSTM網(wǎng)絡(luò)特征融合的文本情感分析[J]. 李洋,董紅斌. 計(jì)算機(jī)應(yīng)用. 2018(11)
本文編號(hào):3524145
【文章來(lái)源】:湖北工業(yè)大學(xué)湖北省
【文章頁(yè)數(shù)】:70 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
涉恐人名、地名、組織機(jī)構(gòu)名詞云
【參考文獻(xiàn)】:
期刊論文
[1]基于多語(yǔ)義因子分層聚類的文本特征提取方法[J]. 王靖,柳青,張德海,趙華,楊云. 計(jì)算機(jī)應(yīng)用研究. 2020(10)
[2]面向多標(biāo)簽文本分類的深度主題特征提取[J]. 陳文實(shí),劉心惠,魯明羽. 模式識(shí)別與人工智能. 2019(09)
[3]基于CRF的藏文地名識(shí)別技術(shù)研究[J]. 頭旦才讓,仁青東主,尼瑪扎西. 計(jì)算機(jī)工程與應(yīng)用. 2019(18)
[4]基于BiLSTM-CRF的商情實(shí)體識(shí)別模型[J]. 張應(yīng)成,楊洋,蔣瑞,全兵,張利君,任曉雷. 計(jì)算機(jī)工程. 2019(05)
[5]基于BLSTM-CRF模型的安全漏洞領(lǐng)域命名實(shí)體識(shí)別[J]. 張若彬,劉嘉勇,何祥. 四川大學(xué)學(xué)報(bào)(自然科學(xué)版). 2019(03)
[6]基于深度主動(dòng)學(xué)習(xí)的信息安全領(lǐng)域命名實(shí)體識(shí)別研究[J]. 彭嘉毅,方勇,黃誠(chéng),劉亮,姜政偉. 四川大學(xué)學(xué)報(bào)(自然科學(xué)版). 2019(03)
[7]植物屬性文本的命名實(shí)體識(shí)別方法研究[J]. 李冬梅,檀穩(wěn). 計(jì)算機(jī)科學(xué)與探索. 2019(12)
[8]深度學(xué)習(xí)實(shí)體關(guān)系抽取研究綜述[J]. 鄂海紅,張文靜,肖思琪,程瑞,胡鶯夕,周筱松,牛佩晴. 軟件學(xué)報(bào). 2019(06)
[9]基于深度學(xué)習(xí)的文本表示方法[J]. 李楓林,柯佳. 情報(bào)科學(xué). 2019(01)
[10]基于CNN和BiLSTM網(wǎng)絡(luò)特征融合的文本情感分析[J]. 李洋,董紅斌. 計(jì)算機(jī)應(yīng)用. 2018(11)
本文編號(hào):3524145
本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/3524145.html
最近更新
教材專著