基于文本自動生成的信息隱藏方法
發(fā)布時間:2021-06-16 05:50
隨著大數(shù)據(jù)時代的到來,保障用戶的信息安全成為目前的研究熱點。信息隱藏是信息安全領域的重要技術之一。該技術通過將秘密信息嵌入到在公開信道傳輸?shù)臄?shù)據(jù)中,使其不易被攻擊者察覺。由于文本具有較高的編碼性,且是人們?nèi)粘Mㄐ偶鞍l(fā)表觀點時使用最為廣泛的載體,基于文本的信息隱藏吸引了研究者的關注。受益于深度學習神經(jīng)網(wǎng)絡的飛速發(fā)展,將神經(jīng)網(wǎng)絡與信息隱藏相結(jié)合成為探索新方法的一個重要分支;谏鲜鲅芯勘尘,本文對基于文本自動生成的信息隱藏方法展開相關研究,主要工作如下:首先,數(shù)據(jù)集的預處理。神經(jīng)網(wǎng)絡模型依賴于其強大的自我學習能力,因此,需要構建含有大量自然文本的數(shù)據(jù)集。本文選用評述性文本數(shù)據(jù)集——影評數(shù)據(jù)集、正式性文本數(shù)據(jù)集——新聞數(shù)據(jù)集以及非正式性文本數(shù)據(jù)集——推特數(shù)據(jù)集作為神經(jīng)網(wǎng)絡的訓練集,以此構建參數(shù)適配的神經(jīng)網(wǎng)絡模型。數(shù)據(jù)集預處理包括替換字母大小寫、刪除特殊符號和過濾web鏈接等,消除文本在自動生成過程中的干擾因素。其次,設計秘密信息嵌入與提取算法。本文選用統(tǒng)計語言模型馬爾可夫模型和神經(jīng)網(wǎng)絡模型循環(huán)神經(jīng)網(wǎng)絡作為文本生成模型進行對比分析。馬爾可夫模型具有與自然語言生成過程所匹配的元結(jié)構。循環(huán)神經(jīng)網(wǎng)絡...
【文章來源】:沈陽工業(yè)大學遼寧省
【文章頁數(shù)】:60 頁
【學位級別】:碩士
【部分圖文】:
信息隱藏結(jié)構框圖
本文提出一種能夠自動生成高質(zhì)量隱寫文本的信息隱藏方法,通過傳統(tǒng)的概率統(tǒng)計模型(馬爾可夫模型)和自然語言處理技術(循環(huán)神經(jīng)網(wǎng)絡)與哈夫曼編碼相結(jié)合,以生成語法正確、語義連貫的隱寫文本,降低被檢測器捕獲的風險。為了進一步提高隱寫文本的隱蔽性和隱藏容量,且考慮到不同單詞具有不同的敏感度,在提出的模型基礎上對生成過程中構建的候選池進行優(yōu)化,提出了基于困惑度計算的候選池自收縮機制,以期在提高生成的隱寫文本的質(zhì)量的同時,提高信息隱藏方法整體的隱蔽性。1.2國內(nèi)外研究現(xiàn)狀1.2.1文本信息隱藏研究現(xiàn)狀圖1.2文本信息隱藏研究現(xiàn)狀Fig.1.2Theresearchstatusoftextinformationhiding
7第2章文本生成模型文本的自動生成離不開自然語言生成技術的發(fā)展。自然語言生成技術可分為模版生成技術和屬性-特征生成技術。針對基于模版的文本生成技術不適用于開放性領域的缺陷,本文采用基于語言模型的生成技術自動生成隱寫文本,并選用概率統(tǒng)計模型(馬爾可夫模型)和深度學習模型(循環(huán)神經(jīng)網(wǎng)絡)對文本的語義特征進行提取和分析,為后文秘密信息的嵌入和提取算法作鋪墊。2.1馬爾可夫模型在統(tǒng)計自然語言處理領域,通常使用統(tǒng)計語言模型[37]對句子進行建模。語言模型將句子視為序列字符串,對句子中單詞的概率分布進行建模,如公式(2.1)所示:niiinnwwwppwwwpwwwpwwpwpS11111213121)|()|()|()|()()((2.1)其中,S表示由單詞n,...,,www21組成的句子,長度為n。在語言模型中,生成第nii)1(個單詞的概率分布是由此時刻前已經(jīng)產(chǎn)生的i1個詞121,...,,iwww決定的,即),...,|(ii11wwwp。因此,在自動生成隱寫文本的信息隱藏方法中,若想自動生成高質(zhì)量的文本,需要獲得訓練樣本集的統(tǒng)計語言模型的良好的估計。圖2.1馬爾可夫模型Fig.2.1Markovmodel馬爾可夫模型(Markovmodel)[38,39]是具有無后效性的隨機過程,是描述了一系列可能事件的隨機模型,如圖2.1所示。該過程的主要思想為:當過程在時刻t的狀態(tài)為已知時,過程在t1時刻所處狀態(tài)的概率特性只與過程在t時刻所處的狀態(tài)有關,而與過程在t時刻之前的狀態(tài)無關,可用公式(2.2)表示:)|(),...,,|(1211tkttktPXXsXPXsXX(2.2)其中,},...,,{21TXXXX是一組隨機序列,角標t代表該狀態(tài)所對應的時刻。沈陽工業(yè)大學碩士學位論文
【參考文獻】:
期刊論文
[1]深度置信網(wǎng)絡模型及應用研究綜述[J]. 劉方園,王水花,張煜東. 計算機工程與應用. 2018(01)
[2]基于雅克比符號的文本信息隱藏[J]. 左祥建,楊曉莉. 計算機技術與發(fā)展. 2016(02)
[3]基于替換有格式文本空間特征信息的隱藏策略[J]. 張鑫. 新鄉(xiāng)學院學報(自然科學版). 2011(05)
[4]基于動態(tài)模板的電子文書生成技術研究[J]. 堯欣. 信息記錄材料. 2010(03)
[5]基于支持向量機的文本隱寫分析[J]. 眭新光,羅慧,朱中梁. 計算機工程. 2009(06)
[6]針對同義詞替換信息隱藏的檢測方法研究[J]. 羅綱,孫星明,向凌云,劉玉玲,甘燦. 計算機研究與發(fā)展. 2008(10)
[7]利用范本構建語法模板生成仿自然語言隱寫文本[J]. 蘇勝君,李維斌,陳超,王朔中. 電子與信息學報. 2008(08)
[8]自然語言生成技術及其應用實例[J]. 賈佩山. 電腦與信息技術. 1997(02)
本文編號:3232494
【文章來源】:沈陽工業(yè)大學遼寧省
【文章頁數(shù)】:60 頁
【學位級別】:碩士
【部分圖文】:
信息隱藏結(jié)構框圖
本文提出一種能夠自動生成高質(zhì)量隱寫文本的信息隱藏方法,通過傳統(tǒng)的概率統(tǒng)計模型(馬爾可夫模型)和自然語言處理技術(循環(huán)神經(jīng)網(wǎng)絡)與哈夫曼編碼相結(jié)合,以生成語法正確、語義連貫的隱寫文本,降低被檢測器捕獲的風險。為了進一步提高隱寫文本的隱蔽性和隱藏容量,且考慮到不同單詞具有不同的敏感度,在提出的模型基礎上對生成過程中構建的候選池進行優(yōu)化,提出了基于困惑度計算的候選池自收縮機制,以期在提高生成的隱寫文本的質(zhì)量的同時,提高信息隱藏方法整體的隱蔽性。1.2國內(nèi)外研究現(xiàn)狀1.2.1文本信息隱藏研究現(xiàn)狀圖1.2文本信息隱藏研究現(xiàn)狀Fig.1.2Theresearchstatusoftextinformationhiding
7第2章文本生成模型文本的自動生成離不開自然語言生成技術的發(fā)展。自然語言生成技術可分為模版生成技術和屬性-特征生成技術。針對基于模版的文本生成技術不適用于開放性領域的缺陷,本文采用基于語言模型的生成技術自動生成隱寫文本,并選用概率統(tǒng)計模型(馬爾可夫模型)和深度學習模型(循環(huán)神經(jīng)網(wǎng)絡)對文本的語義特征進行提取和分析,為后文秘密信息的嵌入和提取算法作鋪墊。2.1馬爾可夫模型在統(tǒng)計自然語言處理領域,通常使用統(tǒng)計語言模型[37]對句子進行建模。語言模型將句子視為序列字符串,對句子中單詞的概率分布進行建模,如公式(2.1)所示:niiinnwwwppwwwpwwwpwwpwpS11111213121)|()|()|()|()()((2.1)其中,S表示由單詞n,...,,www21組成的句子,長度為n。在語言模型中,生成第nii)1(個單詞的概率分布是由此時刻前已經(jīng)產(chǎn)生的i1個詞121,...,,iwww決定的,即),...,|(ii11wwwp。因此,在自動生成隱寫文本的信息隱藏方法中,若想自動生成高質(zhì)量的文本,需要獲得訓練樣本集的統(tǒng)計語言模型的良好的估計。圖2.1馬爾可夫模型Fig.2.1Markovmodel馬爾可夫模型(Markovmodel)[38,39]是具有無后效性的隨機過程,是描述了一系列可能事件的隨機模型,如圖2.1所示。該過程的主要思想為:當過程在時刻t的狀態(tài)為已知時,過程在t1時刻所處狀態(tài)的概率特性只與過程在t時刻所處的狀態(tài)有關,而與過程在t時刻之前的狀態(tài)無關,可用公式(2.2)表示:)|(),...,,|(1211tkttktPXXsXPXsXX(2.2)其中,},...,,{21TXXXX是一組隨機序列,角標t代表該狀態(tài)所對應的時刻。沈陽工業(yè)大學碩士學位論文
【參考文獻】:
期刊論文
[1]深度置信網(wǎng)絡模型及應用研究綜述[J]. 劉方園,王水花,張煜東. 計算機工程與應用. 2018(01)
[2]基于雅克比符號的文本信息隱藏[J]. 左祥建,楊曉莉. 計算機技術與發(fā)展. 2016(02)
[3]基于替換有格式文本空間特征信息的隱藏策略[J]. 張鑫. 新鄉(xiāng)學院學報(自然科學版). 2011(05)
[4]基于動態(tài)模板的電子文書生成技術研究[J]. 堯欣. 信息記錄材料. 2010(03)
[5]基于支持向量機的文本隱寫分析[J]. 眭新光,羅慧,朱中梁. 計算機工程. 2009(06)
[6]針對同義詞替換信息隱藏的檢測方法研究[J]. 羅綱,孫星明,向凌云,劉玉玲,甘燦. 計算機研究與發(fā)展. 2008(10)
[7]利用范本構建語法模板生成仿自然語言隱寫文本[J]. 蘇勝君,李維斌,陳超,王朔中. 電子與信息學報. 2008(08)
[8]自然語言生成技術及其應用實例[J]. 賈佩山. 電腦與信息技術. 1997(02)
本文編號:3232494
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3232494.html
最近更新
教材專著