基于輸入錯誤的中英文文本信息隱藏方法研究
發(fā)布時間:2022-02-24 16:46
在現(xiàn)代信息安全技術(shù)中,信息隱藏技術(shù)發(fā)揮著其不可替代的作用。目前,在圖像、音視頻、文件等載體上利用人類感官的限制等造成的冗余進行信息隱藏的研究百花齊放、層出不窮,但是對于文本載體,特別是純文本載體,由于文本攜帶著高度抽象而又密集的語義信息,對修改敏感,可進行秘密信息嵌入的冗余較少,因此純文本載體的信息隱藏方法種類較少,而目前網(wǎng)絡(luò)上面對海量的文本,其版權(quán)保護、文本泄密、隱秘通信資源未被充分利用等問題仍有待解決。在以社交媒體為代表的網(wǎng)絡(luò)環(huán)境下的文本中常常會出現(xiàn)輸入錯誤,進而本文在其他類型的文本、其它語言的文本中也注意到了輸入錯誤會以不同的頻率出現(xiàn)由此,本文對輸入錯誤、文本自動校對等進行了初步研究,認為輸入錯誤是一個跨語言的、普遍存在的、自然存在的現(xiàn)象,可以與信息隱藏進行創(chuàng)新性的融合。本文主要做了以下研究:首先,本文基于社交網(wǎng)絡(luò)等環(huán)境中的文本對中文文本與英文文本中的輸入錯誤進行了研究、分類,并以文本信息隱藏為目的設(shè)計了簡單的模擬生成部分輸入錯誤的初級方法。基于以上研究與對文本信息隱藏的研習(xí),本文利用前人設(shè)計的自然語言處理領(lǐng)域的語言模型BERT提出了基于輸入錯誤的中英文文本信息隱藏方法。由于中文...
【文章來源】:國際關(guān)系學(xué)院北京市
【文章頁數(shù)】:86 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 選題背景
1.2 研究現(xiàn)狀
1.2.1 信息隱藏與文本信息隱藏研究現(xiàn)狀
1.2.2 文本校對研究現(xiàn)狀
1.3 選題的目的和意義
1.4 主要工作與創(chuàng)新之處
1.5 論文結(jié)構(gòu)
第2章 相關(guān)理論與技術(shù)
2.1 信息隱藏
2.1.1 信息隱藏簡介
2.1.2 文本信息隱藏
2.2 輸入錯誤
2.2.1 輸入錯誤
2.2.2 社交媒體與輸入錯誤
2.2.3 英文輸入錯誤
2.2.4 中文輸入錯誤
2.3 輸入錯誤與信息隱藏
2.4 文本校對
2.5 利用輸入錯誤進行信息隱藏
2.6 BERT與 MASKED LM
2.6.1 BERT
2.6.2 MASKED LM
2.7 中文分詞
2.8 本章小結(jié)
第3章 基于輸入錯誤的英文文本隱寫方法
3.1 英文輸入錯誤研究應(yīng)用
3.1.1 英文輸入錯誤分類
3.1.2 結(jié)合與應(yīng)用
3.2 算法描述
3.2.1 算法設(shè)計
3.2.2 算法步驟
3.3 不可嵌入詞
3.4 實驗仿真
3.4.1 數(shù)據(jù)
3.4.2 超參設(shè)置
3.4.3 其他設(shè)置
3.5 實驗結(jié)果
3.5.1 實驗結(jié)果
3.5.2 時間分析
3.5.3 隱藏容量
3.5.4 安全性與魯棒性
3.6 本章小結(jié)
第4章 基于輸入錯誤的中文文本隱寫方法
4.1 中文輸入錯誤研究應(yīng)用
4.1.1 中文輸入錯誤分類
4.1.2 結(jié)合應(yīng)用
4.2 算法描述
4.2.1 算法設(shè)計
4.2.2 算法步驟
4.3 為什么不能直接使用單次的文本糾錯?
4.4 不可嵌入詞
4.5 實驗仿真
4.5.1 數(shù)據(jù)
4.5.2 超參設(shè)置
4.6 結(jié)果分析
4.6.1 實驗結(jié)果
4.6.2 時間分析
4.6.3 隱藏容量
4.6.4 不可見性
4.6.5 安全性與魯棒性
4.7 本章小結(jié)
第5章 方法改進思路
5.1 易感知性
5.2 增加輸入錯誤的形式
5.3 真詞錯誤
5.3.1 英文真詞錯誤替換
5.3.2 中文分詞歧義
5.4 對BERT進行fine-tune
第6章 結(jié)論與展望
6.1 全文總結(jié)
6.2 未來展望
參考文獻
附錄 A名詞表
A.1名詞與方法
A.1.1 BERT系
A.1.2本文涉及
A.2公式符號說明
致謝
作者簡歷
發(fā)表的學(xué)術(shù)論文
【參考文獻】:
期刊論文
[1]中文文本分類方法綜述[J]. 于游,付鈺,吳曉平. 網(wǎng)絡(luò)與信息安全學(xué)報. 2019(05)
[2]中文文本信息隱藏研究進展[J]. 吳國華,龔禮春,袁理鋒,姚曄. 通信學(xué)報. 2019(09)
[3]淺析粵語詞匯中的古語來源——以“走”“食”“細”為例[J]. 白雪冬. 赤峰學(xué)院學(xué)報(漢文哲學(xué)社會科學(xué)版). 2019(04)
[4]基于門限卷積神經(jīng)網(wǎng)絡(luò)和詞嵌入的中文分詞法[J]. 張競,劉暾東,陳美謙. 廈門大學(xué)學(xué)報(自然科學(xué)版). 2018(06)
[5]基于矩陣編碼的同義詞替換隱寫算法[J]. 楊瀟,李峰,向凌云. 小型微型計算機系統(tǒng). 2015(06)
[6]網(wǎng)絡(luò)傳播中的錯別字探究[J]. 賀洪花,陳銘. 藝術(shù)科技. 2014(02)
[7]五筆輸入法和拼音輸入法的認知效率比較[J]. 方燕紅,張積家. 井岡山大學(xué)學(xué)報(社會科學(xué)版). 2013(05)
[8]社交媒體:概念、發(fā)展歷程、特征與未來——兼談當下對社交媒體認識的模糊之處[J]. 曹博林. 湖南廣播電視大學(xué)學(xué)報. 2011(03)
[9]基于句法依存分析的文本水印算法[J]. 吳戈,文大化. 長春理工大學(xué)學(xué)報(自然科學(xué)版). 2011(03)
[10]基于字符階梯邊沿調(diào)整的文本水印算法[J]. 趙星陽,孫繼銀,李琳琳. 計算機應(yīng)用. 2008(12)
博士論文
[1]數(shù)字圖像盲取證技術(shù)研究[D]. 周琳娜.北京郵電大學(xué) 2007
碩士論文
[1]基于深度學(xué)習(xí)的中文分詞方法研究[D]. 史宇.南京郵電大學(xué) 2019
[2]基于機器翻譯模型的漢語近音錯別字校對方法研究[D]. 薛鑫.黑龍江大學(xué) 2017
[3]面向社會媒體的中文文本校對方法研究與實現(xiàn)[D]. 張鑫.黑龍江大學(xué) 2015
[4]基于隱寫編碼的自然語言信息隱藏技術(shù)研究[D]. 楊瀟.長沙理工大學(xué) 2015
[5]基于虛詞變換的文本隱藏信息檢測方法研究[D]. 曾萊蓓.湖南大學(xué) 2010
[6]拼音輸入法視角的網(wǎng)絡(luò)錯別字研究[D]. 耿亮.上海師范大學(xué) 2010
本文編號:3643128
【文章來源】:國際關(guān)系學(xué)院北京市
【文章頁數(shù)】:86 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 選題背景
1.2 研究現(xiàn)狀
1.2.1 信息隱藏與文本信息隱藏研究現(xiàn)狀
1.2.2 文本校對研究現(xiàn)狀
1.3 選題的目的和意義
1.4 主要工作與創(chuàng)新之處
1.5 論文結(jié)構(gòu)
第2章 相關(guān)理論與技術(shù)
2.1 信息隱藏
2.1.1 信息隱藏簡介
2.1.2 文本信息隱藏
2.2 輸入錯誤
2.2.1 輸入錯誤
2.2.2 社交媒體與輸入錯誤
2.2.3 英文輸入錯誤
2.2.4 中文輸入錯誤
2.3 輸入錯誤與信息隱藏
2.4 文本校對
2.5 利用輸入錯誤進行信息隱藏
2.6 BERT與 MASKED LM
2.6.1 BERT
2.6.2 MASKED LM
2.7 中文分詞
2.8 本章小結(jié)
第3章 基于輸入錯誤的英文文本隱寫方法
3.1 英文輸入錯誤研究應(yīng)用
3.1.1 英文輸入錯誤分類
3.1.2 結(jié)合與應(yīng)用
3.2 算法描述
3.2.1 算法設(shè)計
3.2.2 算法步驟
3.3 不可嵌入詞
3.4 實驗仿真
3.4.1 數(shù)據(jù)
3.4.2 超參設(shè)置
3.4.3 其他設(shè)置
3.5 實驗結(jié)果
3.5.1 實驗結(jié)果
3.5.2 時間分析
3.5.3 隱藏容量
3.5.4 安全性與魯棒性
3.6 本章小結(jié)
第4章 基于輸入錯誤的中文文本隱寫方法
4.1 中文輸入錯誤研究應(yīng)用
4.1.1 中文輸入錯誤分類
4.1.2 結(jié)合應(yīng)用
4.2 算法描述
4.2.1 算法設(shè)計
4.2.2 算法步驟
4.3 為什么不能直接使用單次的文本糾錯?
4.4 不可嵌入詞
4.5 實驗仿真
4.5.1 數(shù)據(jù)
4.5.2 超參設(shè)置
4.6 結(jié)果分析
4.6.1 實驗結(jié)果
4.6.2 時間分析
4.6.3 隱藏容量
4.6.4 不可見性
4.6.5 安全性與魯棒性
4.7 本章小結(jié)
第5章 方法改進思路
5.1 易感知性
5.2 增加輸入錯誤的形式
5.3 真詞錯誤
5.3.1 英文真詞錯誤替換
5.3.2 中文分詞歧義
5.4 對BERT進行fine-tune
第6章 結(jié)論與展望
6.1 全文總結(jié)
6.2 未來展望
參考文獻
附錄 A名詞表
A.1名詞與方法
A.1.1 BERT系
A.1.2本文涉及
A.2公式符號說明
致謝
作者簡歷
發(fā)表的學(xué)術(shù)論文
【參考文獻】:
期刊論文
[1]中文文本分類方法綜述[J]. 于游,付鈺,吳曉平. 網(wǎng)絡(luò)與信息安全學(xué)報. 2019(05)
[2]中文文本信息隱藏研究進展[J]. 吳國華,龔禮春,袁理鋒,姚曄. 通信學(xué)報. 2019(09)
[3]淺析粵語詞匯中的古語來源——以“走”“食”“細”為例[J]. 白雪冬. 赤峰學(xué)院學(xué)報(漢文哲學(xué)社會科學(xué)版). 2019(04)
[4]基于門限卷積神經(jīng)網(wǎng)絡(luò)和詞嵌入的中文分詞法[J]. 張競,劉暾東,陳美謙. 廈門大學(xué)學(xué)報(自然科學(xué)版). 2018(06)
[5]基于矩陣編碼的同義詞替換隱寫算法[J]. 楊瀟,李峰,向凌云. 小型微型計算機系統(tǒng). 2015(06)
[6]網(wǎng)絡(luò)傳播中的錯別字探究[J]. 賀洪花,陳銘. 藝術(shù)科技. 2014(02)
[7]五筆輸入法和拼音輸入法的認知效率比較[J]. 方燕紅,張積家. 井岡山大學(xué)學(xué)報(社會科學(xué)版). 2013(05)
[8]社交媒體:概念、發(fā)展歷程、特征與未來——兼談當下對社交媒體認識的模糊之處[J]. 曹博林. 湖南廣播電視大學(xué)學(xué)報. 2011(03)
[9]基于句法依存分析的文本水印算法[J]. 吳戈,文大化. 長春理工大學(xué)學(xué)報(自然科學(xué)版). 2011(03)
[10]基于字符階梯邊沿調(diào)整的文本水印算法[J]. 趙星陽,孫繼銀,李琳琳. 計算機應(yīng)用. 2008(12)
博士論文
[1]數(shù)字圖像盲取證技術(shù)研究[D]. 周琳娜.北京郵電大學(xué) 2007
碩士論文
[1]基于深度學(xué)習(xí)的中文分詞方法研究[D]. 史宇.南京郵電大學(xué) 2019
[2]基于機器翻譯模型的漢語近音錯別字校對方法研究[D]. 薛鑫.黑龍江大學(xué) 2017
[3]面向社會媒體的中文文本校對方法研究與實現(xiàn)[D]. 張鑫.黑龍江大學(xué) 2015
[4]基于隱寫編碼的自然語言信息隱藏技術(shù)研究[D]. 楊瀟.長沙理工大學(xué) 2015
[5]基于虛詞變換的文本隱藏信息檢測方法研究[D]. 曾萊蓓.湖南大學(xué) 2010
[6]拼音輸入法視角的網(wǎng)絡(luò)錯別字研究[D]. 耿亮.上海師范大學(xué) 2010
本文編號:3643128
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3643128.html
最近更新
教材專著