基于輸入錯(cuò)誤的中英文文本信息隱藏方法研究
發(fā)布時(shí)間:2022-02-24 16:46
在現(xiàn)代信息安全技術(shù)中,信息隱藏技術(shù)發(fā)揮著其不可替代的作用。目前,在圖像、音視頻、文件等載體上利用人類感官的限制等造成的冗余進(jìn)行信息隱藏的研究百花齊放、層出不窮,但是對(duì)于文本載體,特別是純文本載體,由于文本攜帶著高度抽象而又密集的語義信息,對(duì)修改敏感,可進(jìn)行秘密信息嵌入的冗余較少,因此純文本載體的信息隱藏方法種類較少,而目前網(wǎng)絡(luò)上面對(duì)海量的文本,其版權(quán)保護(hù)、文本泄密、隱秘通信資源未被充分利用等問題仍有待解決。在以社交媒體為代表的網(wǎng)絡(luò)環(huán)境下的文本中常常會(huì)出現(xiàn)輸入錯(cuò)誤,進(jìn)而本文在其他類型的文本、其它語言的文本中也注意到了輸入錯(cuò)誤會(huì)以不同的頻率出現(xiàn)由此,本文對(duì)輸入錯(cuò)誤、文本自動(dòng)校對(duì)等進(jìn)行了初步研究,認(rèn)為輸入錯(cuò)誤是一個(gè)跨語言的、普遍存在的、自然存在的現(xiàn)象,可以與信息隱藏進(jìn)行創(chuàng)新性的融合。本文主要做了以下研究:首先,本文基于社交網(wǎng)絡(luò)等環(huán)境中的文本對(duì)中文文本與英文文本中的輸入錯(cuò)誤進(jìn)行了研究、分類,并以文本信息隱藏為目的設(shè)計(jì)了簡(jiǎn)單的模擬生成部分輸入錯(cuò)誤的初級(jí)方法;谝陨涎芯颗c對(duì)文本信息隱藏的研習(xí),本文利用前人設(shè)計(jì)的自然語言處理領(lǐng)域的語言模型BERT提出了基于輸入錯(cuò)誤的中英文文本信息隱藏方法。由于中文...
【文章來源】:國際關(guān)系學(xué)院北京市
【文章頁數(shù)】:86 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 選題背景
1.2 研究現(xiàn)狀
1.2.1 信息隱藏與文本信息隱藏研究現(xiàn)狀
1.2.2 文本校對(duì)研究現(xiàn)狀
1.3 選題的目的和意義
1.4 主要工作與創(chuàng)新之處
1.5 論文結(jié)構(gòu)
第2章 相關(guān)理論與技術(shù)
2.1 信息隱藏
2.1.1 信息隱藏簡(jiǎn)介
2.1.2 文本信息隱藏
2.2 輸入錯(cuò)誤
2.2.1 輸入錯(cuò)誤
2.2.2 社交媒體與輸入錯(cuò)誤
2.2.3 英文輸入錯(cuò)誤
2.2.4 中文輸入錯(cuò)誤
2.3 輸入錯(cuò)誤與信息隱藏
2.4 文本校對(duì)
2.5 利用輸入錯(cuò)誤進(jìn)行信息隱藏
2.6 BERT與 MASKED LM
2.6.1 BERT
2.6.2 MASKED LM
2.7 中文分詞
2.8 本章小結(jié)
第3章 基于輸入錯(cuò)誤的英文文本隱寫方法
3.1 英文輸入錯(cuò)誤研究應(yīng)用
3.1.1 英文輸入錯(cuò)誤分類
3.1.2 結(jié)合與應(yīng)用
3.2 算法描述
3.2.1 算法設(shè)計(jì)
3.2.2 算法步驟
3.3 不可嵌入詞
3.4 實(shí)驗(yàn)仿真
3.4.1 數(shù)據(jù)
3.4.2 超參設(shè)置
3.4.3 其他設(shè)置
3.5 實(shí)驗(yàn)結(jié)果
3.5.1 實(shí)驗(yàn)結(jié)果
3.5.2 時(shí)間分析
3.5.3 隱藏容量
3.5.4 安全性與魯棒性
3.6 本章小結(jié)
第4章 基于輸入錯(cuò)誤的中文文本隱寫方法
4.1 中文輸入錯(cuò)誤研究應(yīng)用
4.1.1 中文輸入錯(cuò)誤分類
4.1.2 結(jié)合應(yīng)用
4.2 算法描述
4.2.1 算法設(shè)計(jì)
4.2.2 算法步驟
4.3 為什么不能直接使用單次的文本糾錯(cuò)?
4.4 不可嵌入詞
4.5 實(shí)驗(yàn)仿真
4.5.1 數(shù)據(jù)
4.5.2 超參設(shè)置
4.6 結(jié)果分析
4.6.1 實(shí)驗(yàn)結(jié)果
4.6.2 時(shí)間分析
4.6.3 隱藏容量
4.6.4 不可見性
4.6.5 安全性與魯棒性
4.7 本章小結(jié)
第5章 方法改進(jìn)思路
5.1 易感知性
5.2 增加輸入錯(cuò)誤的形式
5.3 真詞錯(cuò)誤
5.3.1 英文真詞錯(cuò)誤替換
5.3.2 中文分詞歧義
5.4 對(duì)BERT進(jìn)行fine-tune
第6章 結(jié)論與展望
6.1 全文總結(jié)
6.2 未來展望
參考文獻(xiàn)
附錄 A名詞表
A.1名詞與方法
A.1.1 BERT系
A.1.2本文涉及
A.2公式符號(hào)說明
致謝
作者簡(jiǎn)歷
發(fā)表的學(xué)術(shù)論文
【參考文獻(xiàn)】:
期刊論文
[1]中文文本分類方法綜述[J]. 于游,付鈺,吳曉平. 網(wǎng)絡(luò)與信息安全學(xué)報(bào). 2019(05)
[2]中文文本信息隱藏研究進(jìn)展[J]. 吳國華,龔禮春,袁理鋒,姚曄. 通信學(xué)報(bào). 2019(09)
[3]淺析粵語詞匯中的古語來源——以“走”“食”“細(xì)”為例[J]. 白雪冬. 赤峰學(xué)院學(xué)報(bào)(漢文哲學(xué)社會(huì)科學(xué)版). 2019(04)
[4]基于門限卷積神經(jīng)網(wǎng)絡(luò)和詞嵌入的中文分詞法[J]. 張競(jìng),劉暾東,陳美謙. 廈門大學(xué)學(xué)報(bào)(自然科學(xué)版). 2018(06)
[5]基于矩陣編碼的同義詞替換隱寫算法[J]. 楊瀟,李峰,向凌云. 小型微型計(jì)算機(jī)系統(tǒng). 2015(06)
[6]網(wǎng)絡(luò)傳播中的錯(cuò)別字探究[J]. 賀洪花,陳銘. 藝術(shù)科技. 2014(02)
[7]五筆輸入法和拼音輸入法的認(rèn)知效率比較[J]. 方燕紅,張積家. 井岡山大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版). 2013(05)
[8]社交媒體:概念、發(fā)展歷程、特征與未來——兼談當(dāng)下對(duì)社交媒體認(rèn)識(shí)的模糊之處[J]. 曹博林. 湖南廣播電視大學(xué)學(xué)報(bào). 2011(03)
[9]基于句法依存分析的文本水印算法[J]. 吳戈,文大化. 長(zhǎng)春理工大學(xué)學(xué)報(bào)(自然科學(xué)版). 2011(03)
[10]基于字符階梯邊沿調(diào)整的文本水印算法[J]. 趙星陽,孫繼銀,李琳琳. 計(jì)算機(jī)應(yīng)用. 2008(12)
博士論文
[1]數(shù)字圖像盲取證技術(shù)研究[D]. 周琳娜.北京郵電大學(xué) 2007
碩士論文
[1]基于深度學(xué)習(xí)的中文分詞方法研究[D]. 史宇.南京郵電大學(xué) 2019
[2]基于機(jī)器翻譯模型的漢語近音錯(cuò)別字校對(duì)方法研究[D]. 薛鑫.黑龍江大學(xué) 2017
[3]面向社會(huì)媒體的中文文本校對(duì)方法研究與實(shí)現(xiàn)[D]. 張?chǎng)?黑龍江大學(xué) 2015
[4]基于隱寫編碼的自然語言信息隱藏技術(shù)研究[D]. 楊瀟.長(zhǎng)沙理工大學(xué) 2015
[5]基于虛詞變換的文本隱藏信息檢測(cè)方法研究[D]. 曾萊蓓.湖南大學(xué) 2010
[6]拼音輸入法視角的網(wǎng)絡(luò)錯(cuò)別字研究[D]. 耿亮.上海師范大學(xué) 2010
本文編號(hào):3643128
【文章來源】:國際關(guān)系學(xué)院北京市
【文章頁數(shù)】:86 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 選題背景
1.2 研究現(xiàn)狀
1.2.1 信息隱藏與文本信息隱藏研究現(xiàn)狀
1.2.2 文本校對(duì)研究現(xiàn)狀
1.3 選題的目的和意義
1.4 主要工作與創(chuàng)新之處
1.5 論文結(jié)構(gòu)
第2章 相關(guān)理論與技術(shù)
2.1 信息隱藏
2.1.1 信息隱藏簡(jiǎn)介
2.1.2 文本信息隱藏
2.2 輸入錯(cuò)誤
2.2.1 輸入錯(cuò)誤
2.2.2 社交媒體與輸入錯(cuò)誤
2.2.3 英文輸入錯(cuò)誤
2.2.4 中文輸入錯(cuò)誤
2.3 輸入錯(cuò)誤與信息隱藏
2.4 文本校對(duì)
2.5 利用輸入錯(cuò)誤進(jìn)行信息隱藏
2.6 BERT與 MASKED LM
2.6.1 BERT
2.6.2 MASKED LM
2.7 中文分詞
2.8 本章小結(jié)
第3章 基于輸入錯(cuò)誤的英文文本隱寫方法
3.1 英文輸入錯(cuò)誤研究應(yīng)用
3.1.1 英文輸入錯(cuò)誤分類
3.1.2 結(jié)合與應(yīng)用
3.2 算法描述
3.2.1 算法設(shè)計(jì)
3.2.2 算法步驟
3.3 不可嵌入詞
3.4 實(shí)驗(yàn)仿真
3.4.1 數(shù)據(jù)
3.4.2 超參設(shè)置
3.4.3 其他設(shè)置
3.5 實(shí)驗(yàn)結(jié)果
3.5.1 實(shí)驗(yàn)結(jié)果
3.5.2 時(shí)間分析
3.5.3 隱藏容量
3.5.4 安全性與魯棒性
3.6 本章小結(jié)
第4章 基于輸入錯(cuò)誤的中文文本隱寫方法
4.1 中文輸入錯(cuò)誤研究應(yīng)用
4.1.1 中文輸入錯(cuò)誤分類
4.1.2 結(jié)合應(yīng)用
4.2 算法描述
4.2.1 算法設(shè)計(jì)
4.2.2 算法步驟
4.3 為什么不能直接使用單次的文本糾錯(cuò)?
4.4 不可嵌入詞
4.5 實(shí)驗(yàn)仿真
4.5.1 數(shù)據(jù)
4.5.2 超參設(shè)置
4.6 結(jié)果分析
4.6.1 實(shí)驗(yàn)結(jié)果
4.6.2 時(shí)間分析
4.6.3 隱藏容量
4.6.4 不可見性
4.6.5 安全性與魯棒性
4.7 本章小結(jié)
第5章 方法改進(jìn)思路
5.1 易感知性
5.2 增加輸入錯(cuò)誤的形式
5.3 真詞錯(cuò)誤
5.3.1 英文真詞錯(cuò)誤替換
5.3.2 中文分詞歧義
5.4 對(duì)BERT進(jìn)行fine-tune
第6章 結(jié)論與展望
6.1 全文總結(jié)
6.2 未來展望
參考文獻(xiàn)
附錄 A名詞表
A.1名詞與方法
A.1.1 BERT系
A.1.2本文涉及
A.2公式符號(hào)說明
致謝
作者簡(jiǎn)歷
發(fā)表的學(xué)術(shù)論文
【參考文獻(xiàn)】:
期刊論文
[1]中文文本分類方法綜述[J]. 于游,付鈺,吳曉平. 網(wǎng)絡(luò)與信息安全學(xué)報(bào). 2019(05)
[2]中文文本信息隱藏研究進(jìn)展[J]. 吳國華,龔禮春,袁理鋒,姚曄. 通信學(xué)報(bào). 2019(09)
[3]淺析粵語詞匯中的古語來源——以“走”“食”“細(xì)”為例[J]. 白雪冬. 赤峰學(xué)院學(xué)報(bào)(漢文哲學(xué)社會(huì)科學(xué)版). 2019(04)
[4]基于門限卷積神經(jīng)網(wǎng)絡(luò)和詞嵌入的中文分詞法[J]. 張競(jìng),劉暾東,陳美謙. 廈門大學(xué)學(xué)報(bào)(自然科學(xué)版). 2018(06)
[5]基于矩陣編碼的同義詞替換隱寫算法[J]. 楊瀟,李峰,向凌云. 小型微型計(jì)算機(jī)系統(tǒng). 2015(06)
[6]網(wǎng)絡(luò)傳播中的錯(cuò)別字探究[J]. 賀洪花,陳銘. 藝術(shù)科技. 2014(02)
[7]五筆輸入法和拼音輸入法的認(rèn)知效率比較[J]. 方燕紅,張積家. 井岡山大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版). 2013(05)
[8]社交媒體:概念、發(fā)展歷程、特征與未來——兼談當(dāng)下對(duì)社交媒體認(rèn)識(shí)的模糊之處[J]. 曹博林. 湖南廣播電視大學(xué)學(xué)報(bào). 2011(03)
[9]基于句法依存分析的文本水印算法[J]. 吳戈,文大化. 長(zhǎng)春理工大學(xué)學(xué)報(bào)(自然科學(xué)版). 2011(03)
[10]基于字符階梯邊沿調(diào)整的文本水印算法[J]. 趙星陽,孫繼銀,李琳琳. 計(jì)算機(jī)應(yīng)用. 2008(12)
博士論文
[1]數(shù)字圖像盲取證技術(shù)研究[D]. 周琳娜.北京郵電大學(xué) 2007
碩士論文
[1]基于深度學(xué)習(xí)的中文分詞方法研究[D]. 史宇.南京郵電大學(xué) 2019
[2]基于機(jī)器翻譯模型的漢語近音錯(cuò)別字校對(duì)方法研究[D]. 薛鑫.黑龍江大學(xué) 2017
[3]面向社會(huì)媒體的中文文本校對(duì)方法研究與實(shí)現(xiàn)[D]. 張?chǎng)?黑龍江大學(xué) 2015
[4]基于隱寫編碼的自然語言信息隱藏技術(shù)研究[D]. 楊瀟.長(zhǎng)沙理工大學(xué) 2015
[5]基于虛詞變換的文本隱藏信息檢測(cè)方法研究[D]. 曾萊蓓.湖南大學(xué) 2010
[6]拼音輸入法視角的網(wǎng)絡(luò)錯(cuò)別字研究[D]. 耿亮.上海師范大學(xué) 2010
本文編號(hào):3643128
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3643128.html
最近更新
教材專著