天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

面向自然語(yǔ)言處理系統(tǒng)的對(duì)抗攻擊與防御研究

發(fā)布時(shí)間:2022-05-05 20:49
  近年來(lái),基于深度學(xué)習(xí)的文本分析和理解已成為包括問(wèn)答、機(jī)器翻譯、信息抽取以及文本分類(lèi)在內(nèi)的各種自然語(yǔ)言處理應(yīng)用背后的核心技術(shù)。然而,盡管其備受歡迎且性能出色,但最新研究表明基于深度神經(jīng)網(wǎng)絡(luò)的自然語(yǔ)言處理模型容易受到惡意制作的對(duì)抗性輸入的攻擊。考慮到其在諸如情感分析、有害內(nèi)容檢測(cè)以及文本反垃圾等許多現(xiàn)實(shí)的安全敏感的任務(wù)中應(yīng)用越來(lái)越廣泛,這種脆弱性引起了人們對(duì)自然語(yǔ)言處理模型的安全性的極大擔(dān)憂和高度關(guān)注。為了進(jìn)一步研究基于深度神經(jīng)網(wǎng)絡(luò)的自然語(yǔ)言處理模型的脆弱性,學(xué)術(shù)界從不同的角度提出了大量的攻擊方法來(lái)生成對(duì)抗文本。然而,大多數(shù)現(xiàn)有的攻擊都假定可以訪問(wèn)目標(biāo)模型的結(jié)構(gòu)、參數(shù)或訓(xùn)練數(shù)據(jù),而這種假設(shè)在許多現(xiàn)實(shí)的場(chǎng)景中通常不成立。并且,現(xiàn)有關(guān)于文本對(duì)抗攻擊的研究主要集中在英文自然語(yǔ)言處理領(lǐng)域,而中文自然語(yǔ)言處理系統(tǒng)針對(duì)對(duì)抗文本的脆弱性仍然未知。此外,在對(duì)抗攻防博弈中,現(xiàn)有防御機(jī)制明顯處于劣勢(shì),導(dǎo)致將自然語(yǔ)言處理模型完全暴露給了攻擊者。為了彌合這一巨大差距以期進(jìn)一步增強(qiáng)自然語(yǔ)言處理模型的魯棒性,本文從三個(gè)方面研究了針對(duì)自然語(yǔ)言處理模型的對(duì)抗攻擊和防御。與先前的工作相比,本文的優(yōu)勢(shì)在于:(1)針對(duì)現(xiàn)實(shí)應(yīng)用... 

【文章頁(yè)數(shù)】:109 頁(yè)

【學(xué)位級(jí)別】:碩士

【文章目錄】:
摘要
Abstract
第1章 緒論
    1.1 研究背景及意義
    1.2 研究?jī)?nèi)容與貢獻(xiàn)
        1.2.1 本文研究?jī)?nèi)容
        1.2.2 本文主要貢獻(xiàn)
    1.3 本文組織結(jié)構(gòu)
    1.4 本章小結(jié)
第2章 文本對(duì)抗攻擊與防御綜述
    2.1 文本對(duì)抗攻擊
        2.1.1 基于梯度的攻擊
        2.1.2 基于置信度的攻擊
        2.1.3 基于遷移性的攻擊
        2.1.4 基于模型決策的攻擊
    2.2 文本對(duì)抗防御
        2.2.1 對(duì)抗訓(xùn)練
        2.2.2 拼寫(xiě)糾錯(cuò)
    2.3 本章小結(jié)
第3章 面向現(xiàn)實(shí)應(yīng)用的英文文本對(duì)抗攻擊
    3.1 引言
    3.2 攻擊設(shè)計(jì)
        3.2.1 問(wèn)題定義
        3.2.2 威脅模型
        3.2.3 TextBugger攻擊方法
    3.3 攻擊評(píng)估:情感分析
        3.3.1 數(shù)據(jù)集
        3.3.2 目標(biāo)模型
        3.3.3 基線算法
        3.3.4 評(píng)估指標(biāo)
        3.3.5 實(shí)現(xiàn)細(xì)節(jié)
        3.3.6 攻擊性能
        3.3.7 可用性分析
        3.3.8 討論
    3.4 攻擊評(píng)估:有害內(nèi)容檢測(cè)
        3.4.1 數(shù)據(jù)集
        3.4.2 目標(biāo)模型及實(shí)現(xiàn)細(xì)節(jié)
        3.4.3 攻擊性能
        3.4.4 可用性分析
        3.4.5 討論
    3.5 深入分析
        3.5.1 對(duì)抗文本遷移性
        3.5.2 用戶研究
    3.6 潛在防御策略
    3.7 討論
    3.8 本章小結(jié)
第4章 基于模型決策的中文文本對(duì)抗攻擊
    4.1 引言
    4.2 攻擊設(shè)計(jì)
        4.2.1 問(wèn)題定義
        4.2.2 威脅模型
        4.2.3 CTBugger攻擊方法
    4.3 攻擊評(píng)估
        4.3.1 實(shí)驗(yàn)設(shè)置
        4.3.2 定性評(píng)估
        4.3.3 攻擊性能評(píng)估
        4.3.4 攻擊收斂性分析
    4.4 用戶研究
    4.5 本章小結(jié)
第5章 基于多模態(tài)詞嵌入和機(jī)器翻譯的對(duì)抗防御
    5.1 引言
    5.2 問(wèn)題定義及威脅模型
    5.3 TextShield防御框架
        5.3.1 TextShield防御概述
        5.3.2 對(duì)抗性機(jī)器翻譯
        5.3.3 多模態(tài)嵌入
        5.3.4 多模態(tài)融合
    5.4 實(shí)驗(yàn)設(shè)置與實(shí)現(xiàn)
        5.4.1 數(shù)據(jù)集
        5.4.2 目標(biāo)模型
        5.4.3 攻擊方法
        5.4.4 基線方法
        5.4.5 評(píng)估指標(biāo)
    5.5 防御評(píng)估
        5.5.1 模型性能評(píng)估
        5.5.2 有效性評(píng)估
        5.5.3 魯棒性評(píng)估
        5.5.4 與在線檢測(cè)平臺(tái)對(duì)比
    5.6 討論
    5.7 本章小結(jié)
第6章 總結(jié)與展望
    6.1 本文總結(jié)
    6.2 未來(lái)展望
參考文獻(xiàn)
攻讀碩士學(xué)位期間主要的研究成果
致謝


【參考文獻(xiàn)】:
期刊論文
[1]《2015中國(guó)智能語(yǔ)音產(chǎn)業(yè)發(fā)展白皮書(shū)》發(fā)布[J]. 武勤.  計(jì)算機(jī)與網(wǎng)絡(luò). 2016(08)



本文編號(hào):3650991

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/3650991.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶751e2***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com