天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 軟件論文 >

基于跨語言遷移的無監(jiān)督命名實(shí)體識別研究

發(fā)布時(shí)間:2021-11-27 06:44
  命名實(shí)體作為自然語言文本的關(guān)鍵語義信息,其識別與分類是目前自然語言處理研究中的重要研究內(nèi)容。隨著深度學(xué)習(xí)技術(shù)在多數(shù)語言處理任務(wù)上的普遍應(yīng)用,基于深度神經(jīng)網(wǎng)絡(luò)的命名實(shí)體識別模型已經(jīng)取得了較好的性能。而深度神經(jīng)網(wǎng)絡(luò)模型的成功往往依賴于規(guī)模較大的標(biāo)注數(shù)據(jù)。對于使用人數(shù)較多且語料資源豐富的語言而言,獲取相應(yīng)的手工標(biāo)注數(shù)據(jù)可能相對容易。然而,對于大多數(shù)的低資源語言而言,其用于該任務(wù)的人工標(biāo)注數(shù)據(jù)規(guī)模往往較小,甚至可能不存在,且在這些語言上進(jìn)行人工標(biāo)注也顯得較為困難。針對低資源語言上缺少命名實(shí)體識別標(biāo)注數(shù)據(jù)的現(xiàn)狀,本文的研究主要圍繞如何充分地利用資源豐富語言上的手工標(biāo)注數(shù)據(jù),通過跨語言遷移將其遷移到資源稀缺語言上,從而完成低資源語言上的命名實(shí)體識別任務(wù)。本文主要針對資源稀缺語言的命名實(shí)體識別任務(wù)中的無監(jiān)督應(yīng)用場景,即語言中不存在任何該任務(wù)的手工標(biāo)注數(shù)據(jù)的情況。圍繞該極端應(yīng)用場景,本文的研究主要包含以下三個(gè)方面。(1)研究跨語言投影的無監(jiān)督命名實(shí)體識別方法。針對低資源語言不存在任何標(biāo)注數(shù)據(jù)的情況,對于如何利用資源豐富語言上的標(biāo)注數(shù)據(jù),本文通過兩種不同的跨語言投影標(biāo)注方法將高資源語言上的人工標(biāo)注數(shù)據(jù)遷... 

【文章來源】:哈爾濱工業(yè)大學(xué)黑龍江省 211工程院校 985工程院校

【文章頁數(shù)】:67 頁

【學(xué)位級別】:碩士

【文章目錄】:
摘要
Abstract
第1章 緒論
    1.1 課題背景
    1.2 研究的目的與意義
    1.3 研究現(xiàn)狀
        1.3.1 命名實(shí)體識別研究現(xiàn)狀
        1.3.2 跨語言遷移研究現(xiàn)狀
    1.4 論文主要研究內(nèi)容
    1.5 論文組織結(jié)構(gòu)
第2章 基于投影的跨語言無監(jiān)督命名實(shí)體識別
    2.1 基于詞對齊的跨語言命名實(shí)體識別方法
        2.1.1 雙語詞對齊
        2.1.2 基于詞對齊的實(shí)體標(biāo)簽投影
    2.2 基于跨語言詞向量的跨語言命名實(shí)體識別
        2.2.1 跨語言詞向量
        2.2.2 基于跨語言詞向量的實(shí)體標(biāo)簽映射
    2.3 融合注意力機(jī)制的神經(jīng)網(wǎng)絡(luò)命名實(shí)體識別模型
        2.3.1 基于神經(jīng)網(wǎng)絡(luò)的端到端命名實(shí)體識別模型
        2.3.2 融合注意力機(jī)制的神經(jīng)命名實(shí)體識別模型
    2.4 實(shí)驗(yàn)結(jié)果與分析
        2.4.1 實(shí)驗(yàn)數(shù)據(jù)
        2.4.2 評價(jià)指標(biāo)
        2.4.3 實(shí)驗(yàn)設(shè)置
        2.4.4 實(shí)驗(yàn)結(jié)果與分析
    2.5 本章小結(jié)
第3章 基于遷移學(xué)習(xí)的無監(jiān)督命名實(shí)體識別方法
    3.1 面向命名實(shí)體識別的跨語言遷移學(xué)習(xí)模型
    3.2 基于遷移模型后驗(yàn)正則的無監(jiān)督命名實(shí)體識別方法
        3.2.1 后驗(yàn)正則
        3.2.2 遷移模型作為后驗(yàn)正則的無監(jiān)督命名實(shí)體識別方法
    3.3 命名實(shí)體識別與遷移學(xué)習(xí)的聯(lián)合訓(xùn)練框架
        3.3.1 聯(lián)合訓(xùn)練框架
        3.3.2 基于EM迭代的訓(xùn)練算法
    3.4 實(shí)驗(yàn)結(jié)果與分析
        3.4.1 實(shí)驗(yàn)數(shù)據(jù)
        3.4.2 實(shí)驗(yàn)設(shè)置
        3.4.3 實(shí)驗(yàn)結(jié)果與分析
        3.4.4 實(shí)例分析
    3.5 本章小結(jié)
第4章 基于雙語數(shù)據(jù)的跨語言無監(jiān)督命名實(shí)體識別
    4.1 基于雙語數(shù)據(jù)的命名實(shí)體識別
        4.1.1 雙語資源在自然語言處理中的應(yīng)用
        4.1.2 基于雙語數(shù)據(jù)的無監(jiān)督命名實(shí)體識別方法
    4.2 基于詞對齊的雙語無監(jiān)督數(shù)據(jù)過濾
    4.3 融合雙語數(shù)據(jù)的無監(jiān)督命名實(shí)體識別模型的訓(xùn)練
    4.4 實(shí)驗(yàn)結(jié)果與分析
        4.4.1 實(shí)驗(yàn)數(shù)據(jù)
        4.4.2 實(shí)驗(yàn)設(shè)置
        4.4.3 實(shí)驗(yàn)結(jié)果與分析
        4.4.4 實(shí)例分析
    4.5 本章小結(jié)
結(jié)論
參考文獻(xiàn)
攻讀碩士學(xué)位期間發(fā)表的論文及其他成果
致謝



本文編號:3521754

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3521754.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶c4ace***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com