天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 軟件論文 >

基于跨語言遷移的無監(jiān)督命名實體識別研究

發(fā)布時間:2021-11-27 06:44
  命名實體作為自然語言文本的關(guān)鍵語義信息,其識別與分類是目前自然語言處理研究中的重要研究內(nèi)容。隨著深度學習技術(shù)在多數(shù)語言處理任務(wù)上的普遍應用,基于深度神經(jīng)網(wǎng)絡(luò)的命名實體識別模型已經(jīng)取得了較好的性能。而深度神經(jīng)網(wǎng)絡(luò)模型的成功往往依賴于規(guī)模較大的標注數(shù)據(jù)。對于使用人數(shù)較多且語料資源豐富的語言而言,獲取相應的手工標注數(shù)據(jù)可能相對容易。然而,對于大多數(shù)的低資源語言而言,其用于該任務(wù)的人工標注數(shù)據(jù)規(guī)模往往較小,甚至可能不存在,且在這些語言上進行人工標注也顯得較為困難。針對低資源語言上缺少命名實體識別標注數(shù)據(jù)的現(xiàn)狀,本文的研究主要圍繞如何充分地利用資源豐富語言上的手工標注數(shù)據(jù),通過跨語言遷移將其遷移到資源稀缺語言上,從而完成低資源語言上的命名實體識別任務(wù)。本文主要針對資源稀缺語言的命名實體識別任務(wù)中的無監(jiān)督應用場景,即語言中不存在任何該任務(wù)的手工標注數(shù)據(jù)的情況。圍繞該極端應用場景,本文的研究主要包含以下三個方面。(1)研究跨語言投影的無監(jiān)督命名實體識別方法。針對低資源語言不存在任何標注數(shù)據(jù)的情況,對于如何利用資源豐富語言上的標注數(shù)據(jù),本文通過兩種不同的跨語言投影標注方法將高資源語言上的人工標注數(shù)據(jù)遷... 

【文章來源】:哈爾濱工業(yè)大學黑龍江省 211工程院校 985工程院校

【文章頁數(shù)】:67 頁

【學位級別】:碩士

【文章目錄】:
摘要
Abstract
第1章 緒論
    1.1 課題背景
    1.2 研究的目的與意義
    1.3 研究現(xiàn)狀
        1.3.1 命名實體識別研究現(xiàn)狀
        1.3.2 跨語言遷移研究現(xiàn)狀
    1.4 論文主要研究內(nèi)容
    1.5 論文組織結(jié)構(gòu)
第2章 基于投影的跨語言無監(jiān)督命名實體識別
    2.1 基于詞對齊的跨語言命名實體識別方法
        2.1.1 雙語詞對齊
        2.1.2 基于詞對齊的實體標簽投影
    2.2 基于跨語言詞向量的跨語言命名實體識別
        2.2.1 跨語言詞向量
        2.2.2 基于跨語言詞向量的實體標簽映射
    2.3 融合注意力機制的神經(jīng)網(wǎng)絡(luò)命名實體識別模型
        2.3.1 基于神經(jīng)網(wǎng)絡(luò)的端到端命名實體識別模型
        2.3.2 融合注意力機制的神經(jīng)命名實體識別模型
    2.4 實驗結(jié)果與分析
        2.4.1 實驗數(shù)據(jù)
        2.4.2 評價指標
        2.4.3 實驗設(shè)置
        2.4.4 實驗結(jié)果與分析
    2.5 本章小結(jié)
第3章 基于遷移學習的無監(jiān)督命名實體識別方法
    3.1 面向命名實體識別的跨語言遷移學習模型
    3.2 基于遷移模型后驗正則的無監(jiān)督命名實體識別方法
        3.2.1 后驗正則
        3.2.2 遷移模型作為后驗正則的無監(jiān)督命名實體識別方法
    3.3 命名實體識別與遷移學習的聯(lián)合訓練框架
        3.3.1 聯(lián)合訓練框架
        3.3.2 基于EM迭代的訓練算法
    3.4 實驗結(jié)果與分析
        3.4.1 實驗數(shù)據(jù)
        3.4.2 實驗設(shè)置
        3.4.3 實驗結(jié)果與分析
        3.4.4 實例分析
    3.5 本章小結(jié)
第4章 基于雙語數(shù)據(jù)的跨語言無監(jiān)督命名實體識別
    4.1 基于雙語數(shù)據(jù)的命名實體識別
        4.1.1 雙語資源在自然語言處理中的應用
        4.1.2 基于雙語數(shù)據(jù)的無監(jiān)督命名實體識別方法
    4.2 基于詞對齊的雙語無監(jiān)督數(shù)據(jù)過濾
    4.3 融合雙語數(shù)據(jù)的無監(jiān)督命名實體識別模型的訓練
    4.4 實驗結(jié)果與分析
        4.4.1 實驗數(shù)據(jù)
        4.4.2 實驗設(shè)置
        4.4.3 實驗結(jié)果與分析
        4.4.4 實例分析
    4.5 本章小結(jié)
結(jié)論
參考文獻
攻讀碩士學位期間發(fā)表的論文及其他成果
致謝



本文編號:3521754

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3521754.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶c4ace***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com