天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 軟件論文 >

基于Freebase的英文命名實體識別鏈接的研究與實現(xiàn)

發(fā)布時間:2021-04-24 11:01
  隨著互聯(lián)網(wǎng)的不斷發(fā)展,人們利用網(wǎng)絡(luò)進行多種多樣的溝通交流,網(wǎng)絡(luò)上也出現(xiàn)越來越多的新聞、百科等非結(jié)構(gòu)化的文本。對這些信息的處理和挖掘能夠幫助人們更好的理解文本內(nèi)容,掌握有價值的信息,加強人們之間有效的交流。命名實體識別和實體鏈接作為處理文本中實體相關(guān)的技術(shù)也因此受到國內(nèi)外研究學者越來越廣泛的關(guān)注。命名實體識別是識別文本中出現(xiàn)的人名、機構(gòu)名、地名以及時間等特殊名詞的一項任務(wù)。實體鏈接則是將這些文本中的實體鏈接到知識庫中一個無歧義實體的過程。實體對文本內(nèi)容的理解有很大的幫助,對信息抽取、自動問答、機器翻譯等任務(wù)也有著重要作用。近年來,大規(guī)模知識庫在自然語言處理中不斷得到應(yīng)用,知識圖譜相關(guān)技術(shù)迅速發(fā)展,命名實體識別和實體鏈接技術(shù)作為構(gòu)建和應(yīng)用知識圖譜的關(guān)鍵技術(shù)之一也得到不斷發(fā)展。目前該任務(wù)面臨的主要問題是文本中存在的實體具有多樣性和歧義性。一個指稱可以代表多個存在的實體,而一個實體也可以同時擁有多個名稱。為了克服實體多樣性和歧義性給命名實體識別和實體鏈接任務(wù)帶來的困難,提出基于雙向長短期記憶網(wǎng)絡(luò)與條件隨機場的命名實體識別方法和基于Freebase知識庫的神經(jīng)網(wǎng)絡(luò)實體鏈接方法用于從指稱的候選實體... 

【文章來源】:北京郵電大學北京市 211工程院校 教育部直屬院校

【文章頁數(shù)】:62 頁

【學位級別】:碩士

【文章目錄】:
摘要
ABSTRACT
第一章 緒論
    1.1 研究背景和意義
    1.2 研究現(xiàn)狀
        1.2.1 命名實體識別
        1.2.2 實體鏈接
    1.3 本文工作和研究成果
    1.4 本文組織結(jié)構(gòu)
第二章 相關(guān)工作
    2.1 知識圖譜
        2.1.1 相關(guān)知識庫
        2.1.2 知識圖譜及其應(yīng)用
    2.2 深度學習
        2.2.1 Word2Vec詞向量
        2.2.2 循環(huán)神經(jīng)網(wǎng)絡(luò)
        2.2.3 長短期記憶網(wǎng)絡(luò)
        2.2.4 結(jié)構(gòu)化自注意力機制
        2.2.5 多頭注意力機制
        2.2.6 記憶網(wǎng)絡(luò)
第三章 基于Freebase的命名實體識別和實體鏈接方法
    3.1 預(yù)處理
    3.2 指稱識別
    3.3 候選實體生成
    3.4 實體選擇
        3.4.1 文本編碼
        3.4.2 序列注意
        3.4.3 記憶交互
        3.4.4 相似度比較
    3.5 指稱聚類
第四章 英文實體識別與鏈接系統(tǒng)的設(shè)計與實現(xiàn)
    4.1 系統(tǒng)設(shè)計
    4.2 模塊介紹
        4.2.1 預(yù)處理模塊
        4.2.2 指稱識別模塊
        4.2.3 候選實體生成模塊
        4.2.4 實體選擇模塊
        4.2.5 指稱聚類模塊
第五章 實驗
    5.1 實驗數(shù)據(jù)
    5.2 實驗評價指標
    5.3 實驗設(shè)置
    5.4 實驗結(jié)果及分析
        5.4.1 命名實體識別實驗結(jié)果
        5.4.2 實體鏈接實驗結(jié)果
        5.4.3 命名實體識別結(jié)果分析
        5.4.4 結(jié)構(gòu)化自注意力機制分析
        5.4.5 記憶網(wǎng)絡(luò)分析
        5.4.6 相似度計算方法分析
        5.4.7 懲罰項分析
第六章 總結(jié)與展望
    6.1 工作總結(jié)
    6.2 工作展望
參考文獻
致謝
攻讀學位期間發(fā)表的學術(shù)論文目錄


【參考文獻】:
期刊論文
[1]基于主題敏感的重啟隨機游走實體鏈接方法[J]. 李茂林.  北京大學學報(自然科學版). 2016(01)
[2]信息抽取研究綜述[J]. 郭喜躍,何婷婷.  計算機科學. 2015(02)



本文編號:3157245

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3157245.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶46b2e***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com