天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 軟件論文 >

歷史知識(shí)圖譜的實(shí)體關(guān)系挖掘方法

發(fā)布時(shí)間:2023-05-13 15:23
  隨著互聯(lián)網(wǎng)的不斷發(fā)展,互聯(lián)網(wǎng)中數(shù)據(jù)量也在不斷的增多。然而大部分?jǐn)?shù)據(jù)以文本的形式存儲(chǔ),如何有效的將數(shù)據(jù)從文本中抽取出來是一個(gè)十分重要問題。實(shí)體關(guān)系抽取作為信息抽取的關(guān)鍵組成部分,將非結(jié)構(gòu)的自然語言文本結(jié)構(gòu)化,是問答系統(tǒng)和知識(shí)圖譜等自然語言應(yīng)用的基礎(chǔ)。然而傳統(tǒng)關(guān)系抽取方法在訓(xùn)練前多需要人工標(biāo)注數(shù)據(jù)、選取特征并且定義關(guān)系類型需要專業(yè)領(lǐng)域的專家輔助,這樣消耗大量的人力和時(shí)間,所以如何以更少的代價(jià)獲取實(shí)體關(guān)系變的尤為重要。為解決以上問題,本文利用遠(yuǎn)程監(jiān)督、深度學(xué)習(xí)、自然語言處理等技術(shù)為歷史領(lǐng)域的實(shí)體關(guān)系挖掘設(shè)計(jì)了兩種算法。本文在研究歷史實(shí)體關(guān)系挖掘方法過程中,收集了百度百科、維基百科、課本及通用知識(shí)圖譜等資源作為歷史數(shù)據(jù)。在歷史領(lǐng)域關(guān)系挖掘研究中,還沒有出現(xiàn)關(guān)系類型覆蓋率較高的公開數(shù)據(jù)集,人工預(yù)定義關(guān)系類型會(huì)出現(xiàn)偏差和不全面的問題。針對(duì)此問題,本文提出了基于規(guī)則匹配的歷史實(shí)體關(guān)系抽取方法,提取非結(jié)構(gòu)文本中的關(guān)系指示詞,避免了人工預(yù)定義關(guān)系類型的問題。同時(shí)在模型中增加對(duì)歷史文本的特殊句法處理和Logictic回歸模型提高關(guān)系三元組抽取準(zhǔn)確率。在針對(duì)人工標(biāo)注數(shù)據(jù)代價(jià)高的問題上,利用遠(yuǎn)程監(jiān)督的方法自動(dòng)...

【文章頁數(shù)】:62 頁

【學(xué)位級(jí)別】:碩士

【文章目錄】:
摘要
ABSTRACT
第1章 緒論
    1.1 課題來源
    1.2 課題研究背景和意義
    1.3 國(guó)內(nèi)外研究現(xiàn)狀
        1.3.1 傳統(tǒng)的實(shí)體關(guān)系抽取方法
        1.3.2 基于深度學(xué)習(xí)的實(shí)體關(guān)系抽取方法
    1.4 本文的研究?jī)?nèi)容
    1.5 本文的章節(jié)結(jié)構(gòu)
第2章 數(shù)據(jù)集構(gòu)建與關(guān)系抽取技術(shù)概述
    2.1 引言
    2.2 歷史數(shù)據(jù)集構(gòu)建
        2.2.1 歷史數(shù)據(jù)統(tǒng)計(jì)
        2.2.2 遠(yuǎn)程監(jiān)督
        2.2.3 訓(xùn)練數(shù)據(jù)標(biāo)注
    2.3 自然語言處理技術(shù)
        2.3.1 中文分詞
        2.3.2 詞性標(biāo)注
        2.3.3 依存句法分析
    2.4 相關(guān)算法介紹
        2.4.1 卷積神經(jīng)網(wǎng)絡(luò)
        2.4.2 注意力機(jī)制
        2.4.3 Logistic回歸
    2.5 本章小結(jié)
第3章 基于規(guī)則匹配的歷史實(shí)體關(guān)系抽取
    3.1 引言
    3.2 候選關(guān)系實(shí)體擴(kuò)展
        3.2.1 候選實(shí)體擴(kuò)展
        3.2.2 候選關(guān)系指示詞擴(kuò)展
    3.3 關(guān)系元組抽取
        3.3.1 規(guī)則定義
        3.3.2 特殊句法處理
    3.4 候選關(guān)系元組過濾
    3.5 本章小結(jié)
第4章 基于SBAPCNNS的歷史實(shí)體關(guān)系抽取
    4.1 引言
    4.2 基于SDP的句內(nèi)噪音過濾
    4.3 詞向量
        4.3.1 詞本身與距離的融合詞向量
        4.3.2 BiGRU模型
    4.4 文本特征學(xué)習(xí)
        4.4.1 卷積層
        4.4.2 池化層
        4.4.3 Attention層
        4.4.4 Softmax層
    4.5 緩解過擬合現(xiàn)象
    4.6 本章小結(jié)
第5章 實(shí)驗(yàn)結(jié)果分析
    5.1 引言
    5.2 常見評(píng)價(jià)標(biāo)準(zhǔn)
    5.3 基于規(guī)則匹配的關(guān)系抽取實(shí)驗(yàn)分析
        5.3.1 實(shí)驗(yàn)對(duì)象和設(shè)計(jì)
        5.3.2 實(shí)驗(yàn)結(jié)果分析
    5.4 基于SBAPCNNs的關(guān)系抽取實(shí)驗(yàn)分析
        5.4.1 實(shí)驗(yàn)對(duì)象和設(shè)計(jì)
        5.4.2 實(shí)驗(yàn)結(jié)果分析
    5.5 本章小結(jié)
結(jié)論
參考文獻(xiàn)
致謝



本文編號(hào):3816089

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3816089.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶fe907***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com