天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 計算機應(yīng)用論文 >

基于百科類語料的語義關(guān)系獲取研究

發(fā)布時間:2021-01-07 20:07
  信息抽取是自然語言處理中的一個重要分支,主要包括命名實體識別和語義關(guān)系獲取等任務(wù),是自然語言處理相關(guān)工作的基礎(chǔ)。實現(xiàn)信息抽取的傳統(tǒng)方式主要分為兩種,分別是基于規(guī)則的方法和基于統(tǒng)計的方法。其中基于規(guī)則的方法一般需要豐富的語言學(xué)知識,具有一定的局限性,而基于統(tǒng)計的方法雖然可以拜托對語言學(xué)知識的依賴,但是需要大量的人工標(biāo)注工作,實現(xiàn)難度較高。近年來,深度學(xué)習(xí)的方法被廣泛應(yīng)用在自然語言處理的各個領(lǐng)域中,深度學(xué)習(xí)不需要很強的語言學(xué)知識和大量的人工標(biāo)注特征就可以自學(xué)習(xí)樣本特征,在信息抽取領(lǐng)域取得的結(jié)果已經(jīng)超過了很多傳統(tǒng)方法。本文經(jīng)過對基于深度學(xué)習(xí)的信息抽取研究進行了深入的學(xué)習(xí)和研究后發(fā)現(xiàn),目前的信息抽取方法還存在以下兩點不足:(1)在命名實體識別過程中,一般只考慮每個字或詞的上下文信息,對句法信息的關(guān)注程度不高,通過研究句法信息來提升命名實體識別模型的性能的研究比較少。(2)在語義關(guān)系獲取的相關(guān)研究中,一般側(cè)重對句子整體的研究,很少關(guān)注到句子的局部特征,導(dǎo)致關(guān)系獲取的效果不理想。針對以上兩點不足,本文設(shè)計了基于句法分析和深度學(xué)習(xí)的命名實體識別模型和基于多層注意力機制和雙向LSTM網(wǎng)絡(luò)的語義關(guān)系獲取... 

【文章來源】:江蘇科技大學(xué)江蘇省

【文章頁數(shù)】:74 頁

【學(xué)位級別】:碩士

【文章目錄】:
摘要
Abstract
第1章 緒論
    1.1 研究背景和意義
    1.2 國內(nèi)外相關(guān)領(lǐng)域研究現(xiàn)狀
        1.2.1 國內(nèi)外命名實體識別研究現(xiàn)狀
        1.2.2 國內(nèi)外實體關(guān)系獲取研究現(xiàn)狀
    1.3 本文的主要工作
    1.4 本文的組織結(jié)構(gòu)安排
第2章 關(guān)鍵技術(shù)概述
    2.1 文本預(yù)處理
        2.1.1 中文分詞技術(shù)
        2.1.2 停用詞處理
    2.2 詞向量
        2.2.1 離散表示
        2.2.2 分布式表示
        2.2.3 Word2vec
    2.3 循環(huán)神經(jīng)網(wǎng)絡(luò)
        2.3.1 長短時記憶神經(jīng)網(wǎng)絡(luò)
        2.3.2 雙向長短時記憶神經(jīng)網(wǎng)絡(luò)
        2.3.3 門控循環(huán)單元
    2.4 注意力機制
        2.4.1 編碼-解碼模型
        2.4.2 注意力機制
    2.5 條件隨機場
        2.5.1 命名實體識別的標(biāo)簽體系
        2.5.2 條件隨機場
    2.6 本章小結(jié)
第3章 基于百科類語料的實體識別方法研究
    3.1 數(shù)據(jù)預(yù)處理
        3.1.1 數(shù)據(jù)源的選擇
        3.1.2 數(shù)據(jù)獲取方法
    3.2 句法分析
    3.3 基于句法分析與深度學(xué)習(xí)的實體識別模型
        3.3.1 詞向量層
        3.3.2 句法分析層
        3.3.3 雙向GRU層
        3.3.4 Softmax層
        3.3.5 CRF層
    3.4 實驗結(jié)果與分析
        3.4.1 實驗數(shù)據(jù)
        3.4.2 實驗指標(biāo)評價
        3.4.3 參數(shù)設(shè)置
        3.4.4 對比實驗分析
    3.5 本章小結(jié)
第4章 基于多層注意力機制的實體關(guān)系抽取方法研究
    4.1 融合特征的字向量表示
        4.1.1 字向量
        4.1.2 位置向量
    4.2 注意力機制
        4.2.1 字級注意力機制
        4.2.2 句級注意力機制
    4.3 結(jié)果分類
    4.4 基于多層注意力機制與雙向LSTM的關(guān)系獲取模型
    4.5 結(jié)果與分析
        4.5.1 實驗數(shù)據(jù)
        4.5.2 實驗指標(biāo)評價
        4.5.3 參數(shù)設(shè)置
        4.5.4 實驗結(jié)果分析
        4.5.5 對比試驗分析
    4.6 本章小結(jié)
第5章 總結(jié)與展望
參考文獻
攻讀學(xué)位期間發(fā)表的論文
致謝
中文詳細摘要


【參考文獻】:
期刊論文
[1]基于CRF與規(guī)則相結(jié)合的中文電子病歷命名實體識別研究[J]. 翟菊葉,陳春燕,張鈺,陳玉娥,劉玉文.  包頭醫(yī)學(xué)院學(xué)報. 2017(11)
[2]基于多通道卷積神經(jīng)網(wǎng)的實體關(guān)系抽取[J]. 肜博輝,付琨,黃宇,王洋.  計算機應(yīng)用研究. 2017(03)
[3]信息抽取研究綜述[J]. 郭喜躍,何婷婷.  計算機科學(xué). 2015(02)
[4]中文分詞與詞性標(biāo)注研究[J]. 梁喜濤,顧磊.  計算機技術(shù)與發(fā)展. 2015(02)
[5]基于樹核函數(shù)的實體語義關(guān)系抽取方法研究[J]. 莊成龍,錢龍華,周國棟.  中文信息學(xué)報. 2009(01)
[6]基于層疊隱馬爾可夫模型的中文命名實體識別[J]. 俞鴻魁,張華平,劉群,呂學(xué)強,施水才.  通信學(xué)報. 2006(02)
[7]實體關(guān)系自動抽取[J]. 車萬翔,劉挺,李生.  中文信息學(xué)報. 2005(02)

碩士論文
[1]基于深度學(xué)習(xí)的命名實體識別研究[D]. 霍振朗.華南理工大學(xué) 2018
[2]基于深度學(xué)習(xí)的中文微博人物關(guān)系圖譜的研究與實現(xiàn)[D]. 王超.武漢郵電科學(xué)研究院 2018
[3]面向《大詞林》的中文實體關(guān)系挖掘[D]. 劉燊.哈爾濱工業(yè)大學(xué) 2016
[4]基于深度學(xué)習(xí)的中文命名實體識別研究[D]. 王國昱.北京工業(yè)大學(xué) 2015



本文編號:2963162

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/2963162.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶1146c***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com