天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 自動化論文 >

基于深度學(xué)習(xí)的中文信息抽取算法研究

發(fā)布時間:2022-10-08 22:08
  隨著信息時代的發(fā)展,大量信息以文本的形式存在于互聯(lián)網(wǎng);ヂ(lián)網(wǎng)的文本知識通常是以非結(jié)構(gòu)化的形式存儲在網(wǎng)頁之中,常規(guī)的規(guī)則抽取手段無法很好的抽取這些知識。因此如何使用自動化的方法從文本中抽取出關(guān)鍵信息便成了行業(yè)內(nèi)迫切需要解決的需求。信息抽取算法技術(shù)的主要目的是精準(zhǔn)、快速、高效的從非結(jié)構(gòu)化的自然語言文本中抽取出結(jié)構(gòu)化的信息,并以相應(yīng)預(yù)設(shè)定的格式進行保存,以供后續(xù)使用。三元組信息抽取的傳統(tǒng)研究思路包括基于規(guī)則抽取、機器學(xué)習(xí)抽取以及深度學(xué)習(xí)方式抽取等;谏疃葘W(xué)習(xí)的方式相比之前的研究方法在建模效果上具有很大的優(yōu)勢,而在深度學(xué)習(xí)方式中,使用流水線方式和聯(lián)合學(xué)習(xí)的方式存在實體對的指向、匹配問題,基于層次二分標(biāo)注的方式雖然有效的對實體對進行建模,但也會存在多建模步驟引起的錯誤傳播問題。本文為了解決多階段的預(yù)測問題,設(shè)計實現(xiàn)了有向圖結(jié)構(gòu)的一階段模型。此模型利用有向圖的鄰接矩陣來同時表達實體對的位置,以及實體詞之間的指向關(guān)系。同時本論文設(shè)計了多種構(gòu)建有向圖鄰接矩陣的模型,其中基于雙線性矩陣注意力模型能夠有效的利用注意力矩陣構(gòu)造有向圖的鄰接矩陣。本文在層次二分標(biāo)注模型的基礎(chǔ)上,探索了不同的范圍提取模型提取實... 

【文章頁數(shù)】:64 頁

【學(xué)位級別】:碩士

【文章目錄】:
摘要
ABSTRACT
第1章 緒論
    1.1 課題研究背景及研究意義
    1.2 國內(nèi)外研究現(xiàn)狀
    1.3 本文主要研究內(nèi)容
    1.4 研究創(chuàng)新點
    1.5 論文結(jié)構(gòu)安排
第2章 信息抽取理論與技術(shù)基礎(chǔ)
    2.1 引言
    2.2 基于流水線方法的信息抽取算法
    2.3 基于聯(lián)合學(xué)習(xí)的信息抽取算法
        2.3.1 基于標(biāo)注策略的聯(lián)合學(xué)習(xí)方法
        2.3.2 基于參數(shù)共享的聯(lián)合學(xué)習(xí)方法
    2.4 基于層次化二分標(biāo)注的信息抽取算法
    2.5 算法模型基礎(chǔ)
        2.5.1 Word2Vec模型
        2.5.2 FCN模型
        2.5.3 CNN模型
        2.5.4 RNN模型
        2.5.5 LSTM模型
        2.5.6 BERT模型
        2.5.7 BOE模型
        2.5.8 END模型
    2.6 本章小結(jié)
第3章 基于有向圖與層次化二分標(biāo)注的信息抽取模型構(gòu)建
    3.1 引言
    3.2 基于有向圖結(jié)構(gòu)的一階段信息抽取模型構(gòu)建
        3.2.1 算法思想與算法流程
        3.2.2 線性矩陣注意力模型解碼模型
        3.2.3 基于混合線性矩陣注意力解碼模型
        3.2.4 雙線性矩陣注意力解碼模型
    3.3 基于層次二分標(biāo)注二階段模型構(gòu)建
        3.3.1 算法思想與算法流程
        3.3.2 端點加法范圍提取模型
        3.3.3 基于混合端點加法范圍提取模型
        3.3.4 基于自注意力范圍提取模型
        3.3.5 解碼匹配
    3.4 基于層次二分標(biāo)注三階段模型構(gòu)建
        3.4.1 算法思想與算法流程
    3.5 本章小結(jié)
第4章 實驗結(jié)果及分析
    4.1 實驗數(shù)據(jù)
    4.2 實驗設(shè)計
        4.2.1 實驗參數(shù)設(shè)計
        4.2.2 f1-score指標(biāo)
        4.2.3 動態(tài)權(quán)重優(yōu)化方法
    4.3 實驗結(jié)果與分析
        4.3.1 不同矩陣注意力機制實驗結(jié)模
        4.3.2 不同字嵌入編碼能力實驗結(jié)果
        4.3.3 不同范圍提取模型主體實驗結(jié)果
        4.3.4 不同解碼器模型的序列建模能力
        4.3.5 不同實體關(guān)系分類模型實驗結(jié)果
    4.4 改進模型與現(xiàn)有方法對比
    4.5 三類模型橫向?qū)Ρ?br>    4.6 本章小節(jié)
結(jié)論
參考文獻
致謝


【參考文獻】:
期刊論文
[1]Word2vec的工作原理及應(yīng)用探究[J]. 周練.  科技情報開發(fā)與經(jīng)濟. 2015(02)
[2]基于條件隨機場的中醫(yī)臨床病歷命名實體抽取[J]. 劉凱,周雪忠,于劍,張潤順.  計算機工程. 2014(09)
[3]命名實體識別研究進展綜述[J]. 孫鎮(zhèn),王惠臨.  現(xiàn)代圖書情報技術(shù). 2010(06)



本文編號:3688516

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3688516.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶c2d30***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com