天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 自動化論文 >

面向自由文本的資源實體與關系抽取

發(fā)布時間:2021-11-23 05:31
  資源庫是計算機輔助創(chuàng)新系統(tǒng)中的一個重要庫,多年來一直通過人工抽取資源進行填充。資源庫的數(shù)據(jù)量對輔助創(chuàng)新具有重大價值和意義,所以如何從海量文本中自動高效地抽取資源受到關注和研究。以往對資源的抽取往往采用機器學習的方法,這類機器學習模型往往為淺層模型,特征的制定均圍繞兩個實體展開并且停留在詞匯表層。然而對于資源抽取,需要以整個句子的語義信息為基礎,所以獲取整個句子和其上下文之間的深層語義特征十分關鍵。因此,本文提出利用深度學習模型中的雙向長短時記憶網(wǎng)絡(Bidirectional Long Short Term Memory,BLSTM)對資源進行抽取,該模型具有挖掘文本深層語義信息和利用句子上下文信息等特點,能夠取得更好的實驗結果。所以,本文利用BLSTM提出了一種資源實體與關系抽取算法,目的是抽取自由文本中的資源所包括的物質、屬性、參數(shù)、量值四種實體以及四者之間的關系。該算法包括資源實體識別和資源關系抽取兩項子任務。在資源實體識別中,由于屬性和參數(shù)在句中語法位置相同,造成區(qū)分困難,所以先把屬性實體和參數(shù)實體看成一個實體,稱為屬-參實體,利用BLSTM構建實體識別模型,并在模型中引入維特... 

【文章來源】:河北工業(yè)大學天津市 211工程院校

【文章頁數(shù)】:60 頁

【學位級別】:碩士

【部分圖文】:

面向自由文本的資源實體與關系抽取


部分實驗結果

維度,向量,均值,參數(shù)


河北工業(yè)大學碩士學位論文-23-表3.5訓練集、驗證集、測試集中句子及命名實體數(shù)量句子數(shù)物質實體屬性參數(shù)實體量值實體訓練集1500124430415142驗證集5004817661536測試集50253963412433.4.2不同參數(shù)下的實驗分析本節(jié)根據(jù)前面提出的基于BLSTM的實體識別模型,在實驗語料上進行訓練和測試,通過調整模型各參數(shù)進行實驗,并且將實驗結果進行對比分析。實驗使用Python的Theano庫完成基于BLSTM的實體識別模型的搭建,該庫支持各種高度抽象的數(shù)學運算,無需手動求導,并且資源十分豐富,所以近幾年在數(shù)學計算領域,尤其是深度學習領域theano的使用越來越多。針對模型參數(shù)復雜的問題,本文做了大量的對比實驗,以分析各個參數(shù)對模型的標注結果產生的影響,之所以對不同參數(shù)進行實驗的分析,是由于深度神經(jīng)網(wǎng)絡模型的復雜性,至今為止各個參數(shù)如何確定都沒有找到一個很好的解析式,參數(shù)的確定往往都根據(jù)自己的實驗來確定。本實驗討論的參數(shù)有:embedding向量維度、學習率、隱藏層單元數(shù)量以及dropout值[52]。所以本文對這四種參數(shù)分別進行實驗,四種參數(shù)初始值分別為:embedding向量維度為200,學習率為0.01,隱藏層單元數(shù)量為200,Dropout值為0.1,實驗結果如圖3.5-圖3.8所示,其中均值F為四種命名實體F1值的均值。圖3.5不同的embedding向量維度對均值F的影響

學習率,均值,向量,維度


面向自由文本的資源實體與關系抽取-24-從圖3.5中可以看出,隨著embedding向量維度的增加,均值F1也在增加,并且當embedding向量維度等于200的時候達到峰值。這說明embedding向量維度并不是越大越好,而是存在一個局部最優(yōu)值,這個值可能與輸入、輸出的單元數(shù)量有關,也可能與詞典大小有關,因為每個詞的embedding向量表示都不同,所以詞典越大,則用以表示句子的完整語義的embedding向量維度應該也越高。圖3.6不同的學習率對均值F的影響學習率是深度學習模型中非常重要的一個參數(shù),決定了參數(shù)移動到最優(yōu)值速度快慢。學習率設置的太大,可能就會使參數(shù)直接跳過最優(yōu)值,相反,就會造成長時間無法收斂到最優(yōu)值。從圖3.6中可以看出,學習率值越高,實體識別結果越不好,四組實驗中,當學習率為0.005時為,實驗結果最優(yōu)。圖3.7不同的隱藏層單元數(shù)量對均值F的影響


本文編號:3513226

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3513226.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶a3a06***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com