天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

面向開(kāi)放式信息抽取系統(tǒng)的知識(shí)推理驗(yàn)證研究

發(fā)布時(shí)間:2021-06-26 13:53
  開(kāi)放式信息抽取系統(tǒng)是從web等非結(jié)構(gòu)化文本中挖掘知識(shí)的主要途徑,但是其抽取結(jié)果往往存在大量噪聲,對(duì)知識(shí)發(fā)現(xiàn)以及知識(shí)庫(kù)構(gòu)建產(chǎn)生較大影響。針對(duì)該問(wèn)題,本文提出一種基于概率軟邏輯模型的知識(shí)推理驗(yàn)證方法。該方法首先使用一階邏輯語(yǔ)言對(duì)知識(shí)抽取結(jié)果進(jìn)行轉(zhuǎn)化和推理,并且在推理過(guò)程中引入規(guī)則進(jìn)行語(yǔ)義約束。此外,為解決目前推理規(guī)則過(guò)于依賴于人工定制的問(wèn)題,本文建立一種推理規(guī)則自動(dòng)學(xué)習(xí)機(jī)制,解除傳統(tǒng)知識(shí)推理對(duì)于人工制定規(guī)則的依賴,實(shí)現(xiàn)對(duì)知識(shí)的全面自動(dòng)推理和驗(yàn)證。實(shí)驗(yàn)結(jié)果表明本文提出的推理模型較對(duì)比模型具有更優(yōu)的算法性能,提高了知識(shí)推理效率,對(duì)驗(yàn)證知識(shí)的語(yǔ)義規(guī)范性和正確性有積極作用。同時(shí),我們?cè)O(shè)計(jì)了三種策略來(lái)評(píng)價(jià)學(xué)習(xí)得到的規(guī)則質(zhì)量:第一種策略是與專家系統(tǒng)得出的規(guī)則作對(duì)比;第二種策略是將得到的規(guī)則放入推理模型進(jìn)行驗(yàn)證;為了證明規(guī)則學(xué)習(xí)模型得到的規(guī)則具有普遍適用性,我們?cè)O(shè)計(jì)第三種策略將規(guī)則學(xué)習(xí)方法放在兩個(gè)不同的數(shù)據(jù)集上進(jìn)行學(xué)習(xí),并且將得到的規(guī)則引入到Trans系列模型中試圖以此方式來(lái)提高其在知識(shí)驗(yàn)證方面的效果,并根據(jù)最后的推理效果作為評(píng)價(jià)規(guī)則的普遍適用性的重要依據(jù)。 

【文章來(lái)源】:西南科技大學(xué)四川省

【文章頁(yè)數(shù)】:60 頁(yè)

【學(xué)位級(jí)別】:碩士

【部分圖文】:

面向開(kāi)放式信息抽取系統(tǒng)的知識(shí)推理驗(yàn)證研究


TransE原理示意

原理圖,原理,向量,實(shí)體


西南科技大學(xué)碩士學(xué)位論文12Trans系列模型中TransE在知識(shí)表示學(xué)習(xí)中的特點(diǎn)就是簡(jiǎn)單且高效,但是它存在很多缺陷,例如在處理Inverse關(guān)系、一對(duì)多、多對(duì)一、多對(duì)多關(guān)系時(shí)存在極大不足。為了彌補(bǔ)TransE模型在這些方面的不足,2014年Wangetal.提出了transH模型,其核心思想是對(duì)每一個(gè)關(guān)系定義一個(gè)超平面Wr和一個(gè)關(guān)系向量dr。h,t是h,t在Wr上的投影,同時(shí)三元組關(guān)系還需滿足hr+dr=tr。這樣可以令同一實(shí)體在不同的關(guān)系中的意義不同,不同的實(shí)體在同一關(guān)系中的意義可以相同。圖2-2TransH原理示意對(duì)于正確的三元組(h,r,t),它需要滿足的關(guān)系如圖2-2所示。對(duì)于一個(gè)實(shí)體h’’如果滿足(h’’,r,t),在TransE模型中需要的是必須要令h’’=h,而在TransH模型中則只需要兩個(gè)頭實(shí)體向量在含義向量平面Wr的投影相同即可。實(shí)現(xiàn)了不同的實(shí)體在同一關(guān)系中的意義可以相同。但是由于Trans模型的向量轉(zhuǎn)化比較依賴于知識(shí)庫(kù)中的已有知識(shí),所以模型在知識(shí)的鏈接預(yù)測(cè)方面會(huì)有比較好的效果,但是假設(shè)知識(shí)庫(kù)中的知識(shí)錯(cuò)誤過(guò)多而且無(wú)法引入外部規(guī)則的情況下,模型的驗(yàn)證效果和鏈接預(yù)測(cè)效果會(huì)比較差。后續(xù)實(shí)驗(yàn)也證實(shí)了以上觀點(diǎn)。2.3本章小結(jié)本章主要介紹了目前知識(shí)推理的幾個(gè)熱點(diǎn)研究方向的主要原理,知識(shí)嵌入的方法旨在將實(shí)體和關(guān)系映射為空間中的向量,通過(guò)空間中向量的運(yùn)算來(lái)進(jìn)行知識(shí)推理,該方法取得了較好的準(zhǔn)確率,但是推理過(guò)程沒(méi)有規(guī)則的引入解釋性也不強(qiáng);诂F(xiàn)有的概率推理模型,進(jìn)一步研究如何更好地建模推理過(guò)程和提高推理效率將成為需要致力

分塊,數(shù)據(jù),元組,模型


后的兩條規(guī)則是兩個(gè)先驗(yàn),第一個(gè)是如果P1認(rèn)識(shí)P2那么P2也一定認(rèn)識(shí)P1這是一個(gè)很重要的先驗(yàn),并且它沒(méi)有權(quán)重,作為整個(gè)模型的一個(gè)最基本的規(guī)定。另外一條先驗(yàn)知識(shí)表示的是數(shù)據(jù)中任意兩個(gè)人互相不認(rèn)識(shí)的可能性是5。每一條規(guī)則的最后的平方是為了計(jì)算HingeLoss函數(shù)。給定了數(shù)據(jù)以及實(shí)體關(guān)系之間的規(guī)則接下來(lái)需要做的就是使用給定數(shù)據(jù)對(duì)模型進(jìn)行學(xué)習(xí),模型學(xué)習(xí)的整個(gè)過(guò)程可以理解為規(guī)則權(quán)重在訓(xùn)練數(shù)據(jù)中的調(diào)整過(guò)程。在模型學(xué)習(xí)完成之后就是對(duì)模型進(jìn)行評(píng)估,PSL的模型推理速度慢是一個(gè)比較大的問(wèn)題,對(duì)此PSL會(huì)對(duì)數(shù)據(jù)進(jìn)行分塊。圖3-7分塊后的數(shù)據(jù)如圖3-7所示,為了得到比較快速的學(xué)習(xí)和推理速度,PSL將數(shù)據(jù)劃分為觀察數(shù)據(jù)knows_obs即為實(shí)際數(shù)據(jù),其中包含的是實(shí)際存在的兩個(gè)人互相認(rèn)識(shí)的情況也就是規(guī)則頭中的Knows(P1,P2)這樣的關(guān)系元組,在這部分?jǐn)?shù)據(jù)中每個(gè)關(guān)系元組的權(quán)重都為1。knows_targets即為我們預(yù)測(cè)的人物之間是否相識(shí)的可能性。這也是最終模型的輸出,這部分?jǐn)?shù)據(jù)的主要內(nèi)容是每一個(gè)關(guān)系元組Knows(P1,P2)的權(quán)值。這部分的關(guān)系元組是已有的人物和關(guān)系的全部的組合方式。knows_truth即為對(duì)于所有人物之間互相認(rèn)識(shí)的實(shí)際情況,他們的權(quán)值非0即為1。是用來(lái)評(píng)估模型的性能的測(cè)試數(shù)據(jù)。PSL框架為模型提供了豐富的評(píng)價(jià)方法,包括Precision,F(xiàn)1,Recall以及AUC。3.3.3評(píng)測(cè)標(biāo)準(zhǔn)本文采用Recall、Precision、F1作為評(píng)價(jià)指標(biāo)作為實(shí)驗(yàn)的評(píng)測(cè)標(biāo)準(zhǔn),評(píng)價(jià)指標(biāo)如下

【參考文獻(xiàn)】:
期刊論文
[1]規(guī)則半自動(dòng)學(xué)習(xí)的概率軟邏輯推理模型[J]. 張嘉,張暉,趙旭劍,楊春明,李波.  計(jì)算機(jī)應(yīng)用. 2018(11)
[2]基于位置的知識(shí)圖譜鏈接預(yù)測(cè)[J]. 張寧豫,陳曦,陳矯彥,鄧淑敏,阮偉,吳春明,陳華鈞.  中文信息學(xué)報(bào). 2018(04)
[3]開(kāi)放式文本信息抽取[J]. 趙軍,劉康,周光有,蔡黎.  中文信息學(xué)報(bào). 2011(06)
[4]基于本地封閉世界假設(shè)的事務(wù)模型[J]. 張建英,林敏泓,王秀坤.  計(jì)算機(jī)工程. 2010(11)
[5]維基百科,全世界的百科全書(shū)——Jimmy Wales[J]. Orrin.  程序員. 2007(08)
[6]統(tǒng)計(jì)關(guān)系學(xué)習(xí)模型Markov邏輯網(wǎng)綜述[J]. 孫舒楊,劉大有,孫成敏,黃冠利.  計(jì)算機(jī)應(yīng)用研究. 2007(02)



本文編號(hào):3251465

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3251465.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶e6dd4***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com