天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 軟件論文 >

基于注意力機制的開放域?qū)嶓w關(guān)系抽取

發(fā)布時間:2021-01-15 12:04
  大詞林是一個有自動構(gòu)建能力的網(wǎng)狀知識圖譜,所謂的網(wǎng)狀結(jié)構(gòu),是指知識的橫向性與縱向性。實體之間的關(guān)系、一個上位詞的同義詞都屬于橫向上的關(guān)系,而實體與上位詞的關(guān)系、上位詞之間的層次關(guān)系,都屬于縱向上的關(guān)系。本課題主要為大詞林提供輔助,旨在為大詞林提供穩(wěn)定的橫向關(guān)系補充,即實體間關(guān)系的補充。1.針對大詞林中縱向關(guān)系中實體與橫向關(guān)系中實體不統(tǒng)一的問題,即實體路徑消歧,本文首先提出基于詞向量相似度計算的方法,將實體路徑信息與實體義項對應(yīng),將實體路徑信息與實體義項當(dāng)做兩個字符串,利用騰訊提供的詞向量計算余弦相似度。該方法對于語義特征較為明顯的情況處理效果較好。但在中文中,有很多詞是具有對立含義的,為了挖掘文本背后的“對立”關(guān)聯(lián),本文引進(jìn)了基于深度學(xué)習(xí)的實體路徑消歧,包括ELMO模型與Bert模型,并對兩類模型結(jié)果進(jìn)行了分析。2.在開放域關(guān)系抽取任務(wù)中,針對中文領(lǐng)域關(guān)系抽取任務(wù)缺少語料的問題,本文提出了一種基于啟發(fā)式規(guī)則的關(guān)系抽取方法,采用4類啟發(fā)式規(guī)則模板并輔以搜索引擎結(jié)果計算置信度,得到初步實驗效果,并為有監(jiān)督方法提供語料。隨后,針對開放域關(guān)系抽取難度大的特點,本文引入了端到端的關(guān)系抽取方法,以... 

【文章來源】:哈爾濱工業(yè)大學(xué)黑龍江省 211工程院校 985工程院校

【文章頁數(shù)】:64 頁

【學(xué)位級別】:碩士

【部分圖文】:

基于注意力機制的開放域?qū)嶓w關(guān)系抽取


課題研究流程

上位詞,蘋果,實體


- 3 -圖 1-2 實體“蘋果”的上位詞結(jié)構(gòu)果”的上位詞有“水果”,“公司”,“科技產(chǎn)品”等,“水果不是一個領(lǐng)域的事物,這說明,在上下位關(guān)系中,實體的,“蘋果”既可能是一種“水果”,也可能是某個“公關(guān)系中存儲的實體實際上是未消歧的實體。實體應(yīng)該擁有明確的概念,并且這種明確的概念能夠使需要細(xì)粒度語義級別的應(yīng)用。本文從網(wǎng)絡(luò)中自動采集了圖 1-3 即展示了大詞林中實體“蘋果”的不同義項。

蘋果,實體,義項,路徑


圖 1-3 實體“蘋果”的不同義項 1-3 可以看出,實體“蘋果”是具有不同義項的,且每個義項有不性)。例如在“蘋果(薔薇科蘋果屬果實)”義項中擁有關(guān)系“食用價關(guān)系是不可能在“蘋果(蘋果產(chǎn)品公司)”中出現(xiàn)的,同理,“蘋果)”擁有的“創(chuàng)始人”關(guān)系也不會出現(xiàn)在別的不同領(lǐng)域的義項中。路徑消歧,指的是把大詞林中實體的某條路徑,對應(yīng)到實體的某例如對于路徑“蘋果->公司->機構(gòu)->抽象事物”和實體義項“蘋司)”及“蘋果(薔薇科蘋果屬果實)”,應(yīng)把路徑對應(yīng)到“蘋果(蘋果?衫玫男畔閷嶓w路徑信息與實體義項信息,本質(zhì)上,路徑信息若與某個實體義項信息相近,則該實體義項應(yīng)為路徑所對應(yīng)該任務(wù)與文本相似度計算任務(wù)很像。因此可利用文本相似度計算解決大詞林實體路徑消歧。相似度計算一直是學(xué)者們研究的熱點,先后被提出來的方法包括字面匹配的方法,基于統(tǒng)計的經(jīng)驗主義方法,基于規(guī)則的理性主

【參考文獻(xiàn)】:
期刊論文
[1]文本相似度計算研究進(jìn)展綜述[J]. 王寒茹,張仰森.  北京信息科技大學(xué)學(xué)報(自然科學(xué)版). 2019(01)
[2]實體鏈接研究綜述[J]. 陸偉,武川.  情報學(xué)報. 2015 (01)
[3]神經(jīng)網(wǎng)絡(luò)與組合語義在文本相似度中的應(yīng)用[J]. 肖和,付麗娜,姬東鴻.  計算機工程與應(yīng)用. 2016(07)
[4]語義分析與詞頻統(tǒng)計相結(jié)合的中文文本相似度量方法研究[J]. 華秀麗,朱巧明,李培峰.  計算機應(yīng)用研究. 2012(03)
[5]基于核函數(shù)中文關(guān)系自動抽取系統(tǒng)的實現(xiàn)[J]. 劉克彬,李芳,劉磊,韓穎.  計算機研究與發(fā)展. 2007(08)
[6]一種新的句子相似度度量及其在文本自動摘要中的應(yīng)用[J]. 張奇,黃萱菁,吳立德.  中文信息學(xué)報. 2005(02)



本文編號:2978839

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2978839.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶c7810***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com