天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 軟件論文 >

基于深度學(xué)習(xí)的實(shí)體鏈接方法

發(fā)布時(shí)間:2018-09-02 08:11
【摘要】:文本理解在自然語(yǔ)言處理和人工智能領(lǐng)域起著重要的作用,實(shí)體鏈接是幫助計(jì)算機(jī)理解文本的重要研究?jī)?nèi)容。實(shí)體鏈接指將一段文本中的實(shí)體指稱(chēng)抽取出來(lái),將這些實(shí)體指稱(chēng)消歧后映射到指定知識(shí)庫(kù)中的唯一實(shí)體上。實(shí)體鏈接能夠幫助計(jì)算機(jī)找到句子中的重要語(yǔ)義信息,判斷詞語(yǔ)在不同上下文語(yǔ)境中的不同含義,在幫助計(jì)算機(jī)理解自然語(yǔ)言中是不可或缺的。本文從兩個(gè)角度提出了實(shí)體鏈接方法,分別是基于百科網(wǎng)站屬性表的實(shí)體鏈接和基于純文本的實(shí)體鏈接。本文從人理解文本的角度出發(fā),從詞語(yǔ)理解到句子理解,闡述了分詞,詞向量表達(dá),文檔向量表達(dá),同義詞映射等基本的自然語(yǔ)言處理過(guò)程,并根據(jù)百度百科、互動(dòng)百科、中文維基百科構(gòu)建了一個(gè)基礎(chǔ)的中文知識(shí)庫(kù)。首先提出了一種基于機(jī)器學(xué)習(xí)的排序算法來(lái)處理屬性表格中的實(shí)體消歧問(wèn)題,旨在加強(qiáng)中文知識(shí)庫(kù)中實(shí)體的關(guān)聯(lián)性。然后提出了一種基于深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)的文本實(shí)體鏈接算法,從文本中抽取實(shí)體指稱(chēng)并尋找對(duì)應(yīng)的候選集實(shí)體,利用雙向長(zhǎng)短期網(wǎng)絡(luò)對(duì)實(shí)體指稱(chēng)以及實(shí)體指稱(chēng)的類(lèi)型建立模型,利用深度卷積神經(jīng)網(wǎng)絡(luò)對(duì)候選集實(shí)體以及實(shí)體類(lèi)型建立模型,來(lái)訓(xùn)練實(shí)體指稱(chēng)和候選集實(shí)體之間的相似度。最后我們利用文檔向量表達(dá)來(lái)補(bǔ)充實(shí)體指稱(chēng)和候選集實(shí)體的全局語(yǔ)義表達(dá),并利用圖模型算法進(jìn)行聯(lián)合消歧。我們將本論文提出的方法在中文和英文數(shù)據(jù)集上進(jìn)行了測(cè)試。在中文百度百科隨機(jī)內(nèi)鏈消歧中獲得了 81.07%的正確率,在TAC-KBP國(guó)際競(jìng)賽4年的數(shù)據(jù)集上分別獲得了最高的正確率,在GERBIL實(shí)體標(biāo)注平臺(tái)上與其他6種算法對(duì)比中獲得了最高的Macro F1為61.47%。最后本文還展示了算法在實(shí)際網(wǎng)站系統(tǒng)中的應(yīng)用。
[Abstract]:Text understanding plays an important role in the field of natural language processing and artificial intelligence. Entity link refers to extracting the entity reference from a text and mapping these entity references to the only entity in the specified knowledge base after disambiguation. The physical link can help the computer to find the important semantic information in the sentence, judge the different meaning of the words in different context, and is indispensable to help the computer understand the natural language. In this paper, an entity link method is proposed from two aspects, namely entity link based on property table of encyclopedic website and entity link based on pure text. In this paper, the basic natural language processing process, such as participle, word vector expression, document vector expression, synonym mapping and so on, is expounded from the perspective of human understanding of text, from word understanding to sentence understanding, and according to Baidu encyclopedia, interactive encyclopedia, etc. Chinese Wikipedia constructs a basic Chinese knowledge base. Firstly, a sort algorithm based on machine learning is proposed to deal with entity disambiguation in attribute tables, which aims to enhance the relevance of entities in Chinese knowledge base. Then, a text entity link algorithm based on deep learning neural network is proposed, in which entity reference is extracted from text and corresponding candidate set entity is found, and the model of entity reference and entity reference type is established by using bidirectional long and short term network. In order to train the similarity between entity reference and candidate set entity, the model of candidate set entity and entity type is established by using deep convolution neural network. Finally, we use document vector representation to supplement the global semantic representation of entity reference and candidate set entities, and combine disambiguation with graph model algorithm. We have tested the proposed method on Chinese and English datasets. The correct rate of 81.07% was obtained in the random chain disambiguation of Chinese Baidu encyclopedia, and the highest correct rate was obtained on the data set of the TAC-KBP International Competition for 4 years. Compared with other six algorithms, the highest Macro F1 is 61.47 on GERBIL entity tagging platform. Finally, this paper also shows the application of the algorithm in the actual website system.
【學(xué)位授予單位】:浙江大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2017
【分類(lèi)號(hào)】:TP391.1

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 馮山嶺;李海軍;張玉琴;王震;;二維零件圖與三維實(shí)體圖互生成方法探討[J];機(jī)械研究與應(yīng)用;2010年04期

2 陳斌;;結(jié)構(gòu)化實(shí)體圖——E-R方法的增強(qiáng)[J];計(jì)算機(jī)科學(xué);1986年06期

3 龐正剛;;在Auto CAD中繪制相交線的新方法[J];重慶工貿(mào)職業(yè)技術(shù)學(xué)院學(xué)報(bào);2006年02期

4 李灶福,李曉蘭,鄧小紅,包晨陽(yáng);關(guān)于Auto CAD中將三維實(shí)體圖轉(zhuǎn)換成平面三視圖的探討[J];機(jī)床與液壓;2003年03期

5 榮英;譚國(guó)萍;;CAD快速繪制組合體三維實(shí)體圖的方法和技巧[J];九江學(xué)院學(xué)報(bào)(自然科學(xué)版);2013年03期

6 J Miguel Gerlso;張勤勇;;TM——一適合CAD和所要求的數(shù)據(jù)庫(kù)功能的面向?qū)嶓w語(yǔ)言[J];國(guó)外導(dǎo)彈與航天運(yùn)載器;1989年08期

7 焦泉忠;;NX5實(shí)體圖與CAXA2007工程圖轉(zhuǎn)換[J];金屬加工(冷加工);2013年02期

8 范力軍;圖形變量化的實(shí)現(xiàn)技術(shù)[J];工程設(shè)計(jì)CAD與智能建筑;1999年11期

9 王斌;;CAD三維實(shí)體解決復(fù)雜形體看圖問(wèn)題[J];實(shí)驗(yàn)室科學(xué);2007年03期

10 楊長(zhǎng)青;;AutoCAD三維實(shí)體教學(xué)體會(huì)[J];科技信息;2010年32期

相關(guān)博士學(xué)位論文 前1條

1 吳建華;矢量空間數(shù)據(jù)實(shí)體匹配方法與應(yīng)用研究[D];武漢大學(xué);2008年

相關(guān)碩士學(xué)位論文 前7條

1 薛昊原;領(lǐng)域文本資源實(shí)體鏈接算法研究[D];鄭州大學(xué);2015年

2 羅念;基于維基百科的實(shí)體鏈接算法研究及系統(tǒng)實(shí)現(xiàn)[D];華東師范大學(xué);2016年

3 羅星;中文短文本實(shí)體識(shí)別和鏈接研究[D];華中師范大學(xué);2016年

4 陳韶剛;面向領(lǐng)域的Web實(shí)體擴(kuò)展及包裝器健壯性?xún)?yōu)化[D];沈陽(yáng)建筑大學(xué);2015年

5 朱燦;實(shí)體解析技術(shù)研究與應(yīng)用[D];上海交通大學(xué);2015年

6 何峰權(quán);基于屬性模式的實(shí)體識(shí)別框架[D];哈爾濱工業(yè)大學(xué);2013年

7 王瑋;從可比語(yǔ)料中抽取等價(jià)實(shí)體翻譯對(duì)的研究[D];哈爾濱工業(yè)大學(xué);2014年

,

本文編號(hào):2218775

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2218775.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶(hù)01fcf***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com