天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 軟件論文 >

特定領(lǐng)域?qū)嶓w屬性關(guān)系抽取方法研究

發(fā)布時間:2018-04-19 12:11

  本文選題:實體關(guān)系抽取 + Distant ; 參考:《昆明理工大學(xué)》2017年碩士論文


【摘要】:實體關(guān)系抽取是信息抽取的重要部分,它能夠識別出實體之間的語義關(guān)系,作為語義網(wǎng)的基礎(chǔ),實體關(guān)系抽取被廣泛應(yīng)用在自動問答系統(tǒng),信息檢索,機(jī)器翻譯等領(lǐng)域。關(guān)系抽取還是構(gòu)建知識圖譜的重要基礎(chǔ),隨著萬維網(wǎng)轉(zhuǎn)變成語義網(wǎng),知識圖譜的構(gòu)建變得尤為重要。領(lǐng)域?qū)嶓w間的屬性關(guān)系是構(gòu)建知識圖譜的重要組成部分之一。對特定領(lǐng)域而言,領(lǐng)域?qū)嶓w屬性關(guān)系對表達(dá)實體之間的語義關(guān)系有著重要的意義。本文主要針對中文領(lǐng)域的實體屬性關(guān)系抽取,作了以下工作:(1)基于Distant Supervision(距離監(jiān)督)的領(lǐng)域?qū)嶓w屬性關(guān)系抽取方法,基于領(lǐng)域知識庫和相關(guān)文本集來獲取實體屬性關(guān)系。關(guān)系類型為:景點-實例-屬性值。針對旅游領(lǐng)域中的“景點”這個類型,抽取出與“景點”這個類型相關(guān)屬性,如門票價格、面積等等。距離監(jiān)督就是通過將知識庫映射到文本集中實現(xiàn)關(guān)系抽取的過程,即如果一個實體對出現(xiàn)在知識庫中,則將文本集中包含這兩個實體的句子全部抽取出來,從這些句子中提取特征,訓(xùn)練分類器。本文首先構(gòu)建一個小型的中文旅游領(lǐng)域知識庫,在知識庫中預(yù)先定義好屬性關(guān)系和關(guān)系實例,并用這個知識庫對應(yīng)地從百度百科或維基百科網(wǎng)頁上爬取得到的文本集。本文使用多種特征以提高分類器的性能,提高分類的性能。(2)基于卷積神經(jīng)網(wǎng)絡(luò)的領(lǐng)域?qū)嶓w屬性關(guān)系抽取方法研究。本文提出基于卷積神經(jīng)網(wǎng)絡(luò)對領(lǐng)域?qū)嶓w屬性關(guān)系進(jìn)行抽取,其中屬性關(guān)系類型為實例-屬性、屬性-屬性值、實例-屬性值。利用卷積神經(jīng)網(wǎng)絡(luò)的自動學(xué)習(xí)表征領(lǐng)域?qū)嶓w屬性關(guān)系的句法特征、層級特征以及實體所在句子的文本特征,形成特征向量,加入到卷積神經(jīng)網(wǎng)絡(luò)中,訓(xùn)練實體屬性關(guān)系分類模型。實驗結(jié)果表明,所提出的方法能有效提高實體屬性關(guān)系抽取性能。
[Abstract]:Entity relation extraction is an important part of information extraction, it can identify the semantic relationship between entities. As the basis of semantic web, entity relation extraction is widely used in the fields of automatic question and answer system, information retrieval, machine translation and so on.Relationship extraction is also an important basis for building knowledge atlas. With the transformation of the World wide Web into the semantic Web, the construction of knowledge atlas becomes particularly important.Attribute relationship among domain entities is one of the important components of building knowledge map.For a specific domain, the attribute relation of domain entity is of great significance to express the semantic relationship between entities.In this paper, we focus on the extraction of entity attribute relation in Chinese domain. We do the following work: 1) the domain entity attribute relation extraction method based on Distant Supervision. the domain knowledge base and related text set are used to obtain entity attribute relationship.The relationship type is: scenic spot-instance-property value.Aiming at the "scenic spot" type in the tourism field, the properties related to the "scenic spot" type, such as ticket price, area and so on, are extracted.Distance monitoring is the process of relational extraction by mapping the knowledge base to the text set, that is, if an entity pair appears in the knowledge base, the sentences that contain the two entities in the text set are extracted out.Extract features from these sentences and train classifiers.This paper first constructs a small knowledge base of Chinese tourism domain, defines the attribute relation and relation instance in the knowledge base, and uses this knowledge base to crawl the text set from Baidu encyclopedia or Wikipedia page.In this paper, we use a variety of features to improve the performance of classifiers and improve the performance of classification.In this paper, a convolution neural network is proposed to extract the attribute relation of domain entity, in which the type of attribute relation is instance attribute, attribute attribute value and instance attribute value.Using the automatic learning of convolution neural network to represent the syntactic feature, hierarchical feature and text feature of the entity attribute relation in the domain, the feature vector is formed and added to the convolution neural network.Training entity attribute relationship classification model.Experimental results show that the proposed method can effectively improve the performance of entity attribute extraction.
【學(xué)位授予單位】:昆明理工大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2017
【分類號】:TP391.1

【參考文獻(xiàn)】

相關(guān)期刊論文 前10條

1 劉紹毓;李弼程;周杰;席耀一;唐浩浩;;基于主題模型的中文Distant Supervision噪聲標(biāo)注識別方法[J];信息工程大學(xué)學(xué)報;2016年03期

2 郭麗麗;丁世飛;;深度學(xué)習(xí)研究進(jìn)展[J];計算機(jī)科學(xué);2015年05期

3 歐陽丹彤;瞿劍峰;葉育鑫;;關(guān)系抽取中基于本體的遠(yuǎn)監(jiān)督樣本擴(kuò)充[J];軟件學(xué)報;2014年09期

4 吳嘉偉;關(guān)毅;呂新波;;基于深度學(xué)習(xí)的電子病歷中實體關(guān)系抽取[J];智能計算機(jī)與應(yīng)用;2014年03期

5 奚雪峰;周國棟;;基于Deep Learning的代詞指代消解[J];北京大學(xué)學(xué)報(自然科學(xué)版);2014年01期

6 劉建偉;劉媛;羅雄麟;;玻爾茲曼機(jī)研究進(jìn)展[J];計算機(jī)研究與發(fā)展;2014年01期

7 陳宇;鄭德權(quán);趙鐵軍;;基于Deep Belief Nets的中文名實體關(guān)系抽取[J];軟件學(xué)報;2012年10期

8 劉兵;錢龍華;徐華;周國棟;;依存信息在蛋白質(zhì)關(guān)系抽取中的作用[J];中文信息學(xué)報;2011年02期

9 雷春雅;郭劍毅;余正濤;毛存禮;張少敏;黃甫;;基于自擴(kuò)展與最大熵的領(lǐng)域?qū)嶓w關(guān)系自動抽取[J];山東大學(xué)學(xué)報(工學(xué)版);2010年05期

10 李小紅;錢龍華;;基于自舉的弱指導(dǎo)中文實體關(guān)系抽取研究[J];高科技與產(chǎn)業(yè)化;2010年09期

相關(guān)碩士學(xué)位論文 前5條

1 孫勇亮;開放領(lǐng)域的中文實體無監(jiān)督關(guān)系抽取[D];華東師范大學(xué);2014年

2 康琪;基于Bootstrapping的領(lǐng)域知識自動抽取技術(shù)的研究[D];山東大學(xué);2012年

3 王晶;無監(jiān)督的中文實體關(guān)系抽取研究[D];華東師范大學(xué);2012年

4 毛小麗;基于特征向量的實體間語義關(guān)系抽取研究[D];重慶大學(xué);2011年

5 徐超;基于種子自擴(kuò)展的命名實體關(guān)系抽取方法的研究[D];華中師范大學(xué);2006年

,

本文編號:1773048

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/1773048.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶f986d***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com