天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 搜索引擎論文 >

基于維基百科的人物關(guān)系抽取研究

發(fā)布時間:2018-11-04 18:53
【摘要】:在信息抽取研究工作中,人物關(guān)系抽取是一個重要的研究課題。針對人物關(guān)系抽取的研究工作興起于MUC會議的評測項目,后來由ACE會議取代。目前,大部分的中文人物關(guān)系研究工作所用語料,大都是來自ACE會議的結(jié)構(gòu)化評測語料或者人民日報等較為規(guī)范的新聞?wù)Z料。但在現(xiàn)實應(yīng)用中,特別是在互聯(lián)網(wǎng)時代,人們越來越習(xí)慣從互聯(lián)網(wǎng)中檢索想要了解的人物、事件等信息,維基百科就是其中一個常用的搜索引擎。維基百科是一個開放的知識庫,它包含了豐富的人物關(guān)系信息,同時,它也是一個較符合網(wǎng)絡(luò)文本半結(jié)構(gòu)化特點的知識庫。因此,基于維基百科的人物關(guān)系抽取與實際生活中的人物關(guān)系抽取更為相似。人物關(guān)系抽取的主要思想是將其轉(zhuǎn)化為人物關(guān)系分類問題。傳統(tǒng)的抽取方法主要分為基于知識庫、基于機器學(xué)習(xí)和基于模式匹配。在基于機器學(xué)習(xí)的方法中又主要分基于核與基于特征向量的分類方法。在人物關(guān)系抽取的過程中的兩個主要難點是人名識別和人物關(guān)系識別。針對上述難點,本文提出了相應(yīng)的解決辦法,具有以下創(chuàng)新點:(1)為解決現(xiàn)有分詞工具在人名識別中存在的外文音譯人名識別率不高的問題,本文采用抽取維基百科中信息盒數(shù)據(jù)的方法,構(gòu)建了基于中文維基百科的人物庫;同時利用維基百科中的Link數(shù)據(jù)構(gòu)建了基于中文維基百科的外文音譯人名詞典;(2)本文提出采取模式匹配與特征向量方法融合的層次分類方法進行人物關(guān)系分類,利用DAG-SVMs多值分類方法解決人物關(guān)系分類中的多值分類問題,以提高分類模型執(zhí)行速度與性能,同時在人物關(guān)系的劃分中引入本人關(guān)系,以減輕維基百科中存在的“同人不同名”的現(xiàn)象;并通過實驗驗證了此方法的可行性。本文利用提出的方法構(gòu)建了一個規(guī)模可觀的維基百科人物庫與人名詞典。同時經(jīng)過實驗驗證,本文在人物關(guān)系識別方面,特別是本人關(guān)系與家庭關(guān)系的相關(guān)分類中性能較好。
[Abstract]:In the research of information extraction, personal-relation extraction is an important research topic. The research on personal-relationship extraction originated from the evaluation project of MUC conference and was replaced by ACE conference. At present, most of the data used in the study of Chinese character relations are structured evaluation materials from ACE conferences or more standardized news materials such as People's Daily. However, in practical applications, especially in the Internet era, people are more and more used to retrieve information from the Internet, such as people, events and so on. Wikipedia is one of the commonly used search engines. Wikipedia is an open knowledge base, which contains a wealth of personal-relationship information. At the same time, it is also a knowledge base which accords with the semi-structured features of network text. Therefore, Wikipedia-based personal-relationship extraction is more similar to real-life personal-relationship extraction. The main idea of personal-relationship extraction is to transform it into personal-relationship classification. The traditional extraction methods are mainly based on knowledge base, machine learning and pattern matching. The methods based on machine learning are mainly classified based on kernel and feature vector. In the process of personal-relationship extraction, the two main difficulties are human name recognition and personal-relationship recognition. In view of the above difficulties, this paper puts forward the corresponding solutions, which have the following innovations: (1) in order to solve the problem that the foreign transliteration recognition rate of the existing word segmentation tools in the human name recognition is not high, In this paper, we use the method of extracting the information box data from Wikipedia, and construct the Chinese character database based on Wikipedia. At the same time, a dictionary of transliteration names of foreign languages based on Chinese Wikipedia is constructed by using the Link data in Wikipedia. (2) in this paper, a hierarchical classification method based on pattern matching and feature vector method is proposed to classify people relationship, and DAG-SVMs multi-value classification method is used to solve the problem of multi-valued classification. In order to improve the execution speed and performance of the classification model, and to introduce the personal relationship into the division of the relationship between people, the phenomenon of "the same person does not have the same name" in Wikipedia can be alleviated. The feasibility of this method is verified by experiments. This paper uses the proposed method to construct a large Wikipedia database of characters and a dictionary of names. At the same time, the experimental results show that the performance of this paper is better in the recognition of personal relationship, especially in the classification of personal relationship and family relationship.
【學(xué)位授予單位】:北京交通大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:TP391.1

【相似文獻】

相關(guān)期刊論文 前3條

1 傅宛菊;陳木蘭;;中國新魔幻電影的類型化初探[J];東南傳播;2014年08期

2 丁海峰;;論電影《海洋天堂》中細節(jié)的運用[J];西部廣播電視;2013年05期

3 ;[J];;年期

相關(guān)會議論文 前3條

1 白勁鵬;;可怕的對稱——論《了不起的蓋茨比》中的主次人物關(guān)系[A];外語語言教學(xué)研究——黑龍江省外國語學(xué)會第十一次學(xué)術(shù)年會論文集[C];1997年

2 黃素影;;《天倫》創(chuàng)作小結(jié)[A];我的角色與我們的劇團——第六屆電影表演藝術(shù)學(xué)會獎文集[C];1997年

3 吳士余;;重視人物關(guān)系的典型化[A];《毛澤東文藝思想研究》第三輯暨全國毛澤東文藝思想研究會第三次年會論文集[C];1983年

相關(guān)重要報紙文章 前6條

1 本報記者 張悅;音樂劇《蝶》推出修排版[N];中國藝術(shù)報;2008年

2 記者 金朝力;網(wǎng)絡(luò)視頻業(yè)首推人臉識別功能[N];北京商報;2010年

3 本文實習(xí)記者 張柳青;紀(jì)念汶川地震一周年[N];中國電影報;2009年

4 許柏林;小成本拍出大境界[N];人民日報;2012年

5 張克丹 綜合整理;青春·理想·奮斗·奉獻[N];中國電影報;2009年

6 上海戲劇學(xué)院副教授 石俊;問號的力量[N];文匯報;2012年

相關(guān)碩士學(xué)位論文 前7條

1 唐丞博;談《追夢時刻》中人物關(guān)系的發(fā)展和變化[D];云南藝術(shù)學(xué)院;2016年

2 劉博佳;基于維基百科的人物關(guān)系抽取研究[D];北京交通大學(xué);2016年

3 潘云;基于中文在線資源的人物關(guān)系抽取研究[D];華東師范大學(xué);2015年

4 徐珊;孫昌涉初期小說的人物關(guān)系和作家意識研究[D];山東大學(xué);2009年

5 顧靜航;基于信息抽取的人物關(guān)系網(wǎng)絡(luò)構(gòu)建研究[D];蘇州大學(xué);2014年

6 許婷;基于話單挖掘的可視化人物關(guān)系分析系統(tǒng)的設(shè)計與實現(xiàn)[D];哈爾濱工業(yè)大學(xué);2014年

7 范少帥;基于特征向量的人物關(guān)系抽取方法研究[D];華東交通大學(xué);2015年

,

本文編號:2310833

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/2310833.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶b613f***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com
亚洲性日韩精品一区二区| 五月天丁香婷婷狠狠爱| 国产又大又黄又粗又免费| 亚洲欧美日韩精品永久| 国产精品久久女同磨豆腐| 午夜成年人黄片免费观看| 久久这里只精品免费福利| 国产又粗又猛又大爽又黄| 国产亚洲精品岁国产微拍精品| 久热青青草视频在线观看| 欧美中文字幕一区在线| 亚洲第一区二区三区女厕偷拍| 高跟丝袜av在线一区二区三区| 欧美精品二区中文乱码字幕高清| 99精品国产自在现线观看| 亚洲中文在线男人的天堂| 年轻女房东2中文字幕| 国产av天堂一区二区三区粉嫩| 国产精品免费视频视频| 色婷婷在线视频免费播放| 亚洲av专区在线观看| 色婷婷国产熟妇人妻露脸| 91亚洲精品亚洲国产| 国产欧美一区二区久久| 国产精品免费视频久久| 亚洲欧美日韩另类第一页| 中文字幕亚洲精品乱码加勒比 | 亚洲a码一区二区三区| 国产一区二区三区av在线| 久久天堂夜夜一本婷婷| 国产精品午夜视频免费观看 | 成人亚洲国产精品一区不卡| 一区二区三区亚洲天堂| 国产美女精品午夜福利视频| 中文字幕日韩精品人一妻| 久久本道综合色狠狠五月| 成人国产激情福利久久| 久久一区内射污污内射亚洲| 神马午夜福利一区二区| 国产成人精品99在线观看| 黄片在线免费看日韩欧美|