天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 搜索引擎論文 >

融合句義特征的人名消歧及人物關(guān)系抽取技術(shù)研究

發(fā)布時(shí)間:2017-06-03 20:10

  本文關(guān)鍵詞:融合句義特征的人名消歧及人物關(guān)系抽取技術(shù)研究,由筆耕文化傳播整理發(fā)布。


【摘要】:人名歧義是一種身份不確定的現(xiàn)象,指的是文本中相同的人名指向現(xiàn)實(shí)世界中的不同實(shí)體人物。人名消歧具有很大的實(shí)際應(yīng)用價(jià)值,是搜索引擎、社交網(wǎng)絡(luò)和人名知識(shí)庫構(gòu)建等領(lǐng)域的基礎(chǔ)性研究,在個(gè)性化搜索、自動(dòng)問答、多文本摘要、熱點(diǎn)人物跟蹤與發(fā)現(xiàn)等領(lǐng)域都有著廣泛的應(yīng)用。通過人名消歧獲得了感興趣人物的相關(guān)文本后,人們往往還關(guān)心與其具有特定關(guān)系的人物,僅僅識(shí)別出文本中的人物往往無法滿足實(shí)際應(yīng)用需求,這些人物之間存在著何種關(guān)系更為關(guān)鍵。因?yàn)槲谋局械娜宋镪P(guān)系是分散的,所以更需要從文本中快速準(zhǔn)確地自動(dòng)抽取人物關(guān)系。 跨文本人名消歧是區(qū)分多文本中同名的不同人物實(shí)體的過程,是人名檢索技術(shù)的重要組成部分,近年來成為自然語言處理中的一個(gè)重點(diǎn)問題。本文針對(duì)文本分析不夠深入、表示不夠精細(xì)造成的信息丟失和噪聲干擾的問題,提出了一種融合句義特征的三階段人名消歧方法。該方法首先針對(duì)查詢?cè)~常作為普通詞出現(xiàn)的特點(diǎn),,在文本預(yù)處理后采用啟發(fā)式規(guī)則的后處理方法判斷其是否是人名;然后根據(jù)特征模板提取局部名實(shí)體特征及職業(yè),通過句義結(jié)構(gòu)模型進(jìn)行句義分析,提取句義特征,引入重疊系數(shù)計(jì)算句義特征相似度,利用詞袋模型統(tǒng)計(jì)詞頻,構(gòu)成三層特征空間;最后使用基于規(guī)則的分類和兩階段層次聚類算法實(shí)現(xiàn)人名消歧。在CLP2012中文人名消歧語料上進(jìn)行實(shí)驗(yàn),結(jié)果表明該方法的F值達(dá)到88.79%,跨文本人名消歧方法中引入句義特征可進(jìn)一步提升其處理效果。 人物關(guān)系常常不以結(jié)構(gòu)化的形式表達(dá),人們對(duì)自動(dòng)高效的人物關(guān)系抽取方法的需求是迫切的,本文針對(duì)三元組特征分析不夠深入,種子詞需要人工設(shè)定等問題,在抽取并分析關(guān)系特征詞所承擔(dān)的句義任務(wù)的基礎(chǔ)上,提出了一種自動(dòng)的人物關(guān)系抽取方法。該方法首先利用統(tǒng)計(jì)詞頻特征及Bootstrapping算法,分別在少量有標(biāo)記的語料和大量無標(biāo)記的語料中訓(xùn)練得到關(guān)系特征詞典;然后通過元素距離最優(yōu)化規(guī)則構(gòu)造語句的三元組實(shí)例,融合詞法層及句義特征構(gòu)造三元組特征空間;最后對(duì)三元組進(jìn)行是非二元判定,利用置信度最大化原則得到人物關(guān)系類別。在BFS熱門人物檢索語料上進(jìn)行實(shí)驗(yàn),結(jié)果表明該方法的F值達(dá)到83.8%,實(shí)驗(yàn)效果良好。
【關(guān)鍵詞】:人名消歧 人物關(guān)系 抽取句義特征 自然語言處理
【學(xué)位授予單位】:北京理工大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類號(hào)】:TP391.1
【目錄】:
  • 摘要5-6
  • Abstract6-11
  • 圖表索引11-13
  • 第1章 緒論13-20
  • 1.1 研究背景和意義13-15
  • 1.2 研究歷史和現(xiàn)狀15-18
  • 1.2.1 人名消歧研究歷史和現(xiàn)狀15-16
  • 1.2.2 人物關(guān)系抽取研究歷史和現(xiàn)狀16-18
  • 1.2.3 總結(jié)與分析18
  • 1.3 研究?jī)?nèi)容和結(jié)構(gòu)安排18-20
  • 1.3.1 研究?jī)?nèi)容18-19
  • 1.3.2 結(jié)構(gòu)安排19-20
  • 第2章 涉及的理論和技術(shù)基礎(chǔ)20-30
  • 2.1 引言20
  • 2.2 句義結(jié)構(gòu)模型20-23
  • 2.2.1 句義結(jié)構(gòu)模型概念20-21
  • 2.2.2 句義特征構(gòu)造21-23
  • 2.3 文本表示方法23-25
  • 2.3.1 布爾值模型23
  • 2.3.2 N-Gram 模型23-24
  • 2.3.3 向量空間模型24-25
  • 2.3.4 概率模型25
  • 2.4 聚類及分類算法25-29
  • 2.4.1 K 均值聚類25-26
  • 2.4.2 層次聚類26-27
  • 2.4.3 最近鄰分類27-28
  • 2.4.4 支持向量機(jī)28
  • 2.4.5 C4.5 決策樹28-29
  • 2.5 小結(jié)29-30
  • 第3章 融合句義特征的跨文本人名消歧方法30-41
  • 3.1 引言30
  • 3.2 相關(guān)工作30-31
  • 3.2.1 主要技術(shù)和方法30-31
  • 3.2.2 問題總結(jié)與分析31
  • 3.3 算法設(shè)計(jì)31-36
  • 3.3.1 算法原理31-32
  • 3.3.2 預(yù)處理32
  • 3.3.3 人名實(shí)體識(shí)別32-34
  • 3.3.4 三層特征空間構(gòu)造34-35
  • 3.3.5 分類和兩階段聚類35-36
  • 3.4 實(shí)驗(yàn)分析36-39
  • 3.4.1 數(shù)據(jù)源和實(shí)驗(yàn)條件36-37
  • 3.4.2 評(píng)價(jià)方法37
  • 3.4.3 實(shí)驗(yàn)結(jié)果37-39
  • 3.5 小結(jié)39-41
  • 第4章 融合句義特征的人物關(guān)系抽取方法41-51
  • 4.1 引言41
  • 4.2 相關(guān)工作41-42
  • 4.2.1 主要技術(shù)和方法41-42
  • 4.2.2 問題總結(jié)與分析42
  • 4.3 算法設(shè)計(jì)42-46
  • 4.3.1 算法原理42-43
  • 4.3.2 關(guān)系特征詞典自動(dòng)生成43-44
  • 4.3.3 三元組特征空間構(gòu)造44-46
  • 4.3.4 C4.5 人物關(guān)系判定46
  • 4.4 實(shí)驗(yàn)分析46-50
  • 4.4.1 實(shí)驗(yàn)數(shù)據(jù)和實(shí)驗(yàn)條件46-47
  • 4.4.2 實(shí)驗(yàn)結(jié)果47-50
  • 4.5 小結(jié)50-51
  • 第5章 原型系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)51-65
  • 5.1 引言51
  • 5.2 系統(tǒng)總體設(shè)計(jì)51-54
  • 5.2.1 技術(shù)路線和設(shè)計(jì)原則51
  • 5.2.2 目標(biāo)和功能需求51-52
  • 5.2.3 系統(tǒng)的總體結(jié)構(gòu)52-54
  • 5.3 關(guān)鍵功能模塊實(shí)現(xiàn)54-61
  • 5.3.1 人名實(shí)體識(shí)別模塊54-56
  • 5.3.2 特征抽取模塊56-58
  • 5.3.3 分類和兩階段聚類模塊58-59
  • 5.3.4 人物關(guān)系抽取59-61
  • 5.4 實(shí)驗(yàn)分析61-64
  • 5.4.1 人物關(guān)系圖實(shí)驗(yàn)61-63
  • 5.4.2 容錯(cuò)能力實(shí)驗(yàn)63-64
  • 5.5 小結(jié)64-65
  • 第6章 結(jié)束語65-68
  • 6.1 全文總結(jié)65-66
  • 6.2 工作展望66-68
  • 參考文獻(xiàn)68-72
  • 學(xué)習(xí)期間發(fā)表的學(xué)術(shù)論文與研究成果清單72-73
  • 致謝73

【參考文獻(xiàn)】

中國期刊全文數(shù)據(jù)庫 前10條

1 劉克彬;李芳;劉磊;韓穎;;基于核函數(shù)中文關(guān)系自動(dòng)抽取系統(tǒng)的實(shí)現(xiàn)[J];計(jì)算機(jī)研究與發(fā)展;2007年08期

2 何婷婷;徐超;李晶;趙君U

本文編號(hào):419110


資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/419110.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶398cf***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com
亚洲国产av精品一区二区| 欧美中文日韩一区久久| 人人妻人人澡人人夜夜| 色一情一乱一区二区三区码| 国产午夜福利在线观看精品| 日韩一区二区三区四区乱码视频| 国产一区二区精品高清免费 | 日韩不卡一区二区在线| 午夜福利激情性生活免费视频| 亚洲伦片免费偷拍一区| 日本精品最新字幕视频播放| 五月婷婷综合激情啪啪| 丰满少妇被粗大猛烈进出视频| 九九热这里只有精品哦| 国产综合欧美日韩在线精品| 亚洲精品福利入口在线| 亚洲黑人精品一区二区欧美| 国内午夜精品视频在线观看| 婷婷色香五月综合激激情| 日本一本不卡免费视频| 偷拍偷窥女厕一区二区视频| 91福利视频日本免费看看| 日本精品视频一二三区| 少妇人妻精品一区二区三区| 成年午夜在线免费视频| 国产午夜精品在线免费看| 自拍偷拍一区二区三区| 深夜视频成人在线观看| 国产成人人人97超碰熟女| 亚洲国产色婷婷久久精品| 午夜福利激情性生活免费视频| 亚洲熟女精品一区二区成人| 欧美日韩国产综合在线| 东京不热免费观看日本| 国产黑人一区二区三区| 久久久精品区二区三区| 91精品国自产拍老熟女露脸 | 欧美一级黄片欧美精品| 精品欧美在线观看国产| 五月综合婷婷在线伊人| 亚洲一二三四区免费视频|