基于知識圖譜的跨語言實體鏈接與語義查詢
本文關(guān)鍵詞:基于知識圖譜的跨語言實體鏈接與語義查詢,由筆耕文化傳播整理發(fā)布。
【摘要】:近些年,數(shù)據(jù)的關(guān)聯(lián)語義信息受到人們的普遍關(guān)注,語義查詢技術(shù)取得了長足進步。知識圖譜作為語義查詢的重要支撐,包含大量命名實體及語義關(guān)系,提供開放的知識訪問接口,能夠一定程度反映真實世界的實體間關(guān)系。相比于YAGO、 Probase等具有豐富實體和語義關(guān)系的英文知識圖譜,中文知識圖譜仍處于發(fā)展階段,實體及實體間關(guān)系不豐富,難以有效支持中文語義查詢。一個很自然的問題是,如何利用成熟的英文知識圖譜對中文數(shù)據(jù)進行語義查詢。本文提出一個基于跨語言圖譜的跨語言查詢框架,并基于圖模型完善跨語言圖譜的結(jié)構(gòu)語義信息,設(shè)計并實現(xiàn)了跨語言查詢應(yīng)用系統(tǒng),提供在線的跨語言查詢服務(wù);趯嶋H百科數(shù)據(jù)進行測試,測試結(jié)果驗證了本文提出的跨語言查詢框架的有效性。本文的主要貢獻包括以下四點·提出跨語言圖譜概念與基于跨語言圖譜的跨語言查詢框架。該框架在線解決存在未知跨語言鏈接的中文實體提及查詢問題和實體消歧結(jié)果重排序問題,實現(xiàn)準確的跨語言語義查詢。·提出一種分類-排序模型與基于關(guān)系圖的隨機游走算法,解決中英文Wiki-Sketch(關(guān)鍵百科)之間跨語言屬性標(biāo)簽鏈接、屬性缺失語義發(fā)現(xiàn)、錯誤鏈接屬性識別、缺失屬性補全等關(guān)鍵問題。Wiki-Sketch是抽取自百科數(shù)據(jù)的面向程序的、結(jié)構(gòu)化的實體集。·提出一種結(jié)合跨語言實體鏈接,以及跨語言屬性標(biāo)簽鏈接的缺失屬性補全方法,補充了中文維基百科80,566個實體的347,124條缺失信息框?qū)傩?以及60萬中英文維基實體的4,500多萬條缺失鏈接屬性!ぴO(shè)計并實現(xiàn)了跨語言語義查詢系統(tǒng),在線提供并支持多種客戶端的近實時訪問。借助用戶查詢歷史和用戶反饋,實現(xiàn)查詢的自適優(yōu)化,提高查詢準確性。本文從跨語言查詢框架的構(gòu)建、跨語言圖譜結(jié)構(gòu)語義信息完善、跨語言查詢系統(tǒng)效果提升三個方面開展研究,實現(xiàn)了中文實體的跨語言語義查詢,對中文語義信息挖掘與補全有重要意義。
【關(guān)鍵詞】:知識圖譜 實體鏈接 實體消歧 語義查詢 跨語言實體鏈接
【學(xué)位授予單位】:華東師范大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:TP391.1
【目錄】:
- 摘要6-7
- ABSTRACT7-12
- 第一章 緒論12-18
- 1.1 研究背景12-13
- 1.2 研究問題13-15
- 1.3 主要貢獻15-17
- 1.4 組織結(jié)構(gòu)17-18
- 第二章 相關(guān)工作18-24
- 2.1 知識圖譜18-20
- 2.2 實體鏈接20-23
- 2.2.1 單語言實體鏈接20-22
- 2.2.2 跨語言實體鏈接22-23
- 2.3 本章小結(jié)23-24
- 第三章 基于跨語言圖譜的跨語言實體查詢24-46
- 3.1 概念描述24-25
- 3.2 查詢處理框架25-27
- 3.3 離線知識獲取27-30
- 3.3.1 詞典抽取27-30
- 3.3.2 Wiki-Sketch與同義詞集抽取30
- 3.4 中文實體鏈接30-32
- 3.5 跨語言實體鏈接32-37
- 3.5.1 結(jié)構(gòu)特征抽取33-36
- 3.5.2 語義特征抽取36-37
- 3.5.3 跨語言鏈接實體發(fā)現(xiàn)37
- 3.6 關(guān)系子圖生成37-40
- 3.7 實驗40-44
- 3.7.1 實驗設(shè)置40-41
- 3.7.2 準確性實驗41-44
- 3.8 本章小結(jié)44-46
- 第四章 跨語言圖譜結(jié)構(gòu)語義信息完善46-66
- 4.1 數(shù)據(jù)觀察47-48
- 4.2 跨語言圖譜完善框架48
- 4.3 跨語言屬性標(biāo)簽鏈接48-51
- 4.3.1 跨語言屬性標(biāo)簽預(yù)分類50-51
- 4.3.2 跨語言標(biāo)簽鏈接預(yù)測51
- 4.4 錯誤屬性識別51-58
- 4.4.1 ILG圖構(gòu)建52-54
- 4.4.2 錯誤跨語言鏈接識別54-58
- 4.5 缺失屬性補全58-60
- 4.5.1 缺失信息框?qū)傩匝a全58-59
- 4.5.2 缺失鏈接屬性補全59-60
- 4.6 實驗60-65
- 4.6.1 數(shù)據(jù)集60-61
- 4.6.2 準確性實驗61-62
- 4.6.3 缺失屬性分析62-65
- 4.7 本章小結(jié)65-66
- 第五章 跨語言實體查詢系統(tǒng)66-74
- 5.1 系統(tǒng)架構(gòu)66-67
- 5.2 查詢準確率優(yōu)化67-68
- 5.3 近實時性查詢68-69
- 5.4 可視化展示69-71
- 5.5 實驗71-72
- 5.5.1 實驗設(shè)置71
- 5.5.2 實驗分析71-72
- 5.6 本章小結(jié)72-74
- 第六章 總結(jié)與展望74-77
- 6.1 總結(jié)74-75
- 6.2 展望75-77
- 參考文獻77-88
- 致謝88-90
- 攻讀碩士學(xué)位期間發(fā)表論文和科研情況90
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 徐福緣;對IDEF1的擴充[J];計算機工程;1988年05期
2 李天柱;O-O數(shù)據(jù)模型中實體聯(lián)系的表達方法[J];計算機研究與發(fā)展;1997年04期
3 楊丹;申德榮;于戈;聶鐵錚;寇月;;數(shù)據(jù)空間中時間為中心的集合實體識別策略[J];計算機科學(xué)與探索;2012年11期
4 劉軍華;張麗敏;;基于數(shù)據(jù)字典的實體類設(shè)計與實現(xiàn)[J];湖南工業(yè)職業(yè)技術(shù)學(xué)院學(xué)報;2012年05期
5 閆寶華;;信息管理系統(tǒng)中實體bean問題之解決方案研究[J];網(wǎng)絡(luò)安全技術(shù)與應(yīng)用;2011年01期
6 朱立;;淺談實體框架[J];電腦知識與技術(shù);2011年18期
7 朱曉林;;基于Java創(chuàng)建游戲?qū)嶓w類[J];科技廣場;2006年05期
8 劉杰;;基于規(guī)則和統(tǒng)計相結(jié)合的地名實體識別的研究[J];佳木斯大學(xué)學(xué)報(自然科學(xué)版);2009年04期
9 李金良,陳恩平;集成CAD/CAPP的制造資源擴展實體聯(lián)系模型[J];組合機床與自動化加工技術(shù);2001年11期
10 郭景峰;王春燕;鄒曉紅;趙鵬飛;張健;;一種改進的針對合著關(guān)系網(wǎng)絡(luò)的鏈接預(yù)測方法[J];計算機科學(xué);2008年12期
中國博士學(xué)位論文全文數(shù)據(jù)庫 前5條
1 王金剛;在線知識庫累積引文推薦技術(shù)研究[D];北京理工大學(xué);2015年
2 寇月;Deep Web實體搜索的關(guān)鍵技術(shù)研究[D];東北大學(xué);2009年
3 姜麗麗;實體搜索與實體解析方法研究[D];蘭州大學(xué);2012年
4 張俊三;Web中相關(guān)實體發(fā)現(xiàn)研究[D];北京交通大學(xué);2013年
5 毛存禮;有色金屬領(lǐng)域?qū)嶓w檢索關(guān)鍵技術(shù)研究[D];昆明理工大學(xué);2014年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 郭云龍;微博實體與百科條目鏈接的多策略研究[D];西南大學(xué);2015年
2 吳佳君;多階段混合屬性的景點實體解析研究[D];江西師范大學(xué);2015年
3 王睿;實體鏈接的研究與實現(xiàn)[D];北京郵電大學(xué);2015年
4 王福海;貴陽學(xué)院學(xué)生公寓管理系統(tǒng)的研究與分析[D];云南大學(xué);2015年
5 蘇永浩;基于知識圖譜的跨語言實體鏈接與語義查詢[D];華東師范大學(xué);2016年
6 霍然;量質(zhì)融合數(shù)據(jù)管理系統(tǒng)中實體識別子系統(tǒng)的研究與實現(xiàn)[D];哈爾濱工業(yè)大學(xué);2013年
7 張蕊;Deep Web環(huán)境下重名實體識別研究[D];東北大學(xué);2010年
8 劉璇;普適計算環(huán)境下實體發(fā)現(xiàn)機制的研究與實現(xiàn)[D];國防科學(xué)技術(shù)大學(xué);2008年
9 于曉;Deep Web查詢松弛和實體識別研究[D];遼寧大學(xué);2012年
10 王兆昭;面向校園對象的實體搜索和社會化搜索系統(tǒng)的研究、設(shè)計和實現(xiàn)[D];北京郵電大學(xué);2014年
本文關(guān)鍵詞:基于知識圖譜的跨語言實體鏈接與語義查詢,由筆耕文化傳播整理發(fā)布。
,本文編號:321681
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/321681.html