基于本體的異構(gòu)數(shù)據(jù)源檢索技術(shù)研究
本文關(guān)鍵詞:基于本體的異構(gòu)數(shù)據(jù)源檢索技術(shù)研究,,由筆耕文化傳播整理發(fā)布。
【摘要】:據(jù)統(tǒng)計(jì)互聯(lián)網(wǎng)中有70%以上的數(shù)據(jù)是存儲在關(guān)系型數(shù)據(jù)庫中的,而當(dāng)前對數(shù)據(jù)庫的查詢主要依賴于專業(yè)人員提供的接口,難以滿足用戶的各種需求。如果對數(shù)據(jù)庫的檢索能像搜索引擎一樣利用自然語言,無疑會給各行業(yè)的發(fā)展帶來極大的便利。另一方面,異構(gòu)數(shù)據(jù)源之間往往包含許多關(guān)聯(lián),傳統(tǒng)的搜索方式迫使用戶只能從一個(gè)數(shù)據(jù)源中查詢得到結(jié)果后再去另一個(gè)數(shù)據(jù)源中進(jìn)行查詢,這種方式對用戶來說是耗時(shí)且費(fèi)力的。本文提出一種基于本體的異構(gòu)數(shù)據(jù)源檢索技術(shù),主要內(nèi)容包括:(1)結(jié)合已有的本體抽取、本體匹配與集成方法,研究本體之間的屬性匹配方法,將從異構(gòu)數(shù)據(jù)源關(guān)系模式中抽取出的本體集成為一個(gè)全局本體,作為異構(gòu)數(shù)據(jù)源檢索的基礎(chǔ):(2)利用集成的本體,挖掘用戶自然語言查詢中關(guān)鍵詞之間的關(guān)聯(lián),找出用戶查詢中潛在的語義。(3)研究通過集成的本體與異構(gòu)數(shù)據(jù)源關(guān)系模式之間的映射,將用戶的自然語言查詢轉(zhuǎn)換為數(shù)據(jù)庫查詢語句;(4)設(shè)計(jì)并實(shí)現(xiàn)基于本體的異構(gòu)數(shù)據(jù)源檢索原型系統(tǒng)。本文的主要成果有:(1)提出了一種本體匹配與集成中基于內(nèi)容的屬性相似度計(jì)算方法;(2)提出了一種通過集成的本體檢索異構(gòu)數(shù)據(jù)源的方法;(3)提出了一種通過集成的本體對應(yīng)的圖數(shù)據(jù)結(jié)構(gòu)挖掘查詢關(guān)鍵詞之間關(guān)聯(lián)的方法:(4)提出了一種通過集成的本體與異構(gòu)數(shù)據(jù)源關(guān)系模式之間的映射,將自然語言查詢轉(zhuǎn)換為數(shù)據(jù)庫查詢語句的方法。
【關(guān)鍵詞】:本體 語義搜索 異構(gòu)數(shù)據(jù)源 自然語言查詢轉(zhuǎn)換
【學(xué)位授予單位】:東南大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2015
【分類號】:TP391.3
【目錄】:
- 摘要4-5
- Abstract5-10
- 縮略詞表10-11
- 第一章 緒論11-19
- 1.1 研究背景11-12
- 1.2 研究現(xiàn)狀12-16
- 1.2.1 本體抽取12-14
- 1.2.2 異構(gòu)數(shù)據(jù)源本體匹配與集成14-15
- 1.2.3 自然語言查詢轉(zhuǎn)換15-16
- 1.3 研究目標(biāo)與內(nèi)容16-17
- 1.4 研究方法與技術(shù)路線17
- 1.5 論文組織結(jié)構(gòu)17-19
- 第二章 背景知識19-23
- 2.1 語義網(wǎng)與語義搜索19
- 2.2 本體19-20
- 2.3 本體描述語言20-22
- 2.3.1 RDF20-21
- 2.3.2 RDFS21-22
- 2.3.3 OWL22
- 2.4 本章小結(jié)22-23
- 第三章 離線檢索預(yù)處理23-37
- 3.1 本體抽取23-29
- 3.1.1 數(shù)據(jù)庫關(guān)系模式及本體的符號表示23-25
- 3.1.2 數(shù)據(jù)庫關(guān)系模式抽取本體規(guī)則25-27
- 3.1.3 本體符號到三元組的轉(zhuǎn)換27-28
- 3.1.4 本體轉(zhuǎn)換實(shí)例28-29
- 3.2 本體匹配與本體集成29-32
- 3.2.1 關(guān)鍵概念解釋29
- 3.2.2 相似度計(jì)算方法29-31
- 3.2.3 異構(gòu)數(shù)據(jù)源的本體匹配與集成過程描述31-32
- 3.3 關(guān)鍵詞索引與詞典32-34
- 3.4 圖數(shù)據(jù)結(jié)構(gòu)轉(zhuǎn)換34-35
- 3.5 本章小結(jié)35-37
- 第四章 在線處理用戶查詢37-45
- 4.1 關(guān)鍵詞的連通圖搜索37-41
- 4.1.1 有效候選集生成算法37-39
- 4.1.2 連通圖搜索算法39-41
- 4.2 異構(gòu)數(shù)據(jù)源查詢分解41-43
- 4.3 查詢語句轉(zhuǎn)換43-44
- 4.4 異構(gòu)數(shù)據(jù)源查詢結(jié)果整合44
- 4.5 本章小結(jié)44-45
- 第五章 系統(tǒng)測試與評估45-55
- 5.1 數(shù)據(jù)準(zhǔn)備45-46
- 5.2 系統(tǒng)測試46-52
- 5.2.1 預(yù)處理48-51
- 5.2.2 用戶在線查詢51-52
- 5.3 測試結(jié)果52-53
- 5.4 本章小結(jié)53-55
- 第六章 總結(jié)與展望55-57
- 7.1 總結(jié)55
- 7.2 展望55-57
- 致謝57-59
- 參考文獻(xiàn)59-63
- 作者簡介63
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 楊寒光;李艷玲;;分布式異構(gòu)數(shù)據(jù)源標(biāo)準(zhǔn)化查詢設(shè)計(jì)與實(shí)現(xiàn)[J];土木建筑工程信息技術(shù);2013年04期
2 婁雅斌 ,陶鳳梅 ,馬垣;基于“本體”的異構(gòu)數(shù)據(jù)源的集成方法研究[J];微計(jì)算機(jī)信息;2005年20期
3 王霞;周濤;;高校信息資源異構(gòu)數(shù)據(jù)源的整合[J];中華醫(yī)學(xué)圖書情報(bào)雜志;2012年02期
4 熊海靈;伍勝;余建橋;;異構(gòu)數(shù)據(jù)源的集成與訪問[J];計(jì)算機(jī)科學(xué);2003年05期
5 楊勇,曹卉星,周建國,劉力,陳瞿鐵,粟麗;異構(gòu)數(shù)據(jù)源數(shù)據(jù)之轉(zhuǎn)換[J];計(jì)算機(jī)工程與應(yīng)用;1997年11期
6 王三明;信息系統(tǒng)中異構(gòu)數(shù)據(jù)源的整合與集成模式[J];CAD/CAM與制造業(yè)信息化;2003年05期
7 聶瑞華;嚴(yán)粵鋒;;物流信息系統(tǒng)中異構(gòu)數(shù)據(jù)源的集成研究[J];計(jì)算機(jī)科學(xué);2004年12期
8 王紅旗;郭繼坤;郭斌;李維軍;;后方油庫數(shù)字化建設(shè)中異構(gòu)數(shù)據(jù)源的整合與集成模式研究[J];后勤工程學(xué)院學(xué)報(bào);2007年03期
9 周濤;王霞;;醫(yī)學(xué)攝影圖像資料異構(gòu)數(shù)據(jù)源的整合[J];信息記錄材料;2007年05期
10 王寧,徐宏炳,王能斌;數(shù)據(jù)源集成系統(tǒng)中動(dòng)態(tài)字典構(gòu)造方法研究[J];計(jì)算機(jī)學(xué)報(bào);1999年01期
中國重要會議論文全文數(shù)據(jù)庫 前7條
1 席政;畢英杰;歐陽樹;紀(jì)揚(yáng);李文兵;;異構(gòu)數(shù)據(jù)源統(tǒng)一訪問技術(shù)的研究與實(shí)踐[A];冶金企業(yè)MES和ERP技術(shù)實(shí)踐論文集[C];2005年
2 楊寒光;李艷玲;;分布式異構(gòu)數(shù)據(jù)源標(biāo)準(zhǔn)化查詢設(shè)計(jì)與實(shí)現(xiàn)[A];計(jì)算機(jī)技術(shù)在工程設(shè)計(jì)中的應(yīng)用——第十六屆全國工程設(shè)計(jì)計(jì)算機(jī)應(yīng)用學(xué)術(shù)會議論文集[C];2012年
3 鄭志剛;朱建秋;朱揚(yáng)勇;;異構(gòu)數(shù)據(jù)源的可視化轉(zhuǎn)換及實(shí)現(xiàn)[A];第二十屆全國數(shù)據(jù)庫學(xué)術(shù)會議論文集(技術(shù)報(bào)告篇)[C];2003年
4 王海燕;周思方;;基于Web服務(wù)的校園網(wǎng)格異構(gòu)數(shù)據(jù)源統(tǒng)一訪問接口[A];2009年全國開放式分布與并行計(jì)算機(jī)學(xué)術(shù)會議論文集(上冊)[C];2009年
5 陳繼東;鄧大慶;范銳;;異構(gòu)數(shù)據(jù)源通用數(shù)據(jù)轉(zhuǎn)換工具的設(shè)計(jì)與實(shí)現(xiàn)[A];第十九屆全國數(shù)據(jù)庫學(xué)術(shù)會議論文集(技術(shù)報(bào)告篇)[C];2002年
6 張成洪;張誠;肖軍建;;基于wEB的企業(yè)信息集成系統(tǒng)[A];面向復(fù)雜系統(tǒng)的管理理論與信息系統(tǒng)技術(shù)學(xué)術(shù)會議專輯[C];2000年
7 趙文兵;唐世渭;楊冬青;;信息集成中全局視圖的研究[A];第十八屆全國數(shù)據(jù)庫學(xué)術(shù)會議論文集(研究報(bào)告篇)[C];2001年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前1條
1 李效東;自治異構(gòu)數(shù)據(jù)源的集成查詢處理[D];中國科學(xué)院研究生院(軟件研究所);2002年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 陸彬;基于本體的異構(gòu)數(shù)據(jù)源檢索技術(shù)研究[D];東南大學(xué);2015年
2 黃大科;分布式異構(gòu)數(shù)據(jù)源查詢與優(yōu)化[D];清華大學(xué);2004年
3 于琦;基于本體的異構(gòu)數(shù)據(jù)源模式集成研究[D];大連理工大學(xué);2007年
4 譚狄溪;基于本體的異構(gòu)數(shù)據(jù)源的集成研究[D];中南大學(xué);2004年
5 張凱;一種異構(gòu)數(shù)據(jù)源協(xié)調(diào)器的設(shè)計(jì)與實(shí)現(xiàn)[D];吉林大學(xué);2005年
6 張強(qiáng);異構(gòu)數(shù)據(jù)源連接引擎的研究與實(shí)現(xiàn)[D];電子科技大學(xué);2010年
7 黎昭聲;異構(gòu)數(shù)據(jù)源的數(shù)據(jù)訪問封裝功能的實(shí)現(xiàn)[D];北京郵電大學(xué);2013年
8 臧曉晗;基于SyncML協(xié)議的異構(gòu)數(shù)據(jù)源同步研究與實(shí)現(xiàn)[D];昆明理工大學(xué);2008年
9 張實(shí);基于Web Services的異構(gòu)數(shù)據(jù)源共享[D];國防科學(xué)技術(shù)大學(xué);2003年
10 肖干軍;基于XML的異構(gòu)數(shù)據(jù)源查詢處理研究[D];華中科技大學(xué);2004年
本文關(guān)鍵詞:基于本體的異構(gòu)數(shù)據(jù)源檢索技術(shù)研究,由筆耕文化傳播整理發(fā)布。
本文編號:438304
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/438304.html