構建Web數(shù)據(jù)空間的若干關鍵技術研究
本文選題:Web數(shù)據(jù)集成 + 數(shù)據(jù)空間。 參考:《南京航空航天大學》2016年博士論文
【摘要】:隨著互聯(lián)網(wǎng)技術的快速發(fā)展,Web已經(jīng)成為一個巨大的信息寶庫,擁有海量的數(shù)據(jù),成為人們日常生活、電子政務和電子商務等領域不可或缺的部分。為了有效的利用Web上的數(shù)據(jù)資源,目前已經(jīng)有很多專門用于Web數(shù)據(jù)處理的方法:Web數(shù)據(jù)挖掘、Deep Web數(shù)據(jù)集成、利用語義技術重構Web而建立的語義Web等。數(shù)據(jù)空間是針對新的數(shù)據(jù)特點和數(shù)據(jù)管理技術的抽象與概括,其本質是解決數(shù)據(jù)集成問題。數(shù)據(jù)空間是一個實體所擁有的所有數(shù)據(jù)的集合。Web數(shù)據(jù)空間系統(tǒng)是通過集成演化的構建方法,為實現(xiàn)用戶所關心的Web上數(shù)據(jù)訪問而建設的一個可持續(xù)改進的與可逐漸實現(xiàn)Web語義集成的Web數(shù)據(jù)集成系統(tǒng)。建設Web數(shù)據(jù)空間系統(tǒng)的目的是為個人或組織有效地利用Web數(shù)據(jù)提供一種解決方案。圍繞如何構建一個Web數(shù)據(jù)空間需要解決的關鍵問題:系統(tǒng)框架、數(shù)據(jù)模型、數(shù)據(jù)源選擇、模式集成、訪問控制等方面開展了研究工作,具體的研究成果如下:(1)提出了Web數(shù)據(jù)空間的系統(tǒng)框架與構建原則。在數(shù)據(jù)空間數(shù)據(jù)集成理念的基礎上,結合Web數(shù)據(jù)的特點,分析了Web數(shù)據(jù)空間的一些主要特征,給出了構建一個Web數(shù)據(jù)空間系統(tǒng)的一些基本原則:能夠管理Web上的所有數(shù)據(jù)、使用集成演化數(shù)據(jù)構建原則、充分利用現(xiàn)有技術、利用協(xié)作方式、便利的數(shù)據(jù)分享方式等。設計了Web數(shù)據(jù)空間的系統(tǒng)框架,給出了各部分的詳細功能,最后詳細的討論了使用顯式反饋與隱式反饋實現(xiàn)Web系統(tǒng)空間進化的一些問題。(2)設計了Web數(shù)據(jù)空間系統(tǒng)的數(shù)據(jù)模型;赗DF模型,設計完成了Web數(shù)據(jù)空間數(shù)據(jù)模型。模型首先通過RDF建立了一個數(shù)據(jù)視圖,該視圖實現(xiàn)了Web上所有數(shù)據(jù)的統(tǒng)一表示。具體應用時需要針對具體類型的數(shù)據(jù)進行實例化,具體的實例化模型包括:網(wǎng)頁數(shù)據(jù)、文件文件夾、Deep Web、數(shù)據(jù)流、關聯(lián)數(shù)據(jù)等。該模型可以實現(xiàn)Web上所有數(shù)據(jù)的統(tǒng)一建模,在單一模型內部實現(xiàn)非結構化、結構化以及結構化數(shù)據(jù)的統(tǒng)一表示與訪問。(3)提出了一種基于用戶查詢與數(shù)據(jù)源中間模式關聯(lián)度、數(shù)據(jù)源數(shù)據(jù)質量、數(shù)據(jù)源最小查詢代價綜合考量的Web數(shù)據(jù)源選擇方法。該方法分為兩個階段:第一個階段根據(jù)查詢與數(shù)據(jù)源的關聯(lián)度、數(shù)據(jù)源質量選擇數(shù)據(jù)源;第二個階段使用最小查詢代價模型動態(tài)選擇第一階段已經(jīng)選擇的數(shù)據(jù)源,滿足用戶k個查詢記錄的需求。在最小查詢代價模型算法的設計中,使用了最大熵模型計算數(shù)據(jù)源之間的重復度。(4)提出了一個Web數(shù)據(jù)空間數(shù)據(jù)模式集成與映射方法。首先給出了Web數(shù)據(jù)空間模式集成的框架,然后運用組合的方法,基于K-中心點算法實現(xiàn)了中間模式的自動集成,最后提出了使用Top-k個模式與用戶查詢進行映射與匹配的方法,提高了用戶查詢的準確率與召回率,同時給出了使用集成演化的方法提高查詢精度的方法。(5)設計了一個細粒度的基于上下文的訪問控制模型;赬ACML模型,運用目前的一些語義技術:使用OWL描述主體、客體、操作與環(huán)境,使用SWRL實現(xiàn)語義推理,設計完成了一個細粒度的可以實現(xiàn)對關聯(lián)數(shù)據(jù)數(shù)據(jù)空間的訪問控制模型。模型中使用語義范圍方法大大減少了訪問規(guī)則的定義,相關語義技術的使用可以實現(xiàn)對數(shù)據(jù)空間數(shù)據(jù)上下文的訪問控制。
[Abstract]:With the rapid development of Internet technology , the Web has become a huge information treasure house , which is an indispensable part in the fields of daily life , e - government and e - commerce . ( 3 ) A method for selecting Web data sources based on correlation between user query and data source , data quality of data source and minimum query cost of data source is proposed . The method includes two stages : the first stage selects the data source according to the relation between the query and the data source , the data source quality selects the data source , and the second stage uses the minimum query cost model to dynamically select the data source which has been selected in the first stage .
【學位授予單位】:南京航空航天大學
【學位級別】:博士
【學位授予年份】:2016
【分類號】:TP311.13;TP393.09
【相似文獻】
相關期刊論文 前10條
1 楊紅爵;;略論數(shù)據(jù)空間[J];成功(教育);2009年01期
2 郭瑩;;數(shù)據(jù)空間關鍵問題探究[J];軟件導刊;2012年07期
3 厲劍;張紹雄;劉俊杰;李成柱;;大數(shù)據(jù)引發(fā)信息時代新變革[J];大眾科技;2013年12期
4 李斌;;大數(shù)據(jù)及其發(fā)展趨勢研究[J];廣西教育;2013年35期
5 張曉軍;孟祥武;;數(shù)字化周期[J];計算機科學;2002年05期
6 崔晨;吳揚揚;;基于活動的數(shù)據(jù)空間數(shù)據(jù)關系發(fā)現(xiàn)[J];微型機與應用;2011年11期
7 賈云得;;微型數(shù)字存貯遙測裝置數(shù)據(jù)預存貯方法[J];遙測遙控;1989年06期
8 靳小龍;王元卓;程學旗;;大數(shù)據(jù)的研究體系與現(xiàn)狀[J];信息通信技術;2013年06期
9 朝樂門;;數(shù)據(jù)空間及其信息資源管理視角研究[J];情報理論與實踐;2013年11期
10 黃一凡;;合并分區(qū) 數(shù)據(jù)無損有妙招[J];電腦愛好者;2011年23期
相關會議論文 前5條
1 李鴻奎;陳洪艷;;大連市房地產基礎地理信息系統(tǒng)的設計和建設[A];中國地理信息系統(tǒng)協(xié)會第九屆年會論文集[C];2005年
2 董彥磊;申德榮;寇月;聶鐵錚;;數(shù)據(jù)空間中數(shù)據(jù)組織模型以及關聯(lián)關系發(fā)現(xiàn)模型的研究[A];第26屆中國數(shù)據(jù)庫學術會議論文集(B輯)[C];2009年
3 龐怡;許洪光;張志敏;;針對海量科技信息的存儲研究[A];信息時代——科技情報研究學術論文集(第三輯)[C];2008年
4 季承;;Oracle利用HWM高水標記收縮數(shù)據(jù)空間方案[A];2013電力行業(yè)信息化年會論文集[C];2013年
5 季承;;Oracle利用HWM高水標記收縮數(shù)據(jù)空間方案[A];2013電力行業(yè)信息化年會論文集[C];2013年
相關重要報紙文章 前6條
1 牛澤亞;用戶如何在數(shù)據(jù)空間里“被遺忘”?[N];人民郵電;2014年
2 風格;指引大數(shù)據(jù)未來發(fā)展方向的九大真理[N];中華讀書報;2013年
3 錄音整理 本報記者 劉文強 楊豐源;創(chuàng)新驅動,奮力奔向大數(shù)據(jù)時代[N];貴陽日報;2014年
4 中國人民大學信息學院 李玉坤;云計算與數(shù)據(jù)空間[N];中國計算機報;2008年
5 整理 本報記者 蘇丹丹;把握大數(shù)據(jù)機遇 推動文化產業(yè)跨越發(fā)展[N];中國文化報;2013年
6 安徽國稅局 趙為民;稅務綜合數(shù)據(jù)平臺的設想[N];計算機世界;2007年
相關博士學位論文 前10條
1 李曉娜;面向SaaS應用的多租戶數(shù)據(jù)放置機制研究[D];山東大學;2015年
2 張德兵;基于機器學習的數(shù)據(jù)補全、標注和檢索若干問題研究[D];浙江大學;2015年
3 劉思彤;空間文本數(shù)據(jù)的查詢處理技術研究[D];清華大學;2015年
4 侯振隆;重力全張量梯度數(shù)據(jù)的并行反演算法研究及應用[D];吉林大學;2016年
5 柯余洋;面向三類應用數(shù)據(jù)的智能分析與優(yōu)化研究[D];中國科學技術大學;2016年
6 劉正濤;構建Web數(shù)據(jù)空間的若干關鍵技術研究[D];南京航空航天大學;2016年
7 姜朔;數(shù)據(jù)空間中數(shù)據(jù)集成若干關鍵問題研究[D];東華大學;2014年
8 陳鵬;面向情景感知計算的時空數(shù)據(jù)管理、查詢、分析與相關算法研究[D];華東師范大學;2013年
9 楊丹;數(shù)據(jù)空間中基于語義的實體搜索關鍵技術研究[D];東北大學;2012年
10 王曉蕊;華北克拉通地球化學科學數(shù)據(jù)的管理及應用研究[D];中國地質大學;2008年
相關碩士學位論文 前10條
1 權西瑞;云環(huán)境下數(shù)據(jù)版權保護方法的研究[D];西安建筑科技大學;2015年
2 向兵;中藥顆粒調劑設備中輔助硬件及自動封口機的設計[D];東北師范大學;2015年
3 朱躍龍;公安情報自動分類系統(tǒng)的設計與實現(xiàn)[D];電子科技大學;2015年
4 張鵬遠;大數(shù)據(jù)分類存儲及檢索方法研究[D];西安電子科技大學;2014年
5 王夢佳;DOA下數(shù)據(jù)注冊方法的初步研究與實現(xiàn)[D];成都理工大學;2015年
6 陳啟偉;電機狀態(tài)云監(jiān)測系統(tǒng)研究與實現(xiàn)[D];浙江大學;2016年
7 王照清;大數(shù)據(jù)環(huán)境下數(shù)據(jù)查詢優(yōu)化技術應用研究[D];北方工業(yè)大學;2016年
8 賈振美;面向稀疏軌跡數(shù)據(jù)的位置預測方法研究[D];東北大學;2014年
9 雷德龍;矢量空間數(shù)據(jù)云存儲與馬爾可夫并行聚類算法研究[D];福州大學;2014年
10 王甜甜;國家地理大數(shù)據(jù)戰(zhàn)略平臺研究[D];中共中央黨校;2016年
,本文編號:1930471
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/1930471.html