基于領(lǐng)域本體的Deep Web簡(jiǎn)單查詢接口研究
本文選題:Deep 切入點(diǎn):Web 出處:《廣西師范大學(xué)》2013年碩士論文
【摘要】:伴隨信息技術(shù)的極速發(fā)展,面對(duì)這個(gè)龐大的信息海洋,如何快速有效的獲取正確的信息資源成為了學(xué)術(shù)界關(guān)注的熱點(diǎn)問(wèn)題。根據(jù)網(wǎng)絡(luò)信息的分布情況,可將整個(gè)網(wǎng)絡(luò)信息體系劃分為兩個(gè)部分:Surface Web和Deep Web。Sueface Web所蘊(yùn)含的信息是可以被傳統(tǒng)搜索引擎檢索到的,相對(duì)而言,Deep Web所蘊(yùn)含的高質(zhì)量、大規(guī)模、特定領(lǐng)域的信息資源卻較難獲取。 獲取Deep Web所蘊(yùn)含的信息資源的一個(gè)有效手段便是Deep Web數(shù)據(jù)集成技術(shù),而查詢接口作為Deep Web的唯一訪問(wèn)接口也就自然而然地成為了Deep Web數(shù)據(jù)集成框架研究的重點(diǎn)和熱點(diǎn)問(wèn)題。就目前而言,學(xué)術(shù)界將Deep Web的查詢接口大致分為復(fù)雜查詢接口和簡(jiǎn)單查詢接口兩種形式,兩種查詢接口在Web中存在的數(shù)量相差不大,但是,對(duì)復(fù)雜查詢接口查詢處理的研究起步較早、研究較為成熟,相對(duì)而言,針對(duì)簡(jiǎn)單查詢接口的相關(guān)研究是比較少的。 簡(jiǎn)單查詢接口的結(jié)構(gòu)簡(jiǎn)單,并且對(duì)查詢內(nèi)容的約束較少,相對(duì)于復(fù)雜查詢接口上繁多的屬性、復(fù)雜的屬性候選值,簡(jiǎn)單查詢接口的查詢方式更貼近用戶需求,更符合用戶的查詢習(xí)慣。在對(duì)簡(jiǎn)單查詢接口進(jìn)行查詢轉(zhuǎn)換處理時(shí),目前已有的轉(zhuǎn)換方法主要有以下不足:查詢轉(zhuǎn)換匹配準(zhǔn)確率相對(duì)于復(fù)雜查詢接口不高、相似度算法有待完善、對(duì)模式匹配結(jié)果的選取較注重最優(yōu)結(jié)果、查詢轉(zhuǎn)換時(shí)效性較低等。針對(duì)這些問(wèn)題,本文給出了加入領(lǐng)域本體技術(shù)的簡(jiǎn)單查詢接口的查詢過(guò)程,過(guò)程中結(jié)合領(lǐng)域本體技術(shù),配合基于不同數(shù)據(jù)類型的相似度計(jì)算方法及基于數(shù)據(jù)類型的匹配優(yōu)化算法,采用混合模式匹配方法,在考慮不確定性因素的情況下,完成了簡(jiǎn)單查詢接口的查詢處理。文章的核心研究主要有以下幾個(gè)方面: (1)構(gòu)建了中國(guó)—東盟博覽會(huì)領(lǐng)域本體,對(duì)博覽會(huì)的信息資源進(jìn)行了描述,使用規(guī)范的本體描述語(yǔ)言O(shè)WL2進(jìn)行手動(dòng)構(gòu)建,并確保此領(lǐng)域本體的合理性、正確性。 (2)本文對(duì)Deep Web查詢接口存在的問(wèn)題進(jìn)行了詳細(xì)分析,說(shuō)明了不確定因素存在的必然性以及其對(duì)簡(jiǎn)單查詢接口查詢轉(zhuǎn)換的影響。 (3)本文在介紹了Deep Web簡(jiǎn)單查詢接口查詢轉(zhuǎn)換具體步驟的基礎(chǔ)上,結(jié)合相應(yīng)的轉(zhuǎn)換模型提出了改進(jìn)的查詢轉(zhuǎn)換算法。此算法引入領(lǐng)域本體技術(shù),采用模式級(jí)、實(shí)例級(jí)信息及約束信息相結(jié)合的混合模式匹配。對(duì)關(guān)鍵詞概念匹配率(PKC)、概念屬性匹配率(PCA)的計(jì)算方法做了相應(yīng)的改進(jìn)。在考慮不確定因素的情況下,提出了基于數(shù)據(jù)類型的匹配結(jié)果優(yōu)化算法,有效提高了查詢轉(zhuǎn)換的準(zhǔn)確性和時(shí)效性。 (4)本文詳細(xì)介紹了文本和非文本類型數(shù)據(jù)的相似度計(jì)算方法,提出了改進(jìn)后的離散數(shù)字集合相似度、區(qū)間型數(shù)字集合相似度的計(jì)算方法,并將數(shù)據(jù)類型信息作為約束條件引入到匹配率計(jì)算公式中。實(shí)驗(yàn)證明改進(jìn)的相似度算法提高了匹配的準(zhǔn)確率。 (5)本文最終實(shí)現(xiàn)了對(duì)簡(jiǎn)單查詢平臺(tái)的搭建工作,針對(duì)文中提出的方法設(shè)計(jì)了相關(guān)的對(duì)比實(shí)驗(yàn),通過(guò)對(duì)簡(jiǎn)單查詢平臺(tái)的測(cè)試驗(yàn)證了本文理論觀點(diǎn)的可行性和合理性。
[Abstract]:......
【學(xué)位授予單位】:廣西師范大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2013
【分類號(hào)】:TP391.1
【參考文獻(xiàn)】
相關(guān)期刊論文 前10條
1 史忠植,董明楷,蔣運(yùn)承,張?;語(yǔ)義Web的邏輯基礎(chǔ)[J];中國(guó)科學(xué)E輯:信息科學(xué);2004年10期
2 陳麗君;林懷忠;;一種用于深層網(wǎng)接口集成的模式匹配方法[J];計(jì)算機(jī)工程;2012年12期
3 唐杰;梁邦勇;李涓子;王克宏;;語(yǔ)義Web中的本體自動(dòng)映射[J];計(jì)算機(jī)學(xué)報(bào);2006年11期
4 劉偉;孟小峰;孟衛(wèi)一;;Deep Web數(shù)據(jù)集成研究綜述[J];計(jì)算機(jī)學(xué)報(bào);2007年09期
5 姜芳艽;孟小峰;賈琳琳;;Deep Web集成服務(wù)的不確定模式匹配[J];計(jì)算機(jī)學(xué)報(bào);2008年08期
6 劉玉奎;周立柱;范舉;;中文深度萬(wàn)維網(wǎng)數(shù)據(jù)庫(kù)的現(xiàn)狀研究[J];計(jì)算機(jī)學(xué)報(bào);2011年02期
7 唐素勤;蔡自興;王駒;蔣運(yùn)承;;運(yùn)用屬性探索構(gòu)建完備描述邏輯本體[J];模式識(shí)別與人工智能;2011年01期
8 吳剛,唐杰,李涓子,王克宏;細(xì)粒度語(yǔ)義網(wǎng)檢索[J];清華大學(xué)學(xué)報(bào)(自然科學(xué)版);2005年S1期
9 林玲;周立柱;;基于簡(jiǎn)單查詢接口的Web數(shù)據(jù)庫(kù)模式識(shí)別[J];清華大學(xué)學(xué)報(bào)(自然科學(xué)版);2010年04期
10 寇月;申德榮;李冬;聶鐵錚;;一種基于語(yǔ)義及統(tǒng)計(jì)分析的Deep Web實(shí)體識(shí)別機(jī)制[J];軟件學(xué)報(bào);2008年02期
,本文編號(hào):1665898
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1665898.html