領(lǐng)域Web數(shù)據(jù)庫(kù)查詢(xún)接口的自動(dòng)發(fā)現(xiàn)
本文選題:Web數(shù)據(jù)庫(kù) 切入點(diǎn):查詢(xún)接口 出處:《江西師范大學(xué)學(xué)報(bào)(自然科學(xué)版)》2008年02期
【摘要】:由于Deep Web查詢(xún)接口的自動(dòng)發(fā)現(xiàn)是獲取Deep Web信息的基礎(chǔ),提出了基于搜索引擎的表單發(fā)現(xiàn)方法和基于語(yǔ)義相似度的查詢(xún)表單判定方法.該文首先定義了查詢(xún)表單的特征的表示方法,然后自動(dòng)提取樣本查詢(xún)接口的特征并將其中的文字特征進(jìn)行組合提交給搜索引擎以實(shí)現(xiàn)查詢(xún)表單的搜索,最后基于語(yǔ)義相似度和字面相似度的方法判定搜索表單和樣本表單之間的相似度,并由此判定是否是WDB的查詢(xún)接口.實(shí)驗(yàn)證明該文方法具有良好的可行性和實(shí)用性,為深入研究Deep Web提供了良好的條件.
[Abstract]:Because the automatic discovery of Deep Web query interface is the basis of obtaining Deep Web information, This paper proposes a search engine based form discovery method and a semantic similarity based query list decision method. Then the features of the sample query interface are automatically extracted and the text features are combined and submitted to the search engine to realize the search of the query list. Finally, the method based on semantic similarity and literal similarity is used to determine the similarity between the search form and the sample form, and then to determine whether it is the query interface of WDB. It provides a good condition for the further study of Deep Web.
【作者單位】: 山東財(cái)政學(xué)院計(jì)算機(jī)學(xué)院 山東財(cái)政學(xué)院計(jì)算機(jī)學(xué)院
【基金】:山東財(cái)政學(xué)院博士科研啟動(dòng)基金(07BSJJ13) 山東財(cái)政學(xué)院科研基金資助項(xiàng)目
【分類(lèi)號(hào)】:TP311.13
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 劉偉;孟小峰;孟衛(wèi)一;;Deep Web數(shù)據(jù)集成研究綜述[J];計(jì)算機(jī)學(xué)報(bào);2007年09期
2 劉偉;孟小峰;凌妍妍;;一種基于圖模型的Web數(shù)據(jù)庫(kù)采樣方法[J];軟件學(xué)報(bào);2008年02期
3 趙朋朋;崔志明;高嶺;仲華;;關(guān)于中國(guó)Deep Web的規(guī)模、分布和結(jié)構(gòu)[J];小型微型計(jì)算機(jī)系統(tǒng);2007年10期
4 鮮學(xué)豐;方巍;趙朋朋;崔志明;胡鵬昱;;一種Deep Web數(shù)據(jù)源質(zhì)量評(píng)估模型[J];微電子學(xué)與計(jì)算機(jī);2008年10期
5 魯晶晶;左山;張亞濤;王學(xué)謙;;Deep Web數(shù)據(jù)源聚類(lèi)分類(lèi)算法研究[J];科技信息(學(xué)術(shù)研究);2008年30期
6 劉超;劉妍;;基于Deep Web數(shù)據(jù)查詢(xún)接口的抽取與集成[J];硅谷;2008年23期
7 王冉冉;王剛;黃青松;;基于Deep Web的信息采集系統(tǒng)[J];計(jì)算機(jī)技術(shù)與發(fā)展;2007年10期
8 周愛(ài)武;李玉梅;周閃閃;王寶銅;;基于返回結(jié)果的Deep Web查詢(xún)接口識(shí)別[J];計(jì)算機(jī)技術(shù)與發(fā)展;2009年07期
9 鮮學(xué)豐;趙朋朋;辛潔;方巍;崔志明;;基于領(lǐng)域樣本查詢(xún)的Deep Web數(shù)據(jù)庫(kù)分類(lèi)[J];微電子學(xué)與計(jì)算機(jī);2010年03期
10 王兵;王軻;;Deep Web數(shù)據(jù)源聚類(lèi)與分類(lèi)[J];計(jì)算機(jī)與現(xiàn)代化;2007年08期
相關(guān)會(huì)議論文 前10條
1 王英;左萬(wàn)利;彭濤;赫楓齡;彭釗;;特定領(lǐng)域Deep Web查詢(xún)接口的集成[A];第二十五屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(二)[C];2008年
2 陶然;江錦華;吳羽;陳剛;;基于樹(shù)合并的Deep Web查詢(xún)接口集成[A];第26屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(B輯)[C];2009年
3 梁浩;左萬(wàn)利;任斐;赫楓齡;;基于啟發(fā)式信息的Deep Web查詢(xún)接口屬性抽取[A];第26屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(B輯)[C];2009年
4 鮮學(xué)豐;方巍;趙朋朋;崔志明;胡鵬昱;;一種Deep Web數(shù)據(jù)源質(zhì)量評(píng)估模型[A];2008年全國(guó)開(kāi)放式分布與并行計(jì)算機(jī)學(xué)術(shù)會(huì)議論文集(下冊(cè))[C];2008年
5 蔡彪;廖聞劍;彭艷兵;;Deep Web數(shù)據(jù)集成和關(guān)鍵技術(shù)綜述[A];2009年研究生學(xué)術(shù)交流會(huì)通信與信息技術(shù)論文集[C];2009年
6 王英;左萬(wàn)利;王鑫;彭濤;;基于多分類(lèi)器的Deep Web入口發(fā)現(xiàn)[A];第六屆全國(guó)信息檢索學(xué)術(shù)會(huì)議論文集[C];2010年
7 余偉;李石君;洪輝;田建偉;;基于覆蓋關(guān)系的Deep Web數(shù)據(jù)源排名[A];第二十四屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2007年
8 王鐸;李文輝;公正;江琦;;深層網(wǎng)查詢(xún)接口的自動(dòng)集成[A];第26屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(B輯)[C];2009年
9 王英;左萬(wàn)利;王鑫;彭濤;;Deep Web查詢(xún)轉(zhuǎn)換研究[A];第六屆全國(guó)信息檢索學(xué)術(shù)會(huì)議論文集[C];2010年
10 方巍;胡鵬昱;趙朋朋;崔志明;;基于語(yǔ)義的Deep Web數(shù)據(jù)源自動(dòng)發(fā)現(xiàn)技術(shù)[A];2007年全國(guó)開(kāi)放式分布與并行計(jì)算機(jī)學(xué)術(shù)會(huì)議論文集(上冊(cè))[C];2007年
相關(guān)重要報(bào)紙文章 前10條
1 上海市桂林路418號(hào)華騰公司EC部 吳德柱;Web數(shù)據(jù)庫(kù)記錄[N];計(jì)算機(jī)世界;2000年
2 江蘇 王漢洲;溝通無(wú)極限[N];中國(guó)電腦教育報(bào);2002年
3 本報(bào)記者 仝仁;數(shù)據(jù)庫(kù)網(wǎng)聯(lián)服務(wù)[N];中國(guó)計(jì)算機(jī)報(bào);2001年
4 上海交通大學(xué)APEX數(shù)據(jù)和知識(shí)管理實(shí)驗(yàn)室 王昊奮邋俞勇;語(yǔ)義Web推動(dòng)下一代搜索[N];計(jì)算機(jī)世界;2007年
5 中國(guó)科學(xué)技術(shù)大學(xué)信息管理與決策科學(xué)系 張斯成;用ASP構(gòu)建音樂(lè)服務(wù)器[N];計(jì)算機(jī)世界;2000年
6 陳友梅、王宇;EBOD“軟”著陸[N];中國(guó)計(jì)算機(jī)報(bào);2003年
7 慰鵬飛;走進(jìn)編程之網(wǎng)絡(luò)篇(二)[N];江蘇經(jīng)濟(jì)報(bào);2001年
8 徐昊、陳友梅;IBM的軟件攻略[N];中國(guó)計(jì)算機(jī)報(bào);2003年
9 高雪娟;交通共用信息平臺(tái) 怎樣搶“攤”如何登“路”[N];中國(guó)計(jì)算機(jī)報(bào);2004年
10 ;中科軟保險(xiǎn)綜合業(yè)務(wù)系統(tǒng)解決方案[N];電腦商報(bào);2006年
相關(guān)博士學(xué)位論文 前10條
1 張慧斌;Deep Web查詢(xún)接口及查詢(xún)結(jié)果抽取研究[D];南開(kāi)大學(xué);2010年
2 王英;Deep Web數(shù)據(jù)集成關(guān)鍵技術(shù)研究[D];吉林大學(xué);2010年
3 梁浩;Deep Web信息集成架構(gòu)及相關(guān)問(wèn)題研究[D];吉林大學(xué);2010年
4 閆中敏;Deep Web數(shù)據(jù)獲取問(wèn)題研究[D];山東大學(xué);2010年
5 吳春明;Deep Web數(shù)據(jù)集成關(guān)鍵技術(shù)及其在農(nóng)業(yè)領(lǐng)域的應(yīng)用[D];西南大學(xué);2011年
6 田建偉;面向領(lǐng)域的高質(zhì)量Deep Web數(shù)據(jù)集成技術(shù)研究[D];武漢大學(xué);2010年
7 潘鵬;Deep Web查詢(xún)中的不確定性問(wèn)題研究[D];山東大學(xué);2010年
8 董永權(quán);Deep Web數(shù)據(jù)集成關(guān)鍵問(wèn)題研究[D];山東大學(xué);2010年
9 陳珂銳;基于本體演化的Deep Web數(shù)據(jù)抽取與注釋[D];吉林大學(xué);2011年
10 黃健斌;基于條件概率圖模型的Deep Web數(shù)據(jù)抽取與集成研究[D];西安電子科技大學(xué);2007年
相關(guān)碩士學(xué)位論文 前10條
1 陳雅冰;基于領(lǐng)域的Deep Web查詢(xún)接口抽取[D];華南理工大學(xué);2011年
2 韓亮;圖書(shū)領(lǐng)域Deep Web查詢(xún)接口集成研究[D];河北大學(xué);2010年
3 劉鴻飛;Deep Web查詢(xún)接口集成及搜索策略研究[D];河北大學(xué);2009年
4 朱會(huì)峰;Deep Web查詢(xún)接口模式抽取研究[D];吉林大學(xué);2011年
5 龔桂芬;基于查詢(xún)接口的Deep Web模式匹配方法研究[D];蘇州大學(xué);2011年
6 蔡麗麗;基于Web的網(wǎng)上測(cè)試系統(tǒng)[D];電子科技大學(xué);2004年
7 羅斐;基于本體的Deep Web數(shù)據(jù)源分類(lèi)和查詢(xún)接口模式抽取[D];南京航空航天大學(xué);2010年
8 葛平升;Web數(shù)據(jù)庫(kù)技術(shù)應(yīng)用研究與實(shí)現(xiàn)[D];西北工業(yè)大學(xué);2002年
9 陳丹;基于WEB數(shù)據(jù)庫(kù)的相關(guān)技術(shù)研究與實(shí)踐[D];哈爾濱理工大學(xué);2001年
10 鐘春芳;基于多Web數(shù)據(jù)庫(kù)數(shù)據(jù)集成的自動(dòng)瀏覽技術(shù)研究[D];福州大學(xué);2001年
,本文編號(hào):1679376
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1679376.html