XWord,一種針對(duì)交互式XML關(guān)鍵詞搜索的基本框架
本文關(guān)鍵詞: XML 關(guān)鍵詞檢索 XWord 出處:《計(jì)算機(jī)應(yīng)用與軟件》2012年11期 論文類型:期刊論文
【摘要】:XML關(guān)鍵詞搜索使用戶可以在不了解數(shù)據(jù)結(jié)構(gòu)的情況下從XML數(shù)據(jù)中檢索信息。之前的大部分XML關(guān)鍵詞搜索引擎都是采用一次性的方式來(lái)呈現(xiàn)搜索到的XML結(jié)果段,不能使用戶對(duì)結(jié)果進(jìn)行進(jìn)一步的優(yōu)化。在這些情況下,由于關(guān)鍵詞查詢存在歧義,如何時(shí)刻保證搜索引擎準(zhǔn)確地返回所需信息就十分重要了。提出了一種新的XML關(guān)鍵詞搜索引擎XWord,該引擎為有效用戶交互提供全面支持,自動(dòng)返回單元認(rèn)證及擁有靈活的匹配排序語(yǔ)義。XWord提供靈活的輸入方式,允許用戶對(duì)結(jié)果段進(jìn)行擴(kuò)展到鄰近的分段,并會(huì)給用戶有效的動(dòng)態(tài)查詢建議。XWord還有很好的自動(dòng)兼容性,可以在無(wú)需用戶干涉的情況下處理任意XML數(shù)據(jù),這一點(diǎn)對(duì)從大量異構(gòu)XML數(shù)據(jù)中檢索信息是非常重要的。最后給出大量的實(shí)驗(yàn)結(jié)果來(lái)展示XWord的有效性和效率。
[Abstract]:XML keyword search allows users to retrieve information from XML data without knowing the structure of the data. Most previous XML keyword search engines used a one-off approach to render the search. XML result segment. The result cannot be further optimized by the user. In these cases, the keyword query is ambiguous. It is very important to ensure that the search engine can return the required information accurately. A new XML keyword search engine XWordword is proposed, which provides comprehensive support for effective user interaction. Automatic return unit authentication and flexible matching sort semantics. Xword provides a flexible input that allows users to extend the result segments to adjacent segments. And will give the user effective dynamic query suggestion. Xword also has the very good automatic compatibility, can process any XML data without the user interference. This is very important for retrieving information from a large number of heterogeneous XML data. Finally, a large number of experimental results are given to demonstrate the effectiveness and efficiency of XWord.
【作者單位】: 復(fù)旦大學(xué)計(jì)算機(jī)科學(xué)技術(shù)學(xué)院;上海未來(lái)寬帶技術(shù)及應(yīng)用工程研究中心有限公司;
【基金】:上海市科委項(xiàng)目(10511516005,10dz1500107) 高等學(xué)校博士學(xué)科點(diǎn)專項(xiàng)科研基金項(xiàng)目(20100071120033)
【分類號(hào)】:TP391.3
【正文快照】: 0引言XML關(guān)鍵詞搜索為用戶提供了一個(gè)簡(jiǎn)單接口,使用戶可以在不了解數(shù)據(jù)模式的情況下從XML數(shù)據(jù)中檢索信息。此外,關(guān)鍵詞查詢比XPath或XQuery這些正式查詢表達(dá)式更容易公式化。因此XML關(guān)鍵詞搜索已成為一個(gè)熱點(diǎn)問(wèn)題。至今為止出現(xiàn)過(guò)的XML關(guān)鍵詞搜索引擎可以分為兩代。第一代(1G)
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 李恒;;元數(shù)據(jù)管理系統(tǒng)的研究與實(shí)現(xiàn)[J];電腦知識(shí)與技術(shù);2011年13期
2 謝峰;;雙XML模式在異構(gòu)數(shù)據(jù)交換中的應(yīng)用研究[J];黑龍江科技信息;2011年21期
3 顧錦江;;基于AS技術(shù)的計(jì)算機(jī)網(wǎng)絡(luò)虛擬實(shí)驗(yàn)的開(kāi)發(fā)[J];計(jì)算機(jī)應(yīng)用與軟件;2011年07期
4 周長(zhǎng)敏;唐型基;;XML技術(shù)在考試系統(tǒng)中的應(yīng)用研究[J];電腦知識(shí)與技術(shù);2011年23期
5 陳愛(ài)華;;基于XML和Web Service的異構(gòu)數(shù)據(jù)庫(kù)數(shù)據(jù)交換[J];武漢船舶職業(yè)技術(shù)學(xué)院學(xué)報(bào);2011年04期
6 黎娜;張慶吉;;移動(dòng)數(shù)據(jù)庫(kù)同步技術(shù)及其應(yīng)用[J];現(xiàn)代計(jì)算機(jī)(專業(yè)版);2011年10期
7 劉智琦;徐奕奕;;XML在電子商務(wù)中的應(yīng)用[J];黑龍江科技信息;2011年20期
8 朱興統(tǒng);許波;;一種基于粗糙集理論的XML數(shù)據(jù)挖掘模型[J];科學(xué)技術(shù)與工程;2011年20期
9 李傳良;;XML數(shù)據(jù)訪問(wèn)與數(shù)據(jù)傳輸優(yōu)化[J];科學(xué)之友;2011年16期
10 朱興統(tǒng);;基于DOM的XML文檔到關(guān)系數(shù)據(jù)庫(kù)的數(shù)據(jù)轉(zhuǎn)換方法[J];電腦知識(shí)與技術(shù);2011年13期
相關(guān)會(huì)議論文 前10條
1 劉喜平;萬(wàn)常選;劉德喜;;基于語(yǔ)義返回XML關(guān)鍵詞檢索結(jié)果[A];NDBC2010第27屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(B輯)[C];2010年
2 向永清;鄧志鴻;于航;高寧;;面向XML文檔的二級(jí)索引技術(shù)及其在XML關(guān)鍵詞檢索中的應(yīng)用研究[A];第26屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(B輯)[C];2009年
3 江騰蛟;萬(wàn)常選;;基于答案結(jié)點(diǎn)的XML文檔模糊檢索排序模型[A];第二十三屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2006年
4 李岷;王曉玲;周傲英;;CREX——基于緩存和預(yù)處理技術(shù)的XML檢索架構(gòu)[A];第二十一屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2004年
5 郭志懋;周傲英;;XML數(shù)據(jù)的在線過(guò)濾[A];第十九屆全國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2002年
6 何震瀛;李建中;王宏志;;XML數(shù)據(jù)的關(guān)系存儲(chǔ)[A];第十九屆全國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2002年
7 丁峰;王煜;姚延濤;沈鈞毅;;從XML模式到數(shù)據(jù)庫(kù)模式[A];第十八屆全國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2001年
8 談子敬;施伯樂(lè);;XML導(dǎo)出數(shù)據(jù)庫(kù)表的實(shí)現(xiàn)與應(yīng)用[A];第十八屆全國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2001年
9 羅道峰;孟小峰;;一種面向XML文檔的基于角色的擴(kuò)展訪問(wèn)控制方法[A];第十八屆全國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2001年
10 鄭駿;王焱;錢衛(wèi)寧;周傲英;;XML相似相關(guān)結(jié)構(gòu)庫(kù)的構(gòu)造及其應(yīng)用[A];第十九屆全國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2002年
相關(guān)重要報(bào)紙文章 前10條
1 北京郵電大學(xué) 張劍;XML技術(shù)預(yù)覽[N];計(jì)算機(jī)世界;2001年
2 湖北 張海;編程日日帖[N];電腦報(bào);2005年
3 北京郵電大學(xué) 張劍;XML技術(shù)入門[N];計(jì)算機(jī)世界;2001年
4 孤獨(dú)笑 烏咪;打造你的音樂(lè)萬(wàn)年歷(上)[N];電腦報(bào);2003年
5 譚嘯;盤活政府網(wǎng)站的信息資源[N];計(jì)算機(jī)世界;2006年
6 杭州商學(xué)院 徐建平;使用ASP訪問(wèn)XML文件[N];計(jì)算機(jī)世界;2001年
7 方正技術(shù)研究院XML中國(guó)論壇網(wǎng)(www.xml.net.cn 董欣;XML的語(yǔ)法[N];網(wǎng)絡(luò)世界;2000年
8 廣東 麥國(guó)恒;淺談應(yīng)用程序XP風(fēng)格的實(shí)現(xiàn)[N];電腦報(bào);2003年
9 陳立娜;互聯(lián)網(wǎng)上的圖像搜索引擎[N];網(wǎng)絡(luò)世界;2000年
10 本報(bào)記者 劉昕;云計(jì)算角逐人性化創(chuàng)新[N];國(guó)際商報(bào);2011年
相關(guān)博士學(xué)位論文 前10條
1 黎方正;關(guān)系數(shù)據(jù)庫(kù)的關(guān)鍵詞檢索技術(shù)研究[D];中南大學(xué);2010年
2 沈潔;基于自動(dòng)機(jī)的XML數(shù)據(jù)過(guò)濾研究[D];哈爾濱工程大學(xué);2010年
3 殷麗鳳;不完全信息環(huán)境下XML數(shù)據(jù)庫(kù)規(guī)范化問(wèn)題的研究[D];哈爾濱理工大學(xué);2009年
4 葉曉峰;基于XML的沖壓模具設(shè)計(jì)知識(shí)重用技術(shù)研究[D];華中科技大學(xué);2010年
5 張晨靜;XML關(guān)鍵字過(guò)濾技術(shù)[D];復(fù)旦大學(xué);2011年
6 郭永明;XML文檔交互式信息檢索技術(shù)研究[D];東華大學(xué);2010年
7 汪源;XML事務(wù)模型及并發(fā)控制研究[D];浙江大學(xué);2006年
8 許建軍;對(duì)結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù)的關(guān)鍵字搜索研究[D];復(fù)旦大學(xué);2007年
9 朱曉冬;數(shù)字博物館關(guān)鍵技術(shù)研究[D];西北大學(xué);2004年
10 陳亞華;企業(yè)應(yīng)用集成架構(gòu)研究與實(shí)現(xiàn)[D];復(fù)旦大學(xué);2005年
相關(guān)碩士學(xué)位論文 前10條
1 江靜;基于XML的公文管理系統(tǒng)設(shè)計(jì)與應(yīng)用研究[D];南京理工大學(xué);2005年
2 陳美云;基于XML的柔性信息集成技術(shù)研究[D];山東科技大學(xué);2005年
3 朱瑜;工作流引擎研究與實(shí)現(xiàn)[D];電子科技大學(xué);2005年
4 謝紅;XML技術(shù)和B/S模式在職業(yè)教育與培訓(xùn)管理信息系統(tǒng)中的應(yīng)用研究[D];重慶大學(xué);2005年
5 酈金花;基于XML的MARC發(fā)布系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];蘇州大學(xué);2005年
6 沈劍滄;XML查詢方法研究[D];華東師范大學(xué);2006年
7 艾麗軍;基于Web服務(wù)電子支付系統(tǒng)的研究與設(shè)計(jì)[D];南昌大學(xué);2005年
8 楊仲明;基于XML/SOAP的合同管理系統(tǒng)的應(yīng)用研究[D];四川大學(xué);2005年
9 朱鋒;異構(gòu)數(shù)據(jù)源集成中間件的設(shè)計(jì)與實(shí)現(xiàn)[D];蘇州大學(xué);2005年
10 閏偉;電子政務(wù)信息資源元數(shù)據(jù)庫(kù)的研究與應(yīng)用[D];東華大學(xué);2006年
,本文編號(hào):1451457
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1451457.html