一種快速的XML語(yǔ)義檢索算法
本文選題:XML文檔 + 語(yǔ)義檢索。 參考:《電子學(xué)報(bào)》2007年11期
【摘要】:傳統(tǒng)基于關(guān)鍵詞的搜索引擎不能充分利用XML文檔的結(jié)構(gòu)信息,搜索結(jié)果往往不精確;而基于結(jié)構(gòu)信息和關(guān)鍵詞的XML搜索技術(shù)又不適用于普通用戶(hù).基于關(guān)鍵詞的XML語(yǔ)義檢索克服了以上缺點(diǎn),但需要提高檢索效率.本文深入分析了XML文檔結(jié)構(gòu)潛藏的語(yǔ)義,提出了新的索引結(jié)構(gòu)及兩結(jié)點(diǎn)語(yǔ)義相關(guān)的判斷函數(shù),在此基礎(chǔ)上提出了一種快速的XML語(yǔ)義檢索算法,該算法大大減少了結(jié)點(diǎn)對(duì)語(yǔ)義相關(guān)的判斷次數(shù).對(duì)實(shí)際數(shù)據(jù)集的測(cè)試實(shí)驗(yàn)結(jié)果顯示出新算法的有效性.
[Abstract]:Traditional search engines based on keywords can not make full use of the structural information of XML documents, and the search results are often imprecise. However, the XML search technology based on structural information and keywords is not suitable for ordinary users.Keyword-based XML semantic retrieval overcomes the above shortcomings, but it needs to improve the retrieval efficiency.This paper analyzes the hidden semantics of XML document structure, proposes a new index structure and a two-node semantic correlation judgment function, and proposes a fast XML semantic retrieval algorithm.The algorithm greatly reduces the number of semantic correlation judgment.The experimental results on the actual data sets show the effectiveness of the new algorithm.
【作者單位】: 華北電力大學(xué)電子與通信工程系 華北電力大學(xué)電子與通信工程系
【分類(lèi)號(hào)】:TP312.2
【參考文獻(xiàn)】
相關(guān)博士學(xué)位論文 前1條
1 曲衛(wèi)民;中文XML信息檢索系統(tǒng)的研究[D];中國(guó)科學(xué)院研究生院(軟件研究所);2004年
相關(guān)碩士學(xué)位論文 前1條
1 郭永明;XML文檔檢索技術(shù)研究[D];太原理工大學(xué);2003年
【共引文獻(xiàn)】
相關(guān)期刊論文 前1條
1 鄒正宸;左春;;基于XML的客戶(hù)服務(wù)中心通用知識(shí)庫(kù)系統(tǒng)研究[J];計(jì)算機(jī)工程與設(shè)計(jì);2006年20期
相關(guān)博士學(xué)位論文 前1條
1 張曉琳;面向?qū)ο蟮腦ML數(shù)據(jù)管理技術(shù)研究[D];東北大學(xué);2006年
相關(guān)碩士學(xué)位論文 前8條
1 柴變芳;基于貝葉斯網(wǎng)絡(luò)的XML文檔檢索[D];河北大學(xué);2006年
2 何東彬;基于RDBMS的XML文檔檢索技術(shù)研究與實(shí)現(xiàn)[D];內(nèi)蒙古大學(xué);2006年
3 王曉燕;面向特定領(lǐng)域的需求獲取與分析技術(shù)研究[D];山東大學(xué);2006年
4 江騰蛟;XML文本文檔檢索技術(shù)研究[D];江西財(cái)經(jīng)大學(xué);2006年
5 田葉;基于XML文檔的語(yǔ)義檢索[D];華北電力大學(xué)(河北);2007年
6 宋春芳;基于緩沖的XML語(yǔ)義檢索系統(tǒng)研究與設(shè)計(jì)[D];山東大學(xué);2007年
7 陳金森;XML搜索引擎中索引技術(shù)的研究[D];燕山大學(xué);2006年
8 劉菁菁;基于結(jié)構(gòu)和主題的Web信息檢索研究[D];大連理工大學(xué);2007年
【二級(jí)參考文獻(xiàn)】
相關(guān)期刊論文 前1條
1 曲衛(wèi)民,孫樂(lè),孫玉芳;半結(jié)構(gòu)化中文信息檢索中查詢(xún)結(jié)果相關(guān)度算法的研究[J];中文信息學(xué)報(bào);2004年04期
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 林聯(lián)合,吳杰,吳亮;以成語(yǔ)為范圍的詞匯支援系統(tǒng)[J];中文信息學(xué)報(bào);1993年01期
2 朱強(qiáng);數(shù)字圖書(shū)館:21世紀(jì)圖書(shū)館的原型──美國(guó)“數(shù)字圖書(shū)館創(chuàng)始”計(jì)劃簡(jiǎn)介[J];大學(xué)圖書(shū)館學(xué)報(bào);1995年04期
3 劉細(xì)文;美實(shí)施數(shù)字圖書(shū)館(DL)研究計(jì)劃[J];情報(bào)理論與實(shí)踐;1995年03期
4 任公志;工智校對(duì)通(WIC)V2.0輔助功能介紹[J];科技與出版;1996年06期
5 葉文川;構(gòu)造未來(lái)Web頁(yè)面的工具語(yǔ)言──XML[J];電腦技術(shù);1998年08期
6 ;XML:Web標(biāo)記的第二次機(jī)會(huì)[J];個(gè)人電腦;1998年01期
7 ;用XML組織數(shù)據(jù)[J];個(gè)人電腦;1998年07期
8 張;W3C推出XQL[J];中國(guó)計(jì)算機(jī)用戶(hù);1998年48期
9 好兵;利用最新的XML語(yǔ)言制作CD目錄管理器[J];電腦;1999年12期
10 杰詩(shī);電子商務(wù)看好XML語(yǔ)言[J];中文信息;1999年Z1期
相關(guān)會(huì)議論文 前10條
1 諶志群;張國(guó)煊;;一個(gè)基于內(nèi)容的Web信息抽取方法[A];Advances in Computation of Oriental Languages--Proceedings of the 20th International Conference on Computer Processing of Oriental Languages[C];2003年
2 薛志軍;周學(xué)功;周湘;彭澄廉;;基于XML可配置IP庫(kù)的構(gòu)建[A];全國(guó)第13屆計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)(CAD/CG)學(xué)術(shù)會(huì)議論文集[C];2004年
3 高勇;荀恩東;宋柔;;構(gòu)造自然語(yǔ)言問(wèn)答系統(tǒng)平臺(tái)[A];第二屆全國(guó)學(xué)生計(jì)算語(yǔ)言學(xué)研討會(huì)論文集[C];2004年
4 張碩;姚志洪;;XML應(yīng)用于電子病案[A];第13屆全國(guó)病案管理學(xué)術(shù)會(huì)論文匯編[C];2004年
5 趙姍;李宏偉;藍(lán)士斌;;VC環(huán)境下利用DOM存取WebGIS中XML格式地圖數(shù)據(jù)[A];中國(guó)地理信息系統(tǒng)協(xié)會(huì)第八屆年會(huì)論文集[C];2004年
6 周駿;陳鳴;;在Matlab下實(shí)現(xiàn)SAX處理器[A];第一屆全國(guó)Web信息系統(tǒng)及其應(yīng)用會(huì)議(WISA2004)論文集[C];2004年
7 朱忠池;洪曉光;;利用DTD優(yōu)化XML遞歸查詢(xún)技術(shù)[A];第一屆全國(guó)Web信息系統(tǒng)及其應(yīng)用會(huì)議(WISA2004)論文集[C];2004年
8 崔巍;;基于XML的統(tǒng)一數(shù)據(jù)庫(kù)平臺(tái)的研究[A];第一屆全國(guó)Web信息系統(tǒng)及其應(yīng)用會(huì)議(WISA2004)論文集[C];2004年
9 付新;朱慶生;;動(dòng)態(tài)工作流系統(tǒng)結(jié)構(gòu)與應(yīng)用初探[A];’2004計(jì)算機(jī)應(yīng)用技術(shù)交流會(huì)議論文集[C];2004年
10 楊彬;洪曉光;;基于XML大文檔的動(dòng)態(tài)索引[A];’2004計(jì)算機(jī)應(yīng)用技術(shù)交流會(huì)議論文集[C];2004年
相關(guān)重要報(bào)紙文章 前10條
1 陳維義;HTML如何向XML遷移[N];中國(guó)計(jì)算機(jī)報(bào);2000年
2 笑;使XML程序編寫(xiě)更快[N];中國(guó)計(jì)算機(jī)報(bào);2000年
3 本報(bào)記者 龔杰;DB2通用數(shù)據(jù)庫(kù)奠基電子商務(wù)[N];計(jì)算機(jī)世界;2000年
4 四川大學(xué)計(jì)算機(jī)學(xué)院 陳華英;組建基于 Web 方式的數(shù)據(jù)倉(cāng)庫(kù)[N];網(wǎng)絡(luò)世界;2000年
5 方正技術(shù)研究院XML中國(guó)論壇網(wǎng)(www.xml.net.cn 董欣;XML的語(yǔ)法[N];網(wǎng)絡(luò)世界;2000年
6 ;WebGain整合Java開(kāi)發(fā)[N];中國(guó)計(jì)算機(jī)報(bào);2001年
7 北京郵電大學(xué) 張劍;XML技術(shù)入門(mén)[N];計(jì)算機(jī)世界;2001年
8 北京郵電大學(xué) 張劍;XML技術(shù)預(yù)覽[N];計(jì)算機(jī)世界;2001年
9 北京郵電大學(xué) 張劍;XML的顯示——XSL樣式單(上)[N];計(jì)算機(jī)世界;2001年
10 李磊 孫文兵;電子政務(wù)規(guī)范語(yǔ)言cngXML[N];計(jì)算機(jī)世界;2001年
相關(guān)博士學(xué)位論文 前10條
1 徐海淵;基于XML的動(dòng)態(tài)信息觸發(fā)機(jī)制的研究[D];中國(guó)人民解放軍國(guó)防科學(xué)技術(shù)大學(xué);2002年
2 徐振寧;基于本體的Web數(shù)據(jù)語(yǔ)義信息的表示與處理方法研究[D];中國(guó)人民解放軍國(guó)防科學(xué)技術(shù)大學(xué);2002年
3 胡勤友;Web上的多主體系統(tǒng)若干關(guān)鍵技術(shù)研究[D];復(fù)旦大學(xué);2003年
4 胥正川;基于關(guān)系數(shù)據(jù)庫(kù)的XML數(shù)據(jù)存儲(chǔ)、更新和檢索[D];復(fù)旦大學(xué);2003年
5 呂騰;XML文檔的規(guī)范化問(wèn)題研究[D];復(fù)旦大學(xué);2003年
6 路燕;基于多DTD的XML查詢(xún)技術(shù)研究[D];復(fù)旦大學(xué);2003年
7 李斕;面向XML文檔的訪問(wèn)控制研究[D];中國(guó)科學(xué)院研究生院(軟件研究所);2004年
8 向桂林;XML引擎研究[D];中國(guó)科學(xué)院研究生院(文獻(xiàn)情報(bào)中心);2004年
9 楊紅麗;XML家族語(yǔ)言語(yǔ)義研究[D];西北大學(xué);2003年
10 劉永丹;文檔數(shù)據(jù)庫(kù)若干關(guān)鍵技術(shù)研究[D];復(fù)旦大學(xué);2004年
相關(guān)碩士學(xué)位論文 前10條
1 羅思群;基于XML技術(shù)的數(shù)據(jù)轉(zhuǎn)換[D];中國(guó)科學(xué)院軟件研究所;2001年
2 張晉;基于XML的動(dòng)態(tài)站點(diǎn)應(yīng)用研究[D];華北工學(xué)院;2001年
3 余露;科技論文DTD的設(shè)計(jì)及其XML文檔生成[D];蘇州大學(xué);2001年
4 劉寶;基于Web Services的動(dòng)態(tài)電子商務(wù)模型的研究[D];浙江大學(xué);2002年
5 劉靖僑;XML文檔對(duì)象模型持久化在OSCAR中的實(shí)現(xiàn)及查詢(xún)轉(zhuǎn)換[D];浙江大學(xué);2002年
6 王照岳;XML查詢(xún)處理技術(shù)研究與實(shí)現(xiàn)[D];浙江大學(xué);2002年
7 岳樺;OFFICE軟件網(wǎng)絡(luò)考試系統(tǒng)[D];北方工業(yè)大學(xué);2002年
8 劉雅麗;基于XML的通用商業(yè)單據(jù)數(shù)據(jù)轉(zhuǎn)換系統(tǒng)[D];北京工業(yè)大學(xué);2002年
9 康玲;基于.NET組件技術(shù)的遠(yuǎn)程教學(xué)系統(tǒng)的設(shè)計(jì)及實(shí)現(xiàn)[D];新疆大學(xué);2002年
10 苗軍;Unicode/XML在電子出版物中的實(shí)現(xiàn)[D];河北工業(yè)大學(xué);2002年
,本文編號(hào):1774219
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1774219.html