一種快速的XML語義檢索算法
本文選題:XML文檔 + 語義檢索; 參考:《電子學報》2007年11期
【摘要】:傳統(tǒng)基于關鍵詞的搜索引擎不能充分利用XML文檔的結構信息,搜索結果往往不精確;而基于結構信息和關鍵詞的XML搜索技術又不適用于普通用戶.基于關鍵詞的XML語義檢索克服了以上缺點,但需要提高檢索效率.本文深入分析了XML文檔結構潛藏的語義,提出了新的索引結構及兩結點語義相關的判斷函數(shù),在此基礎上提出了一種快速的XML語義檢索算法,該算法大大減少了結點對語義相關的判斷次數(shù).對實際數(shù)據集的測試實驗結果顯示出新算法的有效性.
[Abstract]:Traditional search engines based on keywords can not make full use of the structural information of XML documents, and the search results are often imprecise. However, the XML search technology based on structural information and keywords is not suitable for ordinary users.Keyword-based XML semantic retrieval overcomes the above shortcomings, but it needs to improve the retrieval efficiency.This paper analyzes the hidden semantics of XML document structure, proposes a new index structure and a two-node semantic correlation judgment function, and proposes a fast XML semantic retrieval algorithm.The algorithm greatly reduces the number of semantic correlation judgment.The experimental results on the actual data sets show the effectiveness of the new algorithm.
【作者單位】: 華北電力大學電子與通信工程系 華北電力大學電子與通信工程系
【分類號】:TP312.2
【參考文獻】
相關博士學位論文 前1條
1 曲衛(wèi)民;中文XML信息檢索系統(tǒng)的研究[D];中國科學院研究生院(軟件研究所);2004年
相關碩士學位論文 前1條
1 郭永明;XML文檔檢索技術研究[D];太原理工大學;2003年
【共引文獻】
相關期刊論文 前1條
1 鄒正宸;左春;;基于XML的客戶服務中心通用知識庫系統(tǒng)研究[J];計算機工程與設計;2006年20期
相關博士學位論文 前1條
1 張曉琳;面向對象的XML數(shù)據管理技術研究[D];東北大學;2006年
相關碩士學位論文 前8條
1 柴變芳;基于貝葉斯網絡的XML文檔檢索[D];河北大學;2006年
2 何東彬;基于RDBMS的XML文檔檢索技術研究與實現(xiàn)[D];內蒙古大學;2006年
3 王曉燕;面向特定領域的需求獲取與分析技術研究[D];山東大學;2006年
4 江騰蛟;XML文本文檔檢索技術研究[D];江西財經大學;2006年
5 田葉;基于XML文檔的語義檢索[D];華北電力大學(河北);2007年
6 宋春芳;基于緩沖的XML語義檢索系統(tǒng)研究與設計[D];山東大學;2007年
7 陳金森;XML搜索引擎中索引技術的研究[D];燕山大學;2006年
8 劉菁菁;基于結構和主題的Web信息檢索研究[D];大連理工大學;2007年
【二級參考文獻】
相關期刊論文 前1條
1 曲衛(wèi)民,孫樂,孫玉芳;半結構化中文信息檢索中查詢結果相關度算法的研究[J];中文信息學報;2004年04期
【相似文獻】
相關期刊論文 前10條
1 林聯(lián)合,吳杰,吳亮;以成語為范圍的詞匯支援系統(tǒng)[J];中文信息學報;1993年01期
2 朱強;數(shù)字圖書館:21世紀圖書館的原型──美國“數(shù)字圖書館創(chuàng)始”計劃簡介[J];大學圖書館學報;1995年04期
3 劉細文;美實施數(shù)字圖書館(DL)研究計劃[J];情報理論與實踐;1995年03期
4 任公志;工智校對通(WIC)V2.0輔助功能介紹[J];科技與出版;1996年06期
5 葉文川;構造未來Web頁面的工具語言──XML[J];電腦技術;1998年08期
6 ;XML:Web標記的第二次機會[J];個人電腦;1998年01期
7 ;用XML組織數(shù)據[J];個人電腦;1998年07期
8 張;W3C推出XQL[J];中國計算機用戶;1998年48期
9 好兵;利用最新的XML語言制作CD目錄管理器[J];電腦;1999年12期
10 杰詩;電子商務看好XML語言[J];中文信息;1999年Z1期
相關會議論文 前10條
1 諶志群;張國煊;;一個基于內容的Web信息抽取方法[A];Advances in Computation of Oriental Languages--Proceedings of the 20th International Conference on Computer Processing of Oriental Languages[C];2003年
2 薛志軍;周學功;周湘;彭澄廉;;基于XML可配置IP庫的構建[A];全國第13屆計算機輔助設計與圖形學(CAD/CG)學術會議論文集[C];2004年
3 高勇;荀恩東;宋柔;;構造自然語言問答系統(tǒng)平臺[A];第二屆全國學生計算語言學研討會論文集[C];2004年
4 張碩;姚志洪;;XML應用于電子病案[A];第13屆全國病案管理學術會論文匯編[C];2004年
5 趙姍;李宏偉;藍士斌;;VC環(huán)境下利用DOM存取WebGIS中XML格式地圖數(shù)據[A];中國地理信息系統(tǒng)協(xié)會第八屆年會論文集[C];2004年
6 周駿;陳鳴;;在Matlab下實現(xiàn)SAX處理器[A];第一屆全國Web信息系統(tǒng)及其應用會議(WISA2004)論文集[C];2004年
7 朱忠池;洪曉光;;利用DTD優(yōu)化XML遞歸查詢技術[A];第一屆全國Web信息系統(tǒng)及其應用會議(WISA2004)論文集[C];2004年
8 崔巍;;基于XML的統(tǒng)一數(shù)據庫平臺的研究[A];第一屆全國Web信息系統(tǒng)及其應用會議(WISA2004)論文集[C];2004年
9 付新;朱慶生;;動態(tài)工作流系統(tǒng)結構與應用初探[A];’2004計算機應用技術交流會議論文集[C];2004年
10 楊彬;洪曉光;;基于XML大文檔的動態(tài)索引[A];’2004計算機應用技術交流會議論文集[C];2004年
相關重要報紙文章 前10條
1 陳維義;HTML如何向XML遷移[N];中國計算機報;2000年
2 笑;使XML程序編寫更快[N];中國計算機報;2000年
3 本報記者 龔杰;DB2通用數(shù)據庫奠基電子商務[N];計算機世界;2000年
4 四川大學計算機學院 陳華英;組建基于 Web 方式的數(shù)據倉庫[N];網絡世界;2000年
5 方正技術研究院XML中國論壇網(www.xml.net.cn 董欣;XML的語法[N];網絡世界;2000年
6 ;WebGain整合Java開發(fā)[N];中國計算機報;2001年
7 北京郵電大學 張劍;XML技術入門[N];計算機世界;2001年
8 北京郵電大學 張劍;XML技術預覽[N];計算機世界;2001年
9 北京郵電大學 張劍;XML的顯示——XSL樣式單(上)[N];計算機世界;2001年
10 李磊 孫文兵;電子政務規(guī)范語言cngXML[N];計算機世界;2001年
相關博士學位論文 前10條
1 徐海淵;基于XML的動態(tài)信息觸發(fā)機制的研究[D];中國人民解放軍國防科學技術大學;2002年
2 徐振寧;基于本體的Web數(shù)據語義信息的表示與處理方法研究[D];中國人民解放軍國防科學技術大學;2002年
3 胡勤友;Web上的多主體系統(tǒng)若干關鍵技術研究[D];復旦大學;2003年
4 胥正川;基于關系數(shù)據庫的XML數(shù)據存儲、更新和檢索[D];復旦大學;2003年
5 呂騰;XML文檔的規(guī)范化問題研究[D];復旦大學;2003年
6 路燕;基于多DTD的XML查詢技術研究[D];復旦大學;2003年
7 李斕;面向XML文檔的訪問控制研究[D];中國科學院研究生院(軟件研究所);2004年
8 向桂林;XML引擎研究[D];中國科學院研究生院(文獻情報中心);2004年
9 楊紅麗;XML家族語言語義研究[D];西北大學;2003年
10 劉永丹;文檔數(shù)據庫若干關鍵技術研究[D];復旦大學;2004年
相關碩士學位論文 前10條
1 羅思群;基于XML技術的數(shù)據轉換[D];中國科學院軟件研究所;2001年
2 張晉;基于XML的動態(tài)站點應用研究[D];華北工學院;2001年
3 余露;科技論文DTD的設計及其XML文檔生成[D];蘇州大學;2001年
4 劉寶;基于Web Services的動態(tài)電子商務模型的研究[D];浙江大學;2002年
5 劉靖僑;XML文檔對象模型持久化在OSCAR中的實現(xiàn)及查詢轉換[D];浙江大學;2002年
6 王照岳;XML查詢處理技術研究與實現(xiàn)[D];浙江大學;2002年
7 岳樺;OFFICE軟件網絡考試系統(tǒng)[D];北方工業(yè)大學;2002年
8 劉雅麗;基于XML的通用商業(yè)單據數(shù)據轉換系統(tǒng)[D];北京工業(yè)大學;2002年
9 康玲;基于.NET組件技術的遠程教學系統(tǒng)的設計及實現(xiàn)[D];新疆大學;2002年
10 苗軍;Unicode/XML在電子出版物中的實現(xiàn)[D];河北工業(yè)大學;2002年
,本文編號:1774219
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1774219.html