模糊XML文檔與模糊DTD相似性研究
【圖文】:
用基于“隸屬度和可能性分布”的模糊XML文檔的表示模型[8].在這個模型中,一個元素可以有相關(guān)的隸屬度.元素的隸屬度意味著成為其父親的孩子節(jié)點的可能性.而元素的屬性值可以用概率分布來表示,并且這些值可以是析取的,也可以是合取的.下面給出一個模糊XML文檔片段,如圖1所示.模糊XML文檔可以用樹形結(jié)構(gòu)來表示.按照DOM[9]模型,一個模糊XML文檔也可以表示為一個單根的有序標(biāo)簽樹,其中的節(jié)點對應(yīng)文檔中的元素和屬性.本文只比較樹的結(jié)構(gòu)相似性,所以省略元素和屬性的值.圖1中文檔的樹結(jié)構(gòu)如圖2所示.1.2模糊DTD及樹形表示模糊DTD作為模糊XML文檔的語法結(jié)構(gòu),描述了模糊XML文檔的結(jié)構(gòu)框架.與非模糊DTD不同的是,模糊DTD引入了模糊構(gòu)造子Dist,Val,Poss,Type.下面給出圖1中模糊XML文檔對應(yīng)的模糊DTD,如圖3所示.<collegeCName=“NEU”><ValPoss=0.8><departmentDName=“IST”><studentSID=“20130425”><age><DistType=“disjunctive”><ValPoss=0.8>26</Val><ValPoss=0.9>28</Val><ValPoss=0.8>29</Val></Dist></age><email><DistType=“conjunctive”><ValPoss=0.6>John@yahoo.com</Val><ValPoss=0.8>John@qq.com</Val><ValPoss=0.5>john@sina.com</Val></Dist></email></student></department></Val></college>圖1模糊XML文檔實例Fig.1SampleofafuzzyXMLdocument圖2模糊XML文檔樹實例Fig.2SampleofafuzzyXMLdocumenttree<!ELEMENTcollege(Val+)><!ATTLISTcollegeCNameIDREF#REQUIRED><!ELEMENTVal(department*)><!ATTLISTValPossCDATA“1.0”><!ELEMENTdepartment(student*)><!
與模糊XML文檔一樣,模糊DTD也可以用樹形結(jié)構(gòu)來表示.圖3中模糊DTD的樹結(jié)構(gòu)如圖4所示.圖4模糊DTD樹實例Fig.4SampleofafuzzyDTDtree2模糊DTD樹的轉(zhuǎn)換規(guī)則由于模糊DTD中包含基數(shù)約束和析取約束,所以無法將其直接與模糊XML文檔樹進行相似性比較,需要對這些約束條件進行轉(zhuǎn)換處理.2.1析取約束的轉(zhuǎn)換析取約束“|”,表示該符號前后元素或?qū)傩圆荒芡瑫r出現(xiàn),“|”即OR運算符.如果模糊DTD中包含“|”運算符,需要將其轉(zhuǎn)換為多個不包含“|”的DTD集合.例如:表達(dá)式<!ELEMENTa(b,(c|d))>可以分解為<!ELEMENTa(b,c))>和<!ELEMENTa(b,d)>兩個表達(dá)式,分別對應(yīng)兩個DTD.這一過程稱為析取分解過程.用規(guī)則1來表示.規(guī)則1:處理D中析取約束“|”,對“|”兩邊的元素或?qū)傩赃M行選擇,形成多個不包含“|”符號表達(dá)式的d,從而構(gòu)成DTD集合Dset,d為Dset中的DTD.特殊地,對于模糊構(gòu)造子Val,若該Val的父節(jié)點Dist下Type值為disjunctive,,表示Dist下的Val子樹是不能同時出現(xiàn)的,相當(dāng)于析取約束,即需要根據(jù)Type下的值判斷Dist下的Val子樹的個數(shù).因為Val下子樹表示的是屬性和它的值,一般地,各個子樹結(jié)構(gòu)是相同的.為了不增加將來相似性比較的復(fù)雜度,本文選擇只保留一個Val子樹.2.2基數(shù)約束的轉(zhuǎn)換規(guī)則模糊DTD中元素和屬性的基數(shù)約束“*”,“+”,“?”是用來說明所約束元素或?qū)傩缘目芍貜?fù)次數(shù).如果用e來表示元素或?qū)傩裕瑒te*表示e可以重復(fù)0到無限次,e+表示e可重復(fù)1次到無限次,e?表示e可重復(fù)0或1次.對于基數(shù)約束組合,可以用下面的原則來轉(zhuǎn)換,以達(dá)到簡化的目的.e++→e+,e**→e*,e*+→e*,e*?→e*,e?+→e*,e??→e?.也就是說,所有的基數(shù)約束組合最終都可以轉(zhuǎn)化為e*,e+,e?.需要
【作者單位】: 東北大學(xué)計算機科學(xué)與工程學(xué)院;渤海大學(xué)信息科學(xué)與技術(shù)學(xué)院;
【基金】:國家自然科學(xué)基金資助項目(61370075) 教育部新世紀(jì)優(yōu)秀人才支持計劃項目(NCET-05-0288)
【分類號】:TP311.1
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 陳曉鵬;XML讓辦公軟件更兼容[J];中國計算機用戶;2003年29期
2 張正強;論XML置標(biāo)語言在電子文件管理中的功能與作用[J];檔案學(xué)通訊;2004年04期
3 張昌宏;王曄;丁晟春;;基于XML的企業(yè)應(yīng)用集成方法研究[J];艦船電子工程;2005年06期
4 李瑞敏;陸化普;史其信;;基于XML的交通綜合信息平臺研究[J];交通與計算機;2006年03期
5 羅霜梅;姚躍華;;基于XML的分布式異構(gòu)數(shù)據(jù)庫“主存”實現(xiàn)[J];計算機與數(shù)字工程;2007年03期
6 王紅華;徐成杰;;基于XML技術(shù)的網(wǎng)絡(luò)實驗教學(xué)系統(tǒng)[J];大慶師范學(xué)院學(xué)報;2007年02期
7 孟偉東;;基于XML的企業(yè)管理信息系統(tǒng)[J];銅陵學(xué)院學(xué)報;2011年02期
8 趙金鈴;譚獻(xiàn)海;王亞蘭;何磊;;基于XML的分布式異構(gòu)數(shù)據(jù)庫變化捕捉及動態(tài)同步系統(tǒng)實現(xiàn)[J];鐵路計算機應(yīng)用;2013年10期
9 呂騰,閆萍,王真星;XML函數(shù)依賴及其與鍵的關(guān)系[J];小型微型計算機系統(tǒng);2005年09期
10 殷麗鳳;趙碩;;XML局部函數(shù)依賴[J];齊齊哈爾大學(xué)學(xué)報;2005年04期
相關(guān)會議論文 前10條
1 孫韶杰;李國輝;趙薇;王偉;;基于XML和多媒體的交互式電子技術(shù)手冊的設(shè)計和實現(xiàn)[A];第一屆建立和諧人機環(huán)境聯(lián)合學(xué)術(shù)會議(HHME2005)論文集[C];2005年
2 劉德喜;萬常選;劉喜平;焦賢沛;;XML檢索中的標(biāo)簽權(quán)重設(shè)置模型[A];NDBC2010第27屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集A輯二[C];2010年
3 蘇召;劉國華;;XML弱函數(shù)依賴及其可加性問題的研究[A];2006北京地區(qū)高校研究生學(xué)術(shù)交流會——通信與信息技術(shù)會議論文集(下)[C];2006年
4 唐敏;李昭原;;基于XML的Web數(shù)據(jù)庫工具的設(shè)計與實現(xiàn)[A];第十七屆全國數(shù)據(jù)庫學(xué)術(shù)會議論文集(研究報告篇)[C];2000年
5 羅道峰;孟小峰;;一種面向XML文檔的基于角色的擴展訪問控制方法[A];第十八屆全國數(shù)據(jù)庫學(xué)術(shù)會議論文集(研究報告篇)[C];2001年
6 周進剛;趙大哲;紀(jì)勇;;一種XML規(guī)則語言及其實現(xiàn)[A];全國第19屆計算機技術(shù)與應(yīng)用(CACIS)學(xué)術(shù)會議論文集(下冊)[C];2008年
7 金峰;陶曉鵬;胡運發(fā);;XML函數(shù)約束規(guī)則的自動挖掘[A];第二十屆全國數(shù)據(jù)庫學(xué)術(shù)會議論文集(技術(shù)報告篇)[C];2003年
8 李東;張靜玲;王亮明;;一種XML集成索引結(jié)構(gòu)[A];第二十三屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(技術(shù)報告篇)[C];2006年
9 胡華全;吳玲達(dá);鄧?yán)颦?;基于XML的交互式動畫劇本生成系統(tǒng)[A];第18屆全國多媒體學(xué)術(shù)會議(NCMT2009)、第5屆全國人機交互學(xué)術(shù)會議(CHCI2009)、第5屆全國普適計算學(xué)術(shù)會議(PCC2009)論文集[C];2009年
10 韓哲;王宏志;高宏;李建中;駱吉洲;;基于聚簇的XML文檔近似連接方法[A];第26屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(B輯)[C];2009年
相關(guān)重要報紙文章 前3條
1 ;解密XML安全標(biāo)準(zhǔn)(上)[N];網(wǎng)絡(luò)世界;2007年
2 郝崢嶸;XML服務(wù)數(shù)據(jù)深度利用[N];中國計算機報;2006年
3 李建華 周榮 李麗華;XML與數(shù)據(jù)庫[N];計算機世界;2003年
相關(guān)博士學(xué)位論文 前4條
1 簡(王爭)峰;基于XML的異構(gòu)產(chǎn)品信息網(wǎng)上交換、檢索技術(shù)研究與應(yīng)用[D];浙江大學(xué);2002年
2 樸勇;基于XML的文本結(jié)構(gòu)信息抽取與聚類研究[D];大連理工大學(xué);2014年
3 王桐;XML內(nèi)容路由關(guān)鍵技術(shù)研究[D];哈爾濱工程大學(xué);2006年
4 向桂林;XML引擎研究[D];中國科學(xué)院研究生院(文獻(xiàn)情報中心);2004年
相關(guān)碩士學(xué)位論文 前10條
1 王海平;XML集成方法的研究[D];東北大學(xué);2013年
2 佟玲;基于XML的任務(wù)流編輯器的設(shè)計與實現(xiàn)[D];沈陽師范大學(xué);2016年
3 郭玉珂;XML面向?qū)ο髷?shù)據(jù)模型研究及應(yīng)用[D];中南大學(xué);2005年
4 朱治國;基于XML的異構(gòu)構(gòu)件庫群協(xié)同檢索中間層模型[D];哈爾濱工程大學(xué);2007年
5 邱朋;XML函數(shù)依賴的傳播與保持的研究[D];山東大學(xué);2008年
6 張憶;基于XML的頻繁模式發(fā)現(xiàn)研究[D];合肥工業(yè)大學(xué);2006年
7 蘇召;XML弱函數(shù)依賴與單依賴集合的研究[D];燕山大學(xué);2007年
8 呂慧;基于開源平臺和XML技術(shù)的網(wǎng)絡(luò)考試系統(tǒng)的研究[D];西南交通大學(xué);2002年
9 楊悅欣;基于XML技術(shù)的設(shè)施農(nóng)業(yè)信息平臺的研究[D];陜西科技大學(xué);2006年
10 徐凱;基于XML用戶界面管理系統(tǒng)的研究及應(yīng)用[D];遼寧師范大學(xué);2008年
本文編號:2526985
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2526985.html