天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 碩博論文 > 信息類碩士論文 >

XML文檔聚類研究與應(yīng)用

發(fā)布時(shí)間:2020-09-01 15:58
   XML(e Xtensible Markup Language)是因特網(wǎng)中信息描述、傳輸和交換的重要標(biāo)準(zhǔn),而XML文檔聚類是眾多XML文檔整合和管理技術(shù)中關(guān)注的焦點(diǎn),其目標(biāo)是有效整合XML文檔使之便于存儲(chǔ)和傳輸。相似度計(jì)算則是XML文檔聚類的關(guān)鍵步驟,而傳統(tǒng)XML文檔相似度計(jì)算方法中,樹編輯距離算法時(shí)間復(fù)雜度較高,元素比較法丟失文檔結(jié)構(gòu)特性,邊與路徑比較法過于局限,擴(kuò)展性差,而向量空間計(jì)算法雖計(jì)算簡(jiǎn)便,但多數(shù)算法因其特征權(quán)重設(shè)定導(dǎo)致無法完整保留文檔結(jié)構(gòu)特性。論文著眼于XML文檔的特征權(quán)重設(shè)定,分別從相似度計(jì)算和聚類算法選擇兩方面進(jìn)行研究,并取得了如下成果:1、論文研究了計(jì)算XML文檔相似度的pq-gram算法。XML文檔的結(jié)點(diǎn)在不同XML文檔樹中所處層次以及本層次中位置都會(huì)有所不同,而這些不同正是XML文檔結(jié)構(gòu)特性的一種體現(xiàn),但pq-gram算法在提取pq-gram時(shí)未考慮這一點(diǎn)。鑒于此,論文提出了一種新的帶權(quán)pq-gram算法,通過全面考慮XML文檔樹中結(jié)點(diǎn)的層次及位置,結(jié)合其父節(jié)點(diǎn)所處的位置,為XML文檔結(jié)點(diǎn)以及pq-gram設(shè)計(jì)了全新的權(quán)重設(shè)定方法,并在權(quán)重設(shè)定的基礎(chǔ)上改進(jìn)了其相似度計(jì)算方法。最后通過聚類算法對(duì)三個(gè)真實(shí)數(shù)據(jù)集進(jìn)行聚類,比較聚類精度的優(yōu)劣以及各聚類簇之間的相似度。2、在此基礎(chǔ)上,論文進(jìn)一步研究了常見的XML文檔特征向量提取方法,發(fā)現(xiàn)大多數(shù)特征提取算法只是針對(duì)XML文檔結(jié)構(gòu)特性對(duì)特征進(jìn)行權(quán)重設(shè)定,未考慮各特征之間是存在偏好關(guān)系的。事實(shí)上,XML聚類不能完全通過結(jié)點(diǎn)在XML文檔中的層次來判定它對(duì)于聚類的重要性。論文在此基礎(chǔ)上研究了基于特征偏好的聚類(Clustering with feature order preference,CFP)算法。論文在帶權(quán)pq-gram算法對(duì)XML文檔進(jìn)行特征向量提取的基礎(chǔ)上,結(jié)合CFP算法,提出了基于特征偏好的XML文檔聚類(CXFP)算法。CXFP算法可結(jié)合pq-gram權(quán)重以及特征偏好權(quán)重兩個(gè)方面,并利用CFP算法的特點(diǎn),在聚類過程中動(dòng)態(tài)調(diào)整特征偏好權(quán)重。實(shí)驗(yàn)表明CXFP算法通過加入了特征偏好,可顯著提高聚類的精度。3、分析了當(dāng)前國(guó)內(nèi)機(jī)場(chǎng)噪聲現(xiàn)狀,并介紹了對(duì)其分析研究的必要性,在此基礎(chǔ)上,將CXFP算法應(yīng)用于機(jī)場(chǎng)噪聲數(shù)據(jù)的聚類中,根據(jù)不同的聚類需求為數(shù)據(jù)特征設(shè)定偏好權(quán)重,實(shí)驗(yàn)結(jié)果表明,CXFP算法較之其他聚類算法可以取得較優(yōu)的聚類效果。
【學(xué)位單位】:南京航空航天大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位年份】:2015
【中圖分類】:TP391.1

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 劉遠(yuǎn)超;王曉龍;徐志明;關(guān)毅;;文檔聚類綜述[J];中文信息學(xué)報(bào);2006年03期

2 王曉東;郭雷;方俊;楊寧;鄧濤;;一種基于本體的抽象度可調(diào)文檔聚類[J];計(jì)算機(jī)工程與應(yīng)用;2007年29期

3 王李冬;魏寶剛;袁杰;;基于概率主題模型的文檔聚類[J];電子學(xué)報(bào);2012年11期

4 王升明,李淼;一種基于改進(jìn)的自組織特征映射網(wǎng)絡(luò)的文檔聚類方法[J];計(jì)算機(jī)工程與應(yīng)用;2005年03期

5 孫永林;劉仲;;基于動(dòng)態(tài)區(qū)間映射的文檔聚類算法[J];計(jì)算機(jī)科學(xué);2010年06期

6 陳媛媛;屈志毅;張恒龍;廖紹雯;;一種初值優(yōu)化的K-均值文檔聚類算法(英文)[J];江西師范大學(xué)學(xué)報(bào)(自然科學(xué)版);2008年02期

7 孫霞;張玉生;;基于模式元素的文檔聚類方法研究[J];常熟理工學(xué)院學(xué)報(bào);2012年08期

8 宋江春,沈鈞毅,宋擒豹;一個(gè)基于關(guān)聯(lián)規(guī)則的多層文檔聚類算法[J];計(jì)算機(jī)應(yīng)用;2005年07期

9 趙衛(wèi)中;馬慧芳;李志清;史忠植;;一種結(jié)合主動(dòng)學(xué)習(xí)的半監(jiān)督文檔聚類算法[J];軟件學(xué)報(bào);2012年06期

10 吳景嵐,劉燕,朱文興;一個(gè)K-均值文檔聚類的改進(jìn)算法[J];閩江學(xué)院學(xué)報(bào);2004年02期

相關(guān)會(huì)議論文 前10條

1 唐國(guó)瑜;夏云慶;張民;鄭方;;基于跨語言廣義向量空間模型的跨語言文檔聚類方法[A];中國(guó)計(jì)算語言學(xué)研究前沿進(jìn)展(2009-2011)[C];2011年

2 周水庚;孫敬宇;胡運(yùn)發(fā);;一種文檔聚類新方法[A];第十六屆全國(guó)數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集[C];1999年

3 劉眾奇;袁曉潔;張海威;楊娜;王敏輝;;閾值區(qū)間:一種基于XCLS和XCLSE的改進(jìn)方案[A];第二十五屆中國(guó)數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(二)[C];2008年

4 原福永;楊治秋;王海霞;;一種基于向量空間模型的文檔聚類算法研究[A];第十二屆全國(guó)信號(hào)處理學(xué)術(shù)年會(huì)(CCSP-2005)論文集[C];2005年

5 王曉宇;錢衛(wèi)寧;張龍;周傲英;;XML DTD文檔聚類研究[A];第十八屆全國(guó)數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2001年

6 馬輝民;李衛(wèi)華;;Web文檔聚類系統(tǒng)的實(shí)現(xiàn)方法探析[A];第10屆計(jì)算機(jī)模擬與信息技術(shù)會(huì)議論文集[C];2005年

7 伍賽;楊冬青;韓近強(qiáng);張銘;王文清;馮英;;WCM:一種基于單詞相關(guān)度的文檔聚類新方法[A];第二十一屆中國(guó)數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2004年

8 李文波;孫樂;;在查詢反饋中改善文檔聚類效果的策略研究[A];NCIRCS2004第一屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2004年

9 劉振鹿;王大玲;馮時(shí);張一飛;方東昊;;一種基于LDA的潛在語義區(qū)劃分及Web文檔聚類算法[A];第六屆全國(guó)信息檢索學(xué)術(shù)會(huì)議論文集[C];2010年

10 汪洋;張磊;章毅;;基于短語匹配的中文Web文檔聚類算法[A];第二屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議(NCIRCS-2005)論文集[C];2005年

相關(guān)博士學(xué)位論文 前5條

1 楊劍鋒;適合并行的無干預(yù)文檔聚類算法研究[D];武漢大學(xué);2010年

2 劉銘;大規(guī)模文檔聚類中若干關(guān)鍵問題的研究[D];哈爾濱工業(yè)大學(xué);2010年

3 楊瑞龍;基于短語特征的Web文檔聚類方法研究[D];重慶大學(xué);2010年

4 丁鐵楠;XML文檔聚類及其評(píng)估問題研究[D];吉林大學(xué);2015年

5 周

本文編號(hào):2809944


資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/2809944.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶c5e7b***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com
日韩精品免费一区二区三区| 精品日韩欧美一区久久| 欧美又大又黄刺激视频| 欧美丰满大屁股一区二区三区| 白白操白白在线免费观看| 99国产高清不卡视频| 91欧美亚洲视频在线| 欧美乱妇日本乱码特黄大片| 邻居人妻人公侵犯人妻视频| 亚洲天堂久久精品成人| 日本高清不卡在线一区| 久久国产亚洲精品赲碰热| 亚洲精品熟女国产多毛| 日韩欧美三级中文字幕| 国产中文字幕一二三区| 国产视频一区二区三区四区| 欧美老太太性生活大片| 99精品国产一区二区青青 | 在线懂色一区二区三区精品| 国产日产欧美精品视频| 日本高清不卡在线一区| 亚洲国产av在线观看一区| 亚洲欧美日韩色图七区| 久久99一本色道亚洲精品| 麻豆一区二区三区精品视频| 欧美区一区二区在线观看| 中国少妇精品偷拍视频 | 99久久国产精品亚洲| 亚洲一区二区三区熟女少妇| 久久精品a毛片看国产成人| 欧美精品激情视频一区| 欧美日韩一区二区午夜| 91精品国产品国语在线不卡| 亚洲欧美国产中文色妇| 亚洲高清亚洲欧美一区二区| 久久国产青偷人人妻潘金莲| 国产一区二区三区口爆在线| 国产真人无遮挡免费视频一区| 欧美二区视频在线观看| 亚洲欧美日韩国产成人| 精品女同一区二区三区|