天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 軟件論文 >

基于LDA聚類的語義Web服務(wù)發(fā)現(xiàn)

發(fā)布時(shí)間:2017-09-24 00:33

  本文關(guān)鍵詞:基于LDA聚類的語義Web服務(wù)發(fā)現(xiàn)


  更多相關(guān)文章: Web服務(wù)發(fā)現(xiàn) 狄利克雷分布 聚類 語義Web服務(wù)


【摘要】:隨著互聯(lián)網(wǎng)與分布式技術(shù)的快速發(fā)展,面向服務(wù)的體系結(jié)構(gòu)(SOA)得到了學(xué)術(shù)界和工業(yè)界的青睞和廣泛應(yīng)用。作為一種基于互聯(lián)網(wǎng)標(biāo)準(zhǔn)和XML規(guī)范的新型分布式計(jì)算模型和實(shí)現(xiàn)SOA的主要技術(shù),Web服務(wù)已成為當(dāng)前研究的熱點(diǎn)。隨著互聯(lián)網(wǎng)上Web服務(wù)數(shù)量的指數(shù)型增長(zhǎng),如何從龐大的Web服務(wù)中有效地獲得滿足需求功能的Web服務(wù)?如何在功能相似的Web服務(wù)中找到用戶最滿意的服務(wù)?這些難以解決的問題,正是Web服務(wù)發(fā)現(xiàn)的研究?jī)?nèi)容。目前常見的Web服務(wù)發(fā)現(xiàn)方法主要有基于邏輯的方法、基于非邏輯的方法和基于混合的方法。其中基于邏輯的方法依賴于推理機(jī)和推理規(guī)則的完整性,雖然準(zhǔn)確性較高,但是靈活性和可行性較差;而基于非邏輯的方法很難確定一個(gè)合適的相似度計(jì)算函數(shù),并且相似度計(jì)算函數(shù)的優(yōu)劣也很難保證;基于混合的方法能夠充分取長(zhǎng)補(bǔ)短,且有很多實(shí)驗(yàn)證明混合方法具有明顯的效果。本文在已有工作的基礎(chǔ)上,提出了一種基于LDA聚類的語義Web服務(wù)發(fā)現(xiàn)方法,也是一種混合的Web服務(wù)發(fā)現(xiàn)方法。即首先對(duì)OWL-S Web服務(wù)文檔解析,得到文檔詞匯向量;然后對(duì)文檔詞匯向量進(jìn)行擴(kuò)充,使文檔語義信息更加豐富;再對(duì)文檔擴(kuò)充詞匯向量集合建模,并進(jìn)行訓(xùn)練和推斷,得到文檔-主題分布,并對(duì)Web服務(wù)文檔聚類;最后通過查找Web服務(wù)請(qǐng)求記錄或者直接在簇中查找滿足需求的Web服務(wù)。論文的主要工作包括:(1)文檔解析。提出了一種新穎的文檔解析方法,即首先對(duì)OWL-S文檔進(jìn)行解析得到服務(wù)名稱、服務(wù)描述、輸入和輸出四個(gè)關(guān)鍵信息,然后對(duì)服務(wù)名稱和服務(wù)描述進(jìn)行去停用詞、詞性還原等處理得到文檔詞匯向量。為了豐富文檔語義信息,解析OWL-S文檔對(duì)應(yīng)的本體OWL文件,得到輸入輸出概念的等價(jià)類、父類、祖先類、子類、后代類等相關(guān)本體類概念,加入文檔詞匯向量,并且利用WordNet和Word2Vec對(duì)處理后的文檔詞匯向量查找相似度較高的詞匯,再加入其中,最后合并所有詞匯向量,得到擴(kuò)充文檔詞匯向量。擴(kuò)充后的文檔詞匯向量具有豐富的語義信息。(2)文檔聚類。實(shí)現(xiàn)一種基于概率主題模型的文檔聚類方法,即首先對(duì)擴(kuò)充后的文檔詞匯向量集合建立LDA主題模型,并使用Gibbs采樣算法進(jìn)行訓(xùn)練和推斷得到文檔-主題分布,基于此,對(duì)文檔使用本文提出的LKMSIMPClustering聚類算法,對(duì)所有文檔進(jìn)行聚類,得到Web服務(wù)簇集合。(3)請(qǐng)求查詢。實(shí)現(xiàn)了一種輕量級(jí)的Web服務(wù)請(qǐng)求查詢,即首先查找備忘錄DB模塊中是否存在對(duì)應(yīng)的Web服務(wù)請(qǐng)求記錄,若存在,直接返回查詢結(jié)果,若不存在,則需要查找Web服務(wù)簇中最相關(guān)的簇,并在這個(gè)簇中匹配滿足相似度閾值的Web服務(wù)集,作為Web服務(wù)發(fā)現(xiàn)的結(jié)果。(4)系統(tǒng)開發(fā)和實(shí)驗(yàn)評(píng)估。完成了基于LDA聚類的語義Web發(fā)現(xiàn)系統(tǒng)的開發(fā),針對(duì)OWLS-TC4和hRESTS-TC3_release2這兩個(gè)服務(wù)數(shù)據(jù)集(有1083個(gè)服務(wù)和42個(gè)查詢請(qǐng)求)進(jìn)行了充分的實(shí)驗(yàn),并與現(xiàn)有工作在準(zhǔn)確率、召回率、F值以及效率等方面進(jìn)行了對(duì)比。實(shí)驗(yàn)結(jié)果表明:本系統(tǒng)比傳統(tǒng)的基于TFIDF的VSM方法在準(zhǔn)確率、召回率和F值方面分別高出13.52%、37.37%和30.47%,并且系統(tǒng)的性能也更加好。我們對(duì)準(zhǔn)確率、召回率和F值進(jìn)行了顯著性驗(yàn)證,并通過一個(gè)實(shí)例完整演示了Web服務(wù)的發(fā)現(xiàn)過程。
【關(guān)鍵詞】:Web服務(wù)發(fā)現(xiàn) 狄利克雷分布 聚類 語義Web服務(wù)
【學(xué)位授予單位】:南京大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:TP391.1;TP393.09
【目錄】:
  • 摘要5-7
  • ABSTRACT7-11
  • 第一章 引言11-17
  • 1.1 研究背景11-12
  • 1.2 研究現(xiàn)狀12-14
  • 1.3 研究?jī)?nèi)容14-16
  • 1.4 論文結(jié)構(gòu)16-17
  • 第二章 相關(guān)技術(shù)概述17-23
  • 2.1 Web服務(wù)概述17-18
  • 2.1.1 Web服務(wù)與SOA17
  • 2.1.2 Web服務(wù)體系結(jié)構(gòu)17-18
  • 2.1.3 Web服務(wù)核心技術(shù)18
  • 2.2 語義Web相關(guān)技術(shù)概述18-20
  • 2.2.1 語義Web體系結(jié)構(gòu)18-19
  • 2.2.2 本體19-20
  • 2.2.3 本體描述語言和OWL20
  • 2.3 語義Web服務(wù)20-22
  • 2.3.1 語義Web服務(wù)描述20-21
  • 2.3.2 語義Web服務(wù)發(fā)現(xiàn)21-22
  • 2.4 Web服務(wù)聚類22
  • 2.5 本章小結(jié)22-23
  • 第三章 Web服務(wù)解析和語義擴(kuò)充23-34
  • 3.1 OWL-S文檔的解析和處理24-25
  • 3.2 Web服務(wù)描述語義擴(kuò)充25-29
  • 3.2.1 解析OWL本體文檔25-26
  • 3.2.2 使用WordNet擴(kuò)充服務(wù)描述語義26-28
  • 3.2.3 使用Word2Vec擴(kuò)充服務(wù)描述語義28-29
  • 3.3 LDA主題模型和Gibbs采樣29-33
  • 3.3.1 LDA主題模型29-31
  • 3.3.2 Gibbs采樣31-33
  • 3.4 本章小結(jié)33-34
  • 第四章 語義Web服務(wù)的聚類和發(fā)現(xiàn)34-41
  • 4.1 文檔相似度度量方法35-36
  • 4.2 語義Web服務(wù)聚類36-37
  • 4.3 語義Web服務(wù)發(fā)現(xiàn)37-40
  • 4.3.1 備忘錄DB模塊37-39
  • 4.3.2 Web服務(wù)匹配模塊39-40
  • 4.4 本章小結(jié)40-41
  • 第五章 實(shí)驗(yàn)分析41-57
  • 5.1 研究問題和實(shí)驗(yàn)?zāi)康?/span>41
  • 5.2 評(píng)價(jià)指標(biāo)41-43
  • 5.2.1 Web服務(wù)聚類評(píng)價(jià)指標(biāo)42
  • 5.2.2 Web服務(wù)發(fā)現(xiàn)評(píng)價(jià)指標(biāo)42-43
  • 5.3 實(shí)驗(yàn)數(shù)據(jù)和環(huán)境43-45
  • 5.3.1 實(shí)驗(yàn)數(shù)據(jù)43-44
  • 5.3.2 實(shí)驗(yàn)環(huán)境44-45
  • 5.4 實(shí)驗(yàn)結(jié)果及分析45-53
  • 5.4.1 語義Web服務(wù)聚類實(shí)驗(yàn)分析45-46
  • 5.4.2 語義Web服務(wù)發(fā)現(xiàn)實(shí)驗(yàn)分析46-53
  • 5.5 案例分析53-55
  • 5.6 本章小結(jié)55-57
  • 第六章 總結(jié)與展望57-60
  • 6.1 本文總結(jié)57-58
  • 6.2 未來展望58-60
  • 參考文獻(xiàn)60-65
  • 致謝65-66
  • 攻讀碩士學(xué)位期間主要的研究成果66-67

【相似文獻(xiàn)】

中國(guó)期刊全文數(shù)據(jù)庫(kù) 前7條

1 賴裕平;周亞建;丁洪偉;郭玉翠;郭春;楊義先;;混合逆狄利克雷分布的變分學(xué)習(xí)及應(yīng)用[J];電子學(xué)報(bào);2014年07期

2 溫臘;芮建武;何婷婷;郭亮;;利用并行GPU對(duì)分層分布式狄利克雷分布算法加速[J];計(jì)算機(jī)應(yīng)用;2013年12期

3 余傳明;張小青;陳雷;;基于LDA模型的評(píng)論熱點(diǎn)挖掘:原理與實(shí)現(xiàn)[J];情報(bào)理論與實(shí)踐;2010年05期

4 陳廣福;蔡國(guó)永;林航;王瑞麗;劉國(guó)賓;;多Agent系統(tǒng)中基于狄利克雷分布的信任模型[J];計(jì)算機(jī)工程;2011年14期

5 王旭仁;姚葉鵬;冉春風(fēng);何發(fā)鎂;;一種并行LDA主題模型建立方法研究[J];北京理工大學(xué)學(xué)報(bào);2013年06期

6 張彭成;翟玉慶;;基于可信機(jī)制的云服務(wù)提供商選擇模型[J];南京師范大學(xué)學(xué)報(bào)(工程技術(shù)版);2013年02期

7 ;[J];;年期

中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前1條

1 林琛;汪衛(wèi);;Web論壇上的垃圾貼過濾[A];第26屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(B輯)[C];2009年

中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前4條

1 曹賴平;基于LDA聚類的語義Web服務(wù)發(fā)現(xiàn)[D];南京大學(xué);2016年

2 李云之;基于文本分析的標(biāo)簽推薦研究及實(shí)現(xiàn)[D];北京郵電大學(xué);2012年

3 黃;;基于用戶概貌和評(píng)分序列的混合托攻擊檢測(cè)[D];重慶大學(xué);2014年

4 陳陽平;基于概率生成主題模型的圖像場(chǎng)景分類方法研究[D];西安電子科技大學(xué);2014年

,

本文編號(hào):908364

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/908364.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶ac060***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com
日韩女优视频国产一区| 厕所偷拍一区二区三区视频| 日韩国产中文在线视频| 欧美二区视频在线观看| 中国一区二区三区人妻| 在线视频免费看你懂的| 国产视频福利一区二区| 国产三级欧美三级日韩三级| 国产又猛又黄又粗又爽无遮挡| 日韩熟妇人妻一区二区三区 | 日本在线不卡高清欧美| 中文字幕人妻一区二区免费| 国产二级一级内射视频播放| 亚洲中文在线男人的天堂| 欧美特色特黄一级大黄片| 又色又爽又黄的三级视频| 久久99青青精品免费| 日韩午夜老司机免费视频| 亚洲第一区欧美日韩在线| 中国一区二区三区人妻| 日本在线高清精品人妻| 欧美成人久久久免费播放| 国产中文字幕久久黄色片| 国产一区一一一区麻豆| 99久免费精品视频在线观| 伊人天堂午夜精品草草网| 少妇高潮呻吟浪语91| 国产亚州欧美一区二区| 日韩中文无线码在线视频| 五月婷日韩中文字幕四虎| 大香蕉再在线大香蕉再在线| 爱在午夜降临前在线观看| 激情五月天深爱丁香婷婷| 成人午夜激情在线免费观看| 少妇人妻一级片一区二区三区| 欧美亚洲美女资源国产| 精品人妻精品一区二区三区| 美女被草的视频在线观看| 国产亚洲精品岁国产微拍精品| 懂色一区二区三区四区| 国产一区麻豆水好多高潮|