天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 軟件論文 >

基于LDA聚類的語義Web服務發(fā)現

發(fā)布時間:2017-09-24 00:33

  本文關鍵詞:基于LDA聚類的語義Web服務發(fā)現


  更多相關文章: Web服務發(fā)現 狄利克雷分布 聚類 語義Web服務


【摘要】:隨著互聯網與分布式技術的快速發(fā)展,面向服務的體系結構(SOA)得到了學術界和工業(yè)界的青睞和廣泛應用。作為一種基于互聯網標準和XML規(guī)范的新型分布式計算模型和實現SOA的主要技術,Web服務已成為當前研究的熱點。隨著互聯網上Web服務數量的指數型增長,如何從龐大的Web服務中有效地獲得滿足需求功能的Web服務?如何在功能相似的Web服務中找到用戶最滿意的服務?這些難以解決的問題,正是Web服務發(fā)現的研究內容。目前常見的Web服務發(fā)現方法主要有基于邏輯的方法、基于非邏輯的方法和基于混合的方法。其中基于邏輯的方法依賴于推理機和推理規(guī)則的完整性,雖然準確性較高,但是靈活性和可行性較差;而基于非邏輯的方法很難確定一個合適的相似度計算函數,并且相似度計算函數的優(yōu)劣也很難保證;基于混合的方法能夠充分取長補短,且有很多實驗證明混合方法具有明顯的效果。本文在已有工作的基礎上,提出了一種基于LDA聚類的語義Web服務發(fā)現方法,也是一種混合的Web服務發(fā)現方法。即首先對OWL-S Web服務文檔解析,得到文檔詞匯向量;然后對文檔詞匯向量進行擴充,使文檔語義信息更加豐富;再對文檔擴充詞匯向量集合建模,并進行訓練和推斷,得到文檔-主題分布,并對Web服務文檔聚類;最后通過查找Web服務請求記錄或者直接在簇中查找滿足需求的Web服務。論文的主要工作包括:(1)文檔解析。提出了一種新穎的文檔解析方法,即首先對OWL-S文檔進行解析得到服務名稱、服務描述、輸入和輸出四個關鍵信息,然后對服務名稱和服務描述進行去停用詞、詞性還原等處理得到文檔詞匯向量。為了豐富文檔語義信息,解析OWL-S文檔對應的本體OWL文件,得到輸入輸出概念的等價類、父類、祖先類、子類、后代類等相關本體類概念,加入文檔詞匯向量,并且利用WordNet和Word2Vec對處理后的文檔詞匯向量查找相似度較高的詞匯,再加入其中,最后合并所有詞匯向量,得到擴充文檔詞匯向量。擴充后的文檔詞匯向量具有豐富的語義信息。(2)文檔聚類。實現一種基于概率主題模型的文檔聚類方法,即首先對擴充后的文檔詞匯向量集合建立LDA主題模型,并使用Gibbs采樣算法進行訓練和推斷得到文檔-主題分布,基于此,對文檔使用本文提出的LKMSIMPClustering聚類算法,對所有文檔進行聚類,得到Web服務簇集合。(3)請求查詢。實現了一種輕量級的Web服務請求查詢,即首先查找備忘錄DB模塊中是否存在對應的Web服務請求記錄,若存在,直接返回查詢結果,若不存在,則需要查找Web服務簇中最相關的簇,并在這個簇中匹配滿足相似度閾值的Web服務集,作為Web服務發(fā)現的結果。(4)系統(tǒng)開發(fā)和實驗評估。完成了基于LDA聚類的語義Web發(fā)現系統(tǒng)的開發(fā),針對OWLS-TC4和hRESTS-TC3_release2這兩個服務數據集(有1083個服務和42個查詢請求)進行了充分的實驗,并與現有工作在準確率、召回率、F值以及效率等方面進行了對比。實驗結果表明:本系統(tǒng)比傳統(tǒng)的基于TFIDF的VSM方法在準確率、召回率和F值方面分別高出13.52%、37.37%和30.47%,并且系統(tǒng)的性能也更加好。我們對準確率、召回率和F值進行了顯著性驗證,并通過一個實例完整演示了Web服務的發(fā)現過程。
【關鍵詞】:Web服務發(fā)現 狄利克雷分布 聚類 語義Web服務
【學位授予單位】:南京大學
【學位級別】:碩士
【學位授予年份】:2016
【分類號】:TP391.1;TP393.09
【目錄】:
  • 摘要5-7
  • ABSTRACT7-11
  • 第一章 引言11-17
  • 1.1 研究背景11-12
  • 1.2 研究現狀12-14
  • 1.3 研究內容14-16
  • 1.4 論文結構16-17
  • 第二章 相關技術概述17-23
  • 2.1 Web服務概述17-18
  • 2.1.1 Web服務與SOA17
  • 2.1.2 Web服務體系結構17-18
  • 2.1.3 Web服務核心技術18
  • 2.2 語義Web相關技術概述18-20
  • 2.2.1 語義Web體系結構18-19
  • 2.2.2 本體19-20
  • 2.2.3 本體描述語言和OWL20
  • 2.3 語義Web服務20-22
  • 2.3.1 語義Web服務描述20-21
  • 2.3.2 語義Web服務發(fā)現21-22
  • 2.4 Web服務聚類22
  • 2.5 本章小結22-23
  • 第三章 Web服務解析和語義擴充23-34
  • 3.1 OWL-S文檔的解析和處理24-25
  • 3.2 Web服務描述語義擴充25-29
  • 3.2.1 解析OWL本體文檔25-26
  • 3.2.2 使用WordNet擴充服務描述語義26-28
  • 3.2.3 使用Word2Vec擴充服務描述語義28-29
  • 3.3 LDA主題模型和Gibbs采樣29-33
  • 3.3.1 LDA主題模型29-31
  • 3.3.2 Gibbs采樣31-33
  • 3.4 本章小結33-34
  • 第四章 語義Web服務的聚類和發(fā)現34-41
  • 4.1 文檔相似度度量方法35-36
  • 4.2 語義Web服務聚類36-37
  • 4.3 語義Web服務發(fā)現37-40
  • 4.3.1 備忘錄DB模塊37-39
  • 4.3.2 Web服務匹配模塊39-40
  • 4.4 本章小結40-41
  • 第五章 實驗分析41-57
  • 5.1 研究問題和實驗目的41
  • 5.2 評價指標41-43
  • 5.2.1 Web服務聚類評價指標42
  • 5.2.2 Web服務發(fā)現評價指標42-43
  • 5.3 實驗數據和環(huán)境43-45
  • 5.3.1 實驗數據43-44
  • 5.3.2 實驗環(huán)境44-45
  • 5.4 實驗結果及分析45-53
  • 5.4.1 語義Web服務聚類實驗分析45-46
  • 5.4.2 語義Web服務發(fā)現實驗分析46-53
  • 5.5 案例分析53-55
  • 5.6 本章小結55-57
  • 第六章 總結與展望57-60
  • 6.1 本文總結57-58
  • 6.2 未來展望58-60
  • 參考文獻60-65
  • 致謝65-66
  • 攻讀碩士學位期間主要的研究成果66-67

【相似文獻】

中國期刊全文數據庫 前7條

1 賴裕平;周亞建;丁洪偉;郭玉翠;郭春;楊義先;;混合逆狄利克雷分布的變分學習及應用[J];電子學報;2014年07期

2 溫臘;芮建武;何婷婷;郭亮;;利用并行GPU對分層分布式狄利克雷分布算法加速[J];計算機應用;2013年12期

3 余傳明;張小青;陳雷;;基于LDA模型的評論熱點挖掘:原理與實現[J];情報理論與實踐;2010年05期

4 陳廣福;蔡國永;林航;王瑞麗;劉國賓;;多Agent系統(tǒng)中基于狄利克雷分布的信任模型[J];計算機工程;2011年14期

5 王旭仁;姚葉鵬;冉春風;何發(fā)鎂;;一種并行LDA主題模型建立方法研究[J];北京理工大學學報;2013年06期

6 張彭成;翟玉慶;;基于可信機制的云服務提供商選擇模型[J];南京師范大學學報(工程技術版);2013年02期

7 ;[J];;年期

中國重要會議論文全文數據庫 前1條

1 林琛;汪衛(wèi);;Web論壇上的垃圾貼過濾[A];第26屆中國數據庫學術會議論文集(B輯)[C];2009年

中國碩士學位論文全文數據庫 前4條

1 曹賴平;基于LDA聚類的語義Web服務發(fā)現[D];南京大學;2016年

2 李云之;基于文本分析的標簽推薦研究及實現[D];北京郵電大學;2012年

3 黃海魂;基于用戶概貌和評分序列的混合托攻擊檢測[D];重慶大學;2014年

4 陳陽平;基于概率生成主題模型的圖像場景分類方法研究[D];西安電子科技大學;2014年

,

本文編號:908364

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/908364.html


Copyright(c)文論論文網All Rights Reserved | 網站地圖 |

版權申明:資料由用戶ac060***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com