基于語義相似度和信息量的Web服務(wù)標(biāo)簽優(yōu)化
本文關(guān)鍵詞: Web服務(wù) 相似度計(jì)算 標(biāo)簽 語義相似度 信息量 出處:《鄭州大學(xué)》2014年碩士論文 論文類型:學(xué)位論文
【摘要】:隨著云計(jì)算技術(shù)的飛速發(fā)展,Web服務(wù)作為其關(guān)鍵技術(shù)之一被廣泛應(yīng)用,,互聯(lián)網(wǎng)上可用Web服務(wù)數(shù)量快速增長,因此如何快速準(zhǔn)確定位Web服務(wù),實(shí)現(xiàn)服務(wù)發(fā)現(xiàn)和組合變得十分必要和困難。 目前網(wǎng)絡(luò)上發(fā)布的Web服務(wù)多基于WSDL進(jìn)行描述,因此如何有效利用WSDL進(jìn)行服務(wù)發(fā)現(xiàn)顯得尤為重要。由于WSDL缺乏對Web服務(wù)的語義描述,存在相似度匹配準(zhǔn)確率低的問題,而且很多WSDL文檔結(jié)構(gòu)缺乏規(guī)范性,現(xiàn)有Web服務(wù)相似度計(jì)算方法不能夠有效滿足需求。Web服務(wù)標(biāo)簽是用戶向Web服務(wù)添加的描述其功能或?qū)傩缘年P(guān)鍵詞,它可以向Web服務(wù)提供額外的信息,彌補(bǔ)WSDL提供信息不足的問題,從而提高Web服務(wù)相似度匹配的準(zhǔn)確率,進(jìn)而改善服務(wù)發(fā)現(xiàn)、服務(wù)組合和服務(wù)聚類等,然而目前不準(zhǔn)確甚至錯(cuò)誤的無效標(biāo)簽比例較高,影響了服務(wù)相似度匹配的質(zhì)量。 針對當(dāng)前WSDL結(jié)構(gòu)描述缺乏規(guī)范性和描述Web服務(wù)的無效標(biāo)簽比例較高的問題,本文提出一個(gè)Web服務(wù)標(biāo)簽優(yōu)化模型WS-TOM,該模型分為Web服務(wù)相似度計(jì)算和Web服務(wù)標(biāo)簽優(yōu)化兩個(gè)模塊。在Web服務(wù)相似度計(jì)算模塊,首先分析了大量的WSDL文檔,給出一種考慮到編程風(fēng)格和命名規(guī)范的特征提取方案,用于Web服務(wù)相似度計(jì)算;在Web服務(wù)標(biāo)簽優(yōu)化模塊,給出了一個(gè)標(biāo)簽排名算法,通過綜合標(biāo)簽與WSDL的語義相似度和標(biāo)簽的信息量來對標(biāo)簽進(jìn)行排名,然后根據(jù)冪律分布的規(guī)律,過濾不準(zhǔn)確的標(biāo)簽,從而降低其負(fù)面影響。實(shí)驗(yàn)結(jié)果及分析驗(yàn)證了WS-TOM模型的有效性,Web服務(wù)相似度計(jì)算方法在WSDL結(jié)構(gòu)不規(guī)范的情況下能夠良好執(zhí)行并能一定程度上提高相似度匹配的準(zhǔn)確率;Web服務(wù)標(biāo)簽優(yōu)化能夠過濾不準(zhǔn)確的標(biāo)簽,進(jìn)一步提高了Web服務(wù)匹配的準(zhǔn)確率。
[Abstract]:With the rapid development of cloud computing technology, web services are widely used as one of its key technologies, and the number of Web services available on the Internet is growing rapidly, so how to locate Web services quickly and accurately? It is necessary and difficult to realize service discovery and composition. At present, most of the Web services published on the network are described on the basis of WSDL, so it is very important to use WSDL effectively for service discovery. Due to the lack of semantic description of Web services in WSDL, there is a problem of low similarity matching accuracy. Moreover, many WSDL document structures are not standardized, and the existing Web service similarity calculation methods can not effectively meet the requirements. The web service label is the key word that users add to the Web service to describe its function or attribute. It can provide additional information to Web services, make up for the insufficient information provided by WSDL, improve the accuracy of similarity matching of Web services, and then improve service discovery, service composition and service clustering, etc. However, the proportion of invalid tags is high, which affects the quality of service similarity matching. In view of the lack of standardization in the description of current WSDL structure and the high proportion of invalid tags describing Web services, This paper presents a Web service label optimization model WS-TOM, which is divided into two modules: Web service similarity calculation and Web service label optimization. In the Web service similarity calculation module, a large number of WSDL documents are first analyzed. This paper presents a feature extraction scheme considering programming style and naming specification, which is used to calculate the similarity of Web services, and gives a label ranking algorithm in the Web service label optimization module. The label is ranked by synthesizing the semantic similarity between tag and WSDL and the information of tag, and then the inaccurate label is filtered according to the law of power law distribution. Experimental results and analysis show that the effectiveness of the WS-TOM model can be well implemented in the case of non-standard WSDL structure and can improve the accuracy of similarity matching to a certain extent. Accuracy rate Web service label optimization can filter out inaccurate tags, The accuracy of Web service matching is further improved.
【學(xué)位授予單位】:鄭州大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2014
【分類號】:TP393.09
【參考文獻(xiàn)】
相關(guān)期刊論文 前10條
1 上超望;趙呈領(lǐng);劉清堂;王艷鳳;;組合Web服務(wù)訪問控制技術(shù)研究綜述[J];計(jì)算機(jī)科學(xué);2011年10期
2 連宇;彭進(jìn)業(yè);謝紅梅;馮曉毅;;基于Google與KL距離的概念相關(guān)度算法[J];計(jì)算機(jī)工程;2011年19期
3 鄧水光;尹建偉;李瑩;吳健;吳朝暉;;基于二分圖匹配的語義Web服務(wù)發(fā)現(xiàn)方法[J];計(jì)算機(jī)學(xué)報(bào);2008年08期
4 歐偉杰;曾承;項(xiàng)小明;彭智勇;李德毅;;基于概念松弛的高效Web服務(wù)查詢方法[J];計(jì)算機(jī)學(xué)報(bào);2011年12期
5 傅德勝;周辰;;基于密度的改進(jìn)K均值算法及實(shí)現(xiàn)[J];計(jì)算機(jī)應(yīng)用;2011年02期
6 原福永;張曉彩;羅思標(biāo);;基于信息熵的精確屬性賦權(quán)K-means聚類算法[J];計(jì)算機(jī)應(yīng)用;2011年06期
7 李文清;孫新;張常有;馮燁;;一種本體概念的語義相似度計(jì)算方法[J];自動化學(xué)報(bào);2012年02期
8 王玨;向朝參;王萌;田暢;趙文棟;代登坡;;語義Web服務(wù)發(fā)現(xiàn)研究現(xiàn)狀與發(fā)展[J];計(jì)算機(jī)應(yīng)用研究;2013年01期
9 岳昆,王曉玲,周傲英;Web服務(wù)核心支撐技術(shù):研究綜述[J];軟件學(xué)報(bào);2004年03期
10 孫吉貴;劉杰;趙連宇;;聚類算法研究[J];軟件學(xué)報(bào);2008年01期
本文編號:1529081
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/1529081.html