一種基于Wiki和WordNet的Web服務(wù)目標(biāo)知識(shí)擴(kuò)充方法
【圖文】:
鉖?Arabshian等[11]提出LexOnt,一種用于Programma-bleWeb的半自動(dòng)的本體構(gòu)建工具.對(duì)于ProgrammableWeb上API所屬的類別,首先通過Wiki查找該類別的信息,進(jìn)而獲取結(jié)果頁(yè)面中根據(jù)TF-IDF排名較高的詞匯,然后通過Word-Net獲取其同義詞.在我們的研究中,把Wiki作為擴(kuò)充服務(wù)目標(biāo)知識(shí)的信息源,通過Wiki獲取用戶請(qǐng)求或者服務(wù)目標(biāo)的相關(guān)描述信息,使用Lucene分詞技術(shù)以及WordNet中提供的動(dòng)詞、名詞、同義詞、上為詞、下位詞等查找方法,基于獲取的描述信息對(duì)服務(wù)目標(biāo)知識(shí)進(jìn)行擴(kuò)充.3兩階段的服務(wù)目標(biāo)知識(shí)擴(kuò)充方法圖1給出了基于Wiki和WordNet的兩階段的服務(wù)目標(biāo)知識(shí)擴(kuò)充框架.在第一階段,根據(jù)我們的前期工作[5]中得到的特定領(lǐng)域內(nèi)服務(wù)目標(biāo)集,針對(duì)每個(gè)服務(wù)目標(biāo)中的動(dòng)詞和名詞,從Wiki上搜索信息,得到相關(guān)描述文檔,然后通過Lucene和WordNet進(jìn)行預(yù)處理,得到初始擴(kuò)展的目標(biāo)列表.在此基礎(chǔ)上,通過WordNet進(jìn)行詞匯間的相似度計(jì)算,根據(jù)設(shè)定的閾值對(duì)初始擴(kuò)展得到的目標(biāo)列表進(jìn)行過濾,得到過濾后的目標(biāo)列表.在第二階段,根據(jù)WordNet中詞匯間的關(guān)系,對(duì)過濾后的目標(biāo)列表進(jìn)行二次擴(kuò)充,然后由領(lǐng)域?qū)<覍?duì)此階段得到的目標(biāo)集進(jìn)行補(bǔ)充完善,得到最終的擴(kuò)充后的服務(wù)目標(biāo)集.下面將詳細(xì)闡述兩階段的服務(wù)目標(biāo)知識(shí)擴(kuò)充方法.圖1兩階段的服務(wù)目標(biāo)知識(shí)擴(kuò)充框架Fig.1Twostagesoftheservicegoalknowledgeexpansionframework3.1基于Wiki的服務(wù)目標(biāo)知識(shí)擴(kuò)充根據(jù)文獻(xiàn)[5]中定義2,領(lǐng)域服務(wù)目標(biāo)為一個(gè)五元組,但考慮到目標(biāo)的核心部分為動(dòng)-名詞對(duì),所以本文重點(diǎn)針對(duì)服務(wù)目標(biāo)中的動(dòng)詞和名詞進(jìn)行擴(kuò)充.對(duì)于從特定服務(wù)描述文檔中抽取的每個(gè)服務(wù)目標(biāo)中的名詞,從Wiki上進(jìn)行搜索.如下頁(yè)圖2所示,考慮到服務(wù)目標(biāo)的主體詞性一般為名詞,并且Wik
到的名詞列表進(jìn)行合并,得到過濾后的服務(wù)目標(biāo)中名詞的擴(kuò)展列表FGNAL(filteredgoalnounaugmentationlist).(注意:考慮到算法的執(zhí)行效率,這里不是直接計(jì)算IGNAL中的每個(gè)名詞與領(lǐng)域服務(wù)目標(biāo)集中每個(gè)名詞間的相似度,,而是針對(duì)上述兩種情況分別進(jìn)行處理.)圖2基于Wiki的服務(wù)目標(biāo)知識(shí)擴(kuò)充Fig.2ServicegoalknowledgeexpansionbasedonWiki類似的,對(duì)于每個(gè)服務(wù)目標(biāo)中的動(dòng)詞sgv,如果在Wiki上可以查到相關(guān)的信息,則可以得到過濾后的服務(wù)目標(biāo)中動(dòng)詞的擴(kuò)展列表FGVAL(filteredgoalverbaugmentationlist).如果服務(wù)目標(biāo)中的動(dòng)詞sgv在Wiki上查不到,則直接通過Word-Net中詞匯間關(guān)系對(duì)sgv進(jìn)行擴(kuò)充,具體見3.2.3.2基于WordNet的服務(wù)目標(biāo)知識(shí)擴(kuò)充WordNet中名詞、動(dòng)詞、形容詞和副詞分別被組織成一個(gè)同義詞的網(wǎng)絡(luò)(集合),且這些集合之間由各種關(guān)系連接.WordNet中不同詞性的詞匯間關(guān)系不同,本文重點(diǎn)考慮服務(wù)目標(biāo)中的動(dòng)詞和名詞,結(jié)合服務(wù)目標(biāo)的特點(diǎn),重點(diǎn)根據(jù)詞匯間的同義關(guān)系、上下位關(guān)系等對(duì)服務(wù)目標(biāo)進(jìn)行擴(kuò)充,并且基于文獻(xiàn)[12],給出了WordNet中詞匯間的關(guān)系到服務(wù)目標(biāo)詞匯間關(guān)系的映射,具體信息如表1所示.表1WordNet中詞匯間(部分)關(guān)系與服務(wù)目標(biāo)詞匯間關(guān)系的映射Table1WordsrelationshipmappingbetweenWordNetandservicegoalWordNet中詞匯間關(guān)系關(guān)系描述映射到服務(wù)目標(biāo)詞匯間關(guān)系同義關(guān)系兩種詞匯在語(yǔ)言文本中相互替代而不改變其意義上下位關(guān)系也稱為子集-超集關(guān)系,通常一個(gè)同義詞集只有唯一上位,但下位很多.部分-整體關(guān)系詞匯間滿足apartof關(guān)系等價(jià)關(guān)系(equivalent)上位關(guān)系(superclassof)下位關(guān)系(subclassof)交叉關(guān)系(partof)如圖3所示,對(duì)于第一階段得到的服務(wù)目標(biāo)名詞擴(kuò)展列表FGNAL中的top
【作者單位】: 河南大學(xué)計(jì)算機(jī)與信息工程學(xué)院;
【基金】:國(guó)家“九七三”重點(diǎn)基礎(chǔ)研究發(fā)展項(xiàng)目(2014CB340404)資助 國(guó)家自然科學(xué)基金項(xiàng)目(61402150,61402151)資助 河南省教育廳科學(xué)技術(shù)研究重點(diǎn)項(xiàng)目(14A520008)資助 中國(guó)博士后科學(xué)基金項(xiàng)目(2016M592286)資助 河南大學(xué)科研基金項(xiàng)目(2013YBZR015)資助
【分類號(hào)】:TP393.09
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 張會(huì)平;呂學(xué)強(qiáng);施水才;李渝勤;;基于WordNet的語(yǔ)義分布詞典建設(shè)[J];現(xiàn)代圖書情報(bào)技術(shù);2007年03期
2 周悅文;;WordNet應(yīng)用問題研究[J];科技致富向?qū)?2013年35期
3 牛作領(lǐng);;淺議WordNet的發(fā)展趨勢(shì)與應(yīng)用[J];科技致富向?qū)?2010年26期
4 趙天忠;苗壯;張亞非;徐偉光;陸建江;;基于WordNet重用的領(lǐng)域本體構(gòu)建方法[J];系統(tǒng)仿真學(xué)報(bào);2007年19期
5 華建新;曹敦;;基于WordNet和二分圖的語(yǔ)義Web服務(wù)發(fā)現(xiàn)算法[J];微計(jì)算機(jī)信息;2010年24期
6 李便霞;;WordNet應(yīng)用問題研究[J];科技致富向?qū)?2013年23期
7 李熙;徐德智;;本體映射中一種基于WordNet名稱策略算法[J];微計(jì)算機(jī)信息;2009年15期
8 何佳;趙海燕;陳慶奎;席麗娜;曹健;;基于WordNet的通用服務(wù)分類方法[J];計(jì)算機(jī)工程與科學(xué);2013年09期
9 張麗麗;殷兆麟;張愛娟;王竹曉;;以結(jié)點(diǎn)為中心的WordNet子圖的可視化[J];微電子學(xué)與計(jì)算機(jī);2006年10期
10 廖曉鋒;邱桂華;;基于WordNet的本體概念匹配算法改進(jìn)[J];計(jì)算機(jī)與現(xiàn)代化;2008年08期
相關(guān)會(huì)議論文 前4條
1 張麗麗;殷兆麟;張愛娟;王竹曉;;以結(jié)點(diǎn)為中心的WordNet子圖的可視化[A];2006年全國(guó)開放式分布與并行計(jì)算學(xué)術(shù)會(huì)議論文集(二)[C];2006年
2 哈斯那順烏日?qǐng)D;;蒙古文WordNet名詞同義詞集合構(gòu)建算法[A];中國(guó)計(jì)算語(yǔ)言學(xué)研究前沿進(jìn)展(2009-2011)[C];2011年
3 顏偉;荀恩東;;基于WordNet的英語(yǔ)詞語(yǔ)相似度計(jì)算[A];第二屆全國(guó)學(xué)生計(jì)算語(yǔ)言學(xué)研討會(huì)論文集[C];2004年
4 苗壯;劉劍豪;李杰;王智學(xué);;基于領(lǐng)域概念集的WordNet子本體抽取方法[A];江蘇省系統(tǒng)工程學(xué)會(huì)第十一屆學(xué)術(shù)年會(huì)論文集[C];2009年
相關(guān)重要報(bào)紙文章 前1條
1 北京 林爽;神奇的英文詞典WordNet[N];電腦報(bào);2005年
相關(guān)博士學(xué)位論文 前3條
1 周子力;基于WordNet的本體構(gòu)建及其在安全領(lǐng)域應(yīng)用關(guān)鍵技術(shù)研究[D];華東師范大學(xué);2009年
2 孟玲玲;基于WordNet的語(yǔ)義相似性度量及其在查詢推薦中的應(yīng)用研究[D];華東師范大學(xué);2014年
3 翟延冬;基于WordNet的短文本語(yǔ)義網(wǎng)挖掘算法研究[D];吉林大學(xué);2012年
相關(guān)碩士學(xué)位論文 前10條
1 米爾沙力江·沙吾提;基于WordNet的多語(yǔ)種查詢擴(kuò)展技術(shù)研究[D];新疆大學(xué);2015年
2 張思琪;基于WordNet的語(yǔ)義相似度計(jì)算方法的研究與應(yīng)用[D];北京交通大學(xué);2016年
3 盛艷梅;自動(dòng)問答系統(tǒng)中基于WordNet的句子語(yǔ)義相似度研究[D];曲阜師范大學(xué);2016年
4 楊家奇;基于WordNet英漢蒙三語(yǔ)領(lǐng)域本體的構(gòu)建方法研究[D];內(nèi)蒙古師范大學(xué);2016年
5 付曉枝;基于WordNet的藝術(shù)教育檢索服務(wù)平臺(tái)設(shè)計(jì)與實(shí)現(xiàn)[D];電子科技大學(xué);2013年
6 許雅緣;基于WordNet的英語(yǔ)隱喻自動(dòng)處理研究[D];福建師范大學(xué);2008年
7 馬武林;概念圖及WordNet輔助大學(xué)英語(yǔ)詞匯教學(xué)研究[D];西北師范大學(xué);2006年
8 王東睿;基于Kernel方法和WordNet的Web服務(wù)發(fā)現(xiàn)技術(shù)研究[D];南京郵電大學(xué);2011年
9 李熙;基于WordNet的本體映射研究[D];中南大學(xué);2008年
10 唐恩博;基于WordNet的蒙古文名詞語(yǔ)義網(wǎng)上下位語(yǔ)義關(guān)系樹構(gòu)造方法的研究[D];內(nèi)蒙古師范大學(xué);2014年
本文編號(hào):2543984
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/2543984.html