天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

WordNet和《中國(guó)分類(lèi)主題詞表》的映射研究

發(fā)布時(shí)間:2021-10-31 14:06
  隨著網(wǎng)絡(luò)的發(fā)展,信息數(shù)量激增但缺乏結(jié)構(gòu)性,使得用戶(hù)查找所需知識(shí)、系統(tǒng)呈現(xiàn)相關(guān)信息以及專(zhuān)家維護(hù)信息系統(tǒng)的難度都大大增加;诖,通過(guò)建立本體并高效地實(shí)現(xiàn)本體的共享從而實(shí)現(xiàn)對(duì)信息、知識(shí)的共享和重用為越來(lái)越多的學(xué)者所關(guān)注并成為相關(guān)領(lǐng)域?qū)W者研究的熱點(diǎn),F(xiàn)實(shí)中,不同領(lǐng)域甚至同一領(lǐng)域中往往存在多個(gè)異構(gòu)本體,能夠運(yùn)用于所有本體并真正實(shí)現(xiàn)本體共享的方法與系統(tǒng)并不多見(jiàn)。本體映射通過(guò)建立異構(gòu)本體間的語(yǔ)義關(guān)系并輸出概念、屬性等映射對(duì)來(lái)實(shí)現(xiàn)本體間的重用和互操作。中文資源是全球知識(shí)與信息網(wǎng)絡(luò)的重要組成部分,實(shí)現(xiàn)中文本體間以及中、外文表示的本體間的映射是實(shí)現(xiàn)本體共享、重用的一個(gè)重要方面。目前針對(duì)本體映射的研究有很多,但在眾多的映射方法和系統(tǒng)中,對(duì)中文本體間以及對(duì)中、外文本體間進(jìn)行映射處理的仍非常有限,而且有些映射系統(tǒng)在運(yùn)行時(shí)并不考慮跨語(yǔ)言本體之間產(chǎn)生的語(yǔ)義上的歧義。本文致力于WordNet和《中國(guó)分類(lèi)主題詞表》的映射研究,旨在擴(kuò)大《中國(guó)分類(lèi)主題詞表》的詞匯量,從而為實(shí)現(xiàn)中文本體間的映射提供一個(gè)映射的標(biāo)準(zhǔn)與基礎(chǔ),使得中文本體間的映射更加準(zhǔn)確并且更能體現(xiàn)中文的結(jié)構(gòu)和特點(diǎn)。本文采用了中文WordNet和Web版的《中國(guó)... 

【文章來(lái)源】:山西大學(xué)山西省

【文章頁(yè)數(shù)】:64 頁(yè)

【學(xué)位級(jí)別】:碩士

【部分圖文】:

WordNet和《中國(guó)分類(lèi)主題詞表》的映射研究


本體維度不同所導(dǎo)致的本體異構(gòu)

表現(xiàn)方式,本體,實(shí)體


也即信息的意義的不同。這樣,即使兩種形式化語(yǔ)言通過(guò)轉(zhuǎn)化都正確地表示了實(shí)體的語(yǔ)義,也可能因?yàn)橛脩?hù)無(wú)法識(shí)別或者理解錯(cuò)誤而導(dǎo)致不能理解本體構(gòu)建者的意圖。如圖2.2所示:兩個(gè)實(shí)體不存在句法層面、術(shù)語(yǔ)層面以及概念層面的異構(gòu),只是對(duì)不同本體構(gòu)建者的等價(jià)的表現(xiàn)方式理解錯(cuò)誤。丫x,b(x)勸a(x)丫x,c(x)幼a(x)丫x,d(x)斗c(x)丫x,。(x)斗e(x)圖2.2兩種相同意思的表現(xiàn)方式本體創(chuàng)建者對(duì)一個(gè)實(shí)體預(yù)訂的用途對(duì)本體映射有很大的影響,我們不能僅僅因?yàn)閮蓚(gè)實(shí)體在語(yǔ)義上是相關(guān)的就對(duì)它們進(jìn)行映射。比如“歐洲”這個(gè)概念,在分類(lèi)式多媒體庫(kù)中它以路徑“ Irnage/B&W/EuroPe”來(lái)表示

本體,相似度,元素特征,映射關(guān)系


圖2.3MareEhrig描述的本體映射過(guò)程黃煙波分為四個(gè)部分〔‘3」,筆者在聯(lián)系其它文獻(xiàn)的基礎(chǔ)上歸納為以下幾個(gè)部分:(l)范化:共享一般建立在同一種語(yǔ)言描述的知識(shí)上,這一步把待映射的本體用同一種語(yǔ)言表示,且應(yīng)該使本體的表示規(guī)范化,解決句法層上的、結(jié)構(gòu)層上的異構(gòu),這可以通過(guò)計(jì)算機(jī)的自動(dòng)翻譯功能或者使用標(biāo)準(zhǔn)的本體描述語(yǔ)言(比如OwL)來(lái)解決;(2)元素特征提取:為了計(jì)算相似度,需要提取諸如概念、屬性名稱(chēng)等本體元素特征,并選擇出用于映射的概念對(duì);(3)概念之間語(yǔ)義相似度的計(jì)算以及整合:針對(duì)不同的領(lǐng)域本體,計(jì)算方法各有不同,用多種方法計(jì)算會(huì)得出多種相似度值,則需要綜合考慮各個(gè)相似度值進(jìn)行整合;(4)確定待匹配本體之間的映射關(guān)系:根據(jù)上面計(jì)算出的相似度,挑選必要的策略確定相應(yīng)的映射關(guān)系;

【參考文獻(xiàn)】:
期刊論文
[1]本體評(píng)估工具的比較分析[J]. 賈君枝,牛雅楠.  圖書(shū)情報(bào)工作. 2010(06)
[2]一種基于Swoogle本體映射的改進(jìn)算法[J]. 劉應(yīng)龍,江杰.  計(jì)算機(jī)系統(tǒng)應(yīng)用. 2009(07)
[3]《漢語(yǔ)主題詞表》XML文檔的自動(dòng)生成研究[J]. 賈君枝,衛(wèi)榮娟,羅林強(qiáng).  現(xiàn)代圖書(shū)情報(bào)技術(shù). 2009(05)
[4]基于樹(shù)結(jié)構(gòu)的多策略本體映射算法[J]. 楊先娣,彭智勇,吳黎兵,劉君強(qiáng).  武漢大學(xué)學(xué)報(bào)(理學(xué)版). 2008(03)
[5]FrameNet、WordNet、VerbNet比較研究[J]. 賈君枝,董剛.  情報(bào)科學(xué). 2007(11)
[6]《漢語(yǔ)主題詞表》轉(zhuǎn)換為本體的思考[J]. 賈君枝.  中國(guó)圖書(shū)館學(xué)報(bào). 2007(04)
[7]敘詞表與Ontology的比較研究[J]. 岳巧云.  科技情報(bào)開(kāi)發(fā)與經(jīng)濟(jì). 2006(24)
[8]一個(gè)基于相似度計(jì)算的動(dòng)態(tài)多維概念映射算法[J]. 程勇,黃河,邱莉榕,史忠植.  小型微型計(jì)算機(jī)系統(tǒng). 2006(06)
[9]本體映射方法研究[J]. 黃煙波,張紅宇,李建華,譚立球,李志.  計(jì)算機(jī)工程與應(yīng)用. 2005(18)
[10]基于語(yǔ)義Web的本體映射方法綜述[J]. 袁洋,李善平.  計(jì)算機(jī)科學(xué). 2004(05)



本文編號(hào):3468269

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/tushudanganlunwen/3468269.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶(hù)066b4***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com