從社會性標(biāo)簽中進(jìn)行語義關(guān)系抽
本文選題:關(guān)系抽取 + 標(biāo)簽; 參考:《現(xiàn)代圖書情報技術(shù)》2009年03期
【摘要】:標(biāo)簽形式的社會性語義越來越占據(jù)主導(dǎo)地位,使元數(shù)據(jù)界在這種新形式的信息內(nèi)容表達(dá)和檢索方面面臨機(jī)遇和挑戰(zhàn)。其中,主要的挑戰(zhàn)是與標(biāo)簽相關(guān)的語境信息的缺失。以Flickr標(biāo)簽為例,對如何利用社會性語義資源來豐富主題元數(shù)據(jù)進(jìn)行了實驗。實驗過程包含4個步驟:收集Flickr標(biāo)簽樣本;通過共有信息計算標(biāo)簽間的同現(xiàn)情況;通過Google檢索結(jié)果來追蹤標(biāo)簽對的語境信息;用自然語言處理和機(jī)器學(xué)習(xí)技術(shù)來抽取標(biāo)簽間的語義關(guān)系。本實驗?zāi)軌蚶肎oogle搜索結(jié)果構(gòu)建語境庫,并且以自然語言處理和機(jī)器學(xué)習(xí)算法對這些語句進(jìn)行處理。這種新方法對于賦予標(biāo)簽對以一定語義關(guān)系有相當(dāng)高的準(zhǔn)確率。也探討該方法在利用社會性語義豐富的主題元數(shù)據(jù)方面的意義。
[Abstract]:The social semantics of tag form are becoming more and more dominant, which makes the metadata community face opportunities and challenges in this new form of information content representation and retrieval. The main challenge is the absence of contextual information related to labels. Taking Flickr tags as an example, this paper makes an experiment on how to make use of social semantic resources to enrich topic metadata. The experiment consists of four steps: collecting samples of Flickr tags, calculating cooccurrence among tags through common information, tracing the contextual information of tag pairs through Google retrieval results, and analyzing the context of tag pairs. Natural language processing and machine learning techniques are used to extract semantic relationships between tags. This experiment can use Google search results to construct context library and process these sentences with natural language processing and machine learning algorithm. This new method has a high accuracy for giving tag pairs a semantic relationship. This paper also discusses the significance of this method in the use of social semantic rich topic metadata.
【作者單位】: 美國雪城大學(xué);華東師范大學(xué)信息學(xué)系;
【分類號】:G354
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 孫倩;;摭論“圖書情報學(xué)博客”的組織和管理模式[J];中國報業(yè);2011年06期
2 ;[J];;年期
3 ;[J];;年期
4 ;[J];;年期
5 ;[J];;年期
6 ;[J];;年期
7 ;[J];;年期
8 ;[J];;年期
9 ;[J];;年期
10 ;[J];;年期
相關(guān)博士學(xué)位論文 前4條
1 宣云干;基于潛在語義分析的社會化標(biāo)注系統(tǒng)標(biāo)簽語義檢索研究[D];南京大學(xué);2011年
2 熊回香;面向Web3.0的大眾分類研究[D];華中師范大學(xué);2011年
3 張云中;基于形式概念分析的Folksonomy知識發(fā)現(xiàn)研究[D];吉林大學(xué);2012年
4 滕廣青;基于概念格的數(shù)字圖書館知識組織研究[D];吉林大學(xué);2012年
相關(guān)碩士學(xué)位論文 前5條
1 江超男;面向社會網(wǎng)絡(luò)應(yīng)用的關(guān)系抽取研究[D];南京理工大學(xué);2010年
2 鄭燃;基于Folksonomy的圖書館信息組織研究[D];鄭州大學(xué);2010年
3 高連花;基于社會化標(biāo)簽的個性化信息服務(wù)研究[D];華中師范大學(xué);2012年
4 王健;基于本體的圖書館folksonomy信息組織優(yōu)化研究[D];吉林大學(xué);2012年
5 李婷;分眾分類與書目記錄的結(jié)合研究[D];山西大學(xué);2012年
,本文編號:1983847
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1983847.html