中文個人名稱規(guī)范記錄的實體匹配與聚簇
發(fā)布時間:2017-08-04 22:10
本文關鍵詞:中文個人名稱規(guī)范記錄的實體匹配與聚簇
更多相關文章: 虛擬國際規(guī)范文檔 個人名稱規(guī)范檔 實體匹配 聚簇
【摘要】:本文嘗試解決國內(nèi)個人名稱規(guī)范聯(lián)合數(shù)據(jù)庫檢索結果集基于實體匹配的聚簇問題,分析國內(nèi)名稱規(guī)范聯(lián)合庫CCCNA的檢索服務和數(shù)據(jù)庫記錄特點,提出對結果集記錄合并聚簇的思路:首先預處理去除重復和明顯的名稱語義不匹配記錄,再根據(jù)提取出的個人實體屬性名稱、出生年、個人關聯(lián)的書目題名及關聯(lián)的外部記錄,基于個人實體的語義進行個人名稱規(guī)范記錄聚簇。實證統(tǒng)計結果顯示,處理后結果集內(nèi)的簇數(shù)都顯著低于處理前的記錄條數(shù),與VIAF的關聯(lián)聚簇結果也驗證了本文方法的有效性。但本文書目匹配采取題名匹配,這會丟失一些有用的聚簇信息,后續(xù)研究將進一步集成圖書機構的書目數(shù)據(jù)庫,抽取更多的書目信息進行聚簇。
【作者單位】: 山西大學經(jīng)濟與管理學院;
【關鍵詞】: 虛擬國際規(guī)范文檔 個人名稱規(guī)范檔 實體匹配 聚簇
【基金】:國家社科基金重點項目“基于關聯(lián)數(shù)據(jù)的中文名稱規(guī)范檔語義描述及數(shù)據(jù)聚合研究”(項目編號:15ATQ004)的研究成果之一
【分類號】:G254.3
【正文快照】: 1引言 名稱規(guī)范檔根據(jù)控制規(guī)范規(guī)則,將名稱信息按照統(tǒng)一的標目形式展現(xiàn),為用戶查詢名稱實體提供更高效的途徑。由于單一機構構建的名稱規(guī)范檔規(guī)模較小,隨著機構之間合作的深人,名稱規(guī)范檔資源之間的共建共享成為必然。2003年,國家圖書館(NLC)、中國高等教育文獻保障系統(tǒng)管理中
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 湯蓉;唐常杰;徐開闊;左R,
本文編號:621964
本文鏈接:http://sikaile.net/tushudanganlunwen/621964.html
教材專著