天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 碩博論文 > 信息類碩士論文 >

基于中文名稱規(guī)范檔的人物信息聚合研究

發(fā)布時間:2024-04-12 04:13
  名稱規(guī)范的管理是圖書館機構(gòu)規(guī)范控制的主要工作,在2003年我國內(nèi)地及港澳臺的多家機構(gòu)聯(lián)合建立了中文名稱規(guī)范聯(lián)合數(shù)據(jù)庫,針對數(shù)據(jù)庫資源的檢索和查詢,為用戶提供了中文名稱規(guī)范一站式查詢系統(tǒng)。不同機構(gòu)對名稱規(guī)范檔中數(shù)據(jù)資源的管理缺乏統(tǒng)一的整合方法,導(dǎo)致共享性較差;而且數(shù)據(jù)來源比較單一,主要為書目數(shù)據(jù),降低了數(shù)據(jù)庫名稱資源的服務(wù)水平和信息質(zhì)量。人物作為客觀世界最為重要的實體,其相關(guān)的數(shù)據(jù)資源在中文名稱規(guī)范檔中冗余程度較高,同一人物的多條標(biāo)目缺乏語義關(guān)聯(lián)和信息整合。通過構(gòu)建人物關(guān)聯(lián)模型,完成人物實體的信息聚合,進而提高圖書館特有資源的數(shù)據(jù)質(zhì)量具有重要意義。當(dāng)前,國內(nèi)外眾多知識庫均覆蓋了人物、組織、會議等多類型的實體數(shù)據(jù),各知識庫對實體對象的構(gòu)造方式、描述屬性和語義關(guān)聯(lián)都各有特點,且大多知識庫都是基于開放和關(guān)聯(lián)的。中文名稱規(guī)范檔的人物實體屬性匱乏,存儲格式難以關(guān)聯(lián)和優(yōu)化,信息聚合成為解決上述問題的有效途徑,既能整合國內(nèi)多家機構(gòu)的重復(fù)條目,進而識別同一實體,又能與其他不同類型的數(shù)據(jù)庫建立鏈接,形成屬性豐富的人物關(guān)聯(lián)模型,滿足多元的知識服務(wù)和需求。本文基于中文名稱規(guī)范檔的人物信息聚合問題進行了理論探討...

【文章頁數(shù)】:79 頁

【學(xué)位級別】:碩士

【部分圖文】:

圖2.1語義網(wǎng)結(jié)構(gòu)層次模型圖

圖2.1語義網(wǎng)結(jié)構(gòu)層次模型圖

基于中文名稱規(guī)范檔的人物信息聚合研究12圖2.1語義網(wǎng)結(jié)構(gòu)層次模型圖2.1.2本體與實例的關(guān)系本體(ontology)最先是由亞里士多德提出的,在哲學(xué)領(lǐng)域被定義為:“對世界客觀存在物體的系統(tǒng)性描述,即存在論”。1960年本體被引入知識工程領(lǐng)域后,相關(guān)專家學(xué)者給出了許多不同的定義。....


圖3.3待處理文本統(tǒng)計圖

圖3.3待處理文本統(tǒng)計圖

基于中文名稱規(guī)范檔的人物信息聚合研究22200_7ba0yba0y|b名400_a變異名稱810_a數(shù)據(jù)參考來源830_a作者簡介856_u個人簡況名稱規(guī)范檔中人物名稱數(shù)據(jù)大多來自書目記錄,因此本文選擇《亞洲周刊》評選的20世紀排名前一百的中文小說和中國近現(xiàn)代作家排行榜前一百名的....


圖3.7:層次聚類過程

圖3.7:層次聚類過程

第三章國內(nèi)中文名稱規(guī)范檔的人物聚合27圖3.7:層次聚類過程經(jīng)過上述相似度計算過程后,實驗獲得匹配數(shù)據(jù)。本文采用Purity和F-score分數(shù)對聚類結(jié)果進行評價,Purity是聚類評價方法之一,需要計算正確聚類的文檔數(shù)占全部文檔數(shù)的比例,其中Ω表示聚類的集合,ω_k表示第k類個....


圖3.8:聚類結(jié)果評估統(tǒng)計圖

圖3.8:聚類結(jié)果評估統(tǒng)計圖

基于中文名稱規(guī)范檔的人物信息聚合研究28R=+在基于聚類分析的中文個人名稱實驗中,隨機抽取20個實體的數(shù)據(jù)進行統(tǒng)計,精確率P、召回率R、F-score分數(shù)如圖3.8所示,總體效果較好。實驗結(jié)果證明了基于中文個人名稱聚類并建立實體鏈接的有效性,其中purity率計算得:88.514....



本文編號:3951646

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/3951646.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶87e55***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com