中文關(guān)聯(lián)書(shū)目數(shù)據(jù)模型構(gòu)建及實(shí)證研究
發(fā)布時(shí)間:2020-12-19 06:53
傳統(tǒng)圖書(shū)館通過(guò)使用在線公共訪問(wèn)目錄(OPAC)來(lái)提供對(duì)館藏的訪問(wèn)。OPAC是綜合圖書(shū)館系統(tǒng)(ILS)的基本組成部分,因?yàn)樗阌谄胀ㄓ脩粼L問(wèn)以機(jī)讀格式(MARC)格式存儲(chǔ)的信息。伴隨著互聯(lián)網(wǎng)的不斷發(fā)展,圖書(shū)館積累了大量珍貴的信息資源,傳統(tǒng)的信息組織方式和服務(wù)方式逐漸將圖書(shū)館隔離出了互聯(lián)網(wǎng),這些權(quán)威資源的價(jià)值則迅速淹沒(méi)在海量的網(wǎng)絡(luò)資源當(dāng)中。這成為了圖書(shū)館急需解決的問(wèn)題。本文通過(guò)文獻(xiàn)調(diào)查法和比較研究法對(duì)國(guó)外四種成熟關(guān)聯(lián)數(shù)據(jù)模型通過(guò)核心框架、功能分析、映射分析三大緯度進(jìn)行比較分析。結(jié)合中文書(shū)目數(shù)據(jù)特點(diǎn),分析中文關(guān)聯(lián)書(shū)目數(shù)據(jù)模型構(gòu)建的可能性,對(duì)模型構(gòu)建要素進(jìn)行析出。然后通過(guò)本體設(shè)計(jì)、映射設(shè)計(jì)、數(shù)據(jù)發(fā)布設(shè)計(jì)構(gòu)建中文關(guān)聯(lián)書(shū)目數(shù)據(jù)模型,最后對(duì)模型進(jìn)行實(shí)證研究,采用人工映射和工具映射相結(jié)合的方法將CNMARC格式的數(shù)據(jù)向RDF數(shù)據(jù)轉(zhuǎn)換,并構(gòu)建RDF文檔之間的關(guān)聯(lián)關(guān)系。圖書(shū)館書(shū)目數(shù)據(jù)的關(guān)聯(lián)化是將傳統(tǒng)文獻(xiàn)資源借助互聯(lián)網(wǎng)新型技術(shù),以全面提高書(shū)目資源的利用率,提升圖書(shū)館服務(wù)質(zhì)量。
【文章來(lái)源】:東北師范大學(xué)吉林省 211工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:66 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
BNB圖書(shū)關(guān)聯(lián)書(shū)目數(shù)據(jù)模型
圖 5 CNMARC 字段和 BIBFRAME2.0 詞表屬性對(duì)應(yīng)關(guān)系從圖中我們可以看出 CNMARC 書(shū)目數(shù)據(jù)各字段與 BIBFRAME2.0 詞表之間的對(duì)應(yīng)關(guān)系是多對(duì)多的映射關(guān)系,并不是一對(duì)一的精準(zhǔn)映射關(guān)系。部分 CNMARC中的字段所包含的信息需要進(jìn)行重組后才能夠與 BIBFRAME2.0 詞表中的屬性和類進(jìn)行匹配,并且同一字段的內(nèi)容可能與多個(gè)屬性相匹配。CNMARC 數(shù)據(jù)與BIBFRAME2.0 詞表之間的轉(zhuǎn)換并不是直接的格式轉(zhuǎn)換而是包含了信息的抽取和重組過(guò)程。3.2.3 數(shù)據(jù)發(fā)布要素?cái)?shù)據(jù)發(fā)布的要素包括:RDF 數(shù)據(jù)存取、數(shù)據(jù)檢索、數(shù)據(jù)展示、數(shù)據(jù)統(tǒng)計(jì)以及開(kāi)放數(shù)據(jù)服務(wù)。一套完整的數(shù)據(jù)發(fā)布流程有助于書(shū)目控制和規(guī)范控制以及數(shù)據(jù)共享和知識(shí)發(fā)現(xiàn),呈現(xiàn)良好的數(shù)據(jù)可視化界面,滿足用戶對(duì)資源利用的需求。
圖 6 中文關(guān)聯(lián)書(shū)目數(shù)據(jù)模型構(gòu)建步驟關(guān)聯(lián)書(shū)目數(shù)據(jù)模型的實(shí)現(xiàn)基于成熟的語(yǔ)義技術(shù)和開(kāi)源框架。由于 RDF 是ML 語(yǔ)言來(lái)編寫(xiě)的,所以首先要借助 Marc Editor 等工具將 MARC 格式轉(zhuǎn)ARCXML;然后利用 Marc2BIBframe2、OpenRefine 等工具對(duì)這些元數(shù)據(jù)洗和轉(zhuǎn)換,以 Tuttle 格式輸出生成的 RDF 格式數(shù)據(jù),存儲(chǔ)在 RDF 存儲(chǔ)庫(kù)中利用 Jena、python 等開(kāi)發(fā)工具實(shí)現(xiàn)對(duì) RDF 文檔的處理,以 SPARQL 查詢現(xiàn)數(shù)據(jù)的查詢和存取。
【參考文獻(xiàn)】:
期刊論文
[1]中文關(guān)聯(lián)書(shū)目數(shù)據(jù)發(fā)布方案研究[J]. 夏翠娟,許磊. 數(shù)字圖書(shū)館論壇. 2018(01)
[2]關(guān)聯(lián)大數(shù)據(jù)管理技術(shù):挑戰(zhàn)、對(duì)策與實(shí)踐[J]. 沈志宏,姚暢,侯艷飛,吳林寰,李躍鵬. 數(shù)據(jù)分析與知識(shí)發(fā)現(xiàn). 2018(01)
[3]歐盟數(shù)字圖書(shū)館Europeana建設(shè)研究及啟示[J]. 王娜. 圖書(shū)館學(xué)刊. 2017(10)
[4]基于關(guān)聯(lián)開(kāi)放數(shù)據(jù)的數(shù)字文化資源語(yǔ)義融合方法研究——?dú)W洲數(shù)字圖書(shū)館案例分析[J]. 王萍,黃新平. 圖書(shū)情報(bào)工作. 2016(12)
[5]BIBFRAME核心類演變分析[J]. 胡小菁. 中國(guó)圖書(shū)館學(xué)報(bào). 2016(03)
[6]BIBFRAME與圖書(shū)館工作的變革[J]. 安曉麗. 圖書(shū)館建設(shè). 2015(10)
[7]大英圖書(shū)館書(shū)目數(shù)據(jù)的關(guān)聯(lián)化分析[J]. 張鵬圖. 國(guó)家圖書(shū)館學(xué)刊. 2015(04)
[8]關(guān)聯(lián)書(shū)目數(shù)據(jù)模型比較研究[J]. 吳貝貝,夏翠娟. 圖書(shū)館雜志. 2015(05)
[9]英國(guó)國(guó)家書(shū)目FRBR化研究及啟示[J]. 朱青青,毛雅君. 國(guó)家圖書(shū)館學(xué)刊. 2014(06)
[10]面向語(yǔ)義網(wǎng)的書(shū)目框架(BIBFRAME):功能需求及實(shí)現(xiàn)[J]. 夏翠娟. 大學(xué)圖書(shū)館學(xué)報(bào). 2014(06)
碩士論文
[1]基于BIBFRAME的書(shū)目信息關(guān)聯(lián)數(shù)據(jù)化研究[D]. 常楨.鄭州大學(xué) 2016
本文編號(hào):2925470
【文章來(lái)源】:東北師范大學(xué)吉林省 211工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:66 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
BNB圖書(shū)關(guān)聯(lián)書(shū)目數(shù)據(jù)模型
圖 5 CNMARC 字段和 BIBFRAME2.0 詞表屬性對(duì)應(yīng)關(guān)系從圖中我們可以看出 CNMARC 書(shū)目數(shù)據(jù)各字段與 BIBFRAME2.0 詞表之間的對(duì)應(yīng)關(guān)系是多對(duì)多的映射關(guān)系,并不是一對(duì)一的精準(zhǔn)映射關(guān)系。部分 CNMARC中的字段所包含的信息需要進(jìn)行重組后才能夠與 BIBFRAME2.0 詞表中的屬性和類進(jìn)行匹配,并且同一字段的內(nèi)容可能與多個(gè)屬性相匹配。CNMARC 數(shù)據(jù)與BIBFRAME2.0 詞表之間的轉(zhuǎn)換并不是直接的格式轉(zhuǎn)換而是包含了信息的抽取和重組過(guò)程。3.2.3 數(shù)據(jù)發(fā)布要素?cái)?shù)據(jù)發(fā)布的要素包括:RDF 數(shù)據(jù)存取、數(shù)據(jù)檢索、數(shù)據(jù)展示、數(shù)據(jù)統(tǒng)計(jì)以及開(kāi)放數(shù)據(jù)服務(wù)。一套完整的數(shù)據(jù)發(fā)布流程有助于書(shū)目控制和規(guī)范控制以及數(shù)據(jù)共享和知識(shí)發(fā)現(xiàn),呈現(xiàn)良好的數(shù)據(jù)可視化界面,滿足用戶對(duì)資源利用的需求。
圖 6 中文關(guān)聯(lián)書(shū)目數(shù)據(jù)模型構(gòu)建步驟關(guān)聯(lián)書(shū)目數(shù)據(jù)模型的實(shí)現(xiàn)基于成熟的語(yǔ)義技術(shù)和開(kāi)源框架。由于 RDF 是ML 語(yǔ)言來(lái)編寫(xiě)的,所以首先要借助 Marc Editor 等工具將 MARC 格式轉(zhuǎn)ARCXML;然后利用 Marc2BIBframe2、OpenRefine 等工具對(duì)這些元數(shù)據(jù)洗和轉(zhuǎn)換,以 Tuttle 格式輸出生成的 RDF 格式數(shù)據(jù),存儲(chǔ)在 RDF 存儲(chǔ)庫(kù)中利用 Jena、python 等開(kāi)發(fā)工具實(shí)現(xiàn)對(duì) RDF 文檔的處理,以 SPARQL 查詢現(xiàn)數(shù)據(jù)的查詢和存取。
【參考文獻(xiàn)】:
期刊論文
[1]中文關(guān)聯(lián)書(shū)目數(shù)據(jù)發(fā)布方案研究[J]. 夏翠娟,許磊. 數(shù)字圖書(shū)館論壇. 2018(01)
[2]關(guān)聯(lián)大數(shù)據(jù)管理技術(shù):挑戰(zhàn)、對(duì)策與實(shí)踐[J]. 沈志宏,姚暢,侯艷飛,吳林寰,李躍鵬. 數(shù)據(jù)分析與知識(shí)發(fā)現(xiàn). 2018(01)
[3]歐盟數(shù)字圖書(shū)館Europeana建設(shè)研究及啟示[J]. 王娜. 圖書(shū)館學(xué)刊. 2017(10)
[4]基于關(guān)聯(lián)開(kāi)放數(shù)據(jù)的數(shù)字文化資源語(yǔ)義融合方法研究——?dú)W洲數(shù)字圖書(shū)館案例分析[J]. 王萍,黃新平. 圖書(shū)情報(bào)工作. 2016(12)
[5]BIBFRAME核心類演變分析[J]. 胡小菁. 中國(guó)圖書(shū)館學(xué)報(bào). 2016(03)
[6]BIBFRAME與圖書(shū)館工作的變革[J]. 安曉麗. 圖書(shū)館建設(shè). 2015(10)
[7]大英圖書(shū)館書(shū)目數(shù)據(jù)的關(guān)聯(lián)化分析[J]. 張鵬圖. 國(guó)家圖書(shū)館學(xué)刊. 2015(04)
[8]關(guān)聯(lián)書(shū)目數(shù)據(jù)模型比較研究[J]. 吳貝貝,夏翠娟. 圖書(shū)館雜志. 2015(05)
[9]英國(guó)國(guó)家書(shū)目FRBR化研究及啟示[J]. 朱青青,毛雅君. 國(guó)家圖書(shū)館學(xué)刊. 2014(06)
[10]面向語(yǔ)義網(wǎng)的書(shū)目框架(BIBFRAME):功能需求及實(shí)現(xiàn)[J]. 夏翠娟. 大學(xué)圖書(shū)館學(xué)報(bào). 2014(06)
碩士論文
[1]基于BIBFRAME的書(shū)目信息關(guān)聯(lián)數(shù)據(jù)化研究[D]. 常楨.鄭州大學(xué) 2016
本文編號(hào):2925470
本文鏈接:http://sikaile.net/tushudanganlunwen/2925470.html
最近更新
教材專著