基于知識圖譜的圖書館電子資源自動(dòng)去重方法研究
發(fā)布時(shí)間:2021-05-09 16:05
圖書館電子資源建設(shè)過程中需要統(tǒng)計(jì)相關(guān)數(shù)據(jù),采用傳統(tǒng)人工去重方法耗費(fèi)時(shí)間較長,針對該問題,提出了基于知識圖譜的圖書館電子資源自動(dòng)去重方法研究。利用CiteSpace軟件對文獻(xiàn)中的關(guān)鍵詞進(jìn)行統(tǒng)計(jì)分析,提取所需信息,并將其存入資源庫之中。通過格式化各字段基本信息說明,將其導(dǎo)入excel格式文件之中,實(shí)現(xiàn)圖書館電子資源抓取。依據(jù)抓取結(jié)果分析收錄冗余和查全冗余資源,確定去重思路,以特定統(tǒng)一資源定位符為基準(zhǔn),匹配相關(guān)信息。格式統(tǒng)一處理,去除非關(guān)鍵信息,查詢數(shù)位物件識別號,計(jì)算哈希值,將檢索特征插入特征字典之中,以此設(shè)計(jì)圖書館電子資源自動(dòng)去重流程。由實(shí)驗(yàn)結(jié)果可知,該方法去重時(shí)間較短,能夠有效應(yīng)用于圖書館信息獲取與統(tǒng)計(jì)工作之中。
【文章來源】:電子設(shè)計(jì)工程. 2020,28(12)
【文章頁數(shù)】:5 頁
【文章目錄】:
1 基于知識圖譜圖書館電子資源抓取與整合
1.1 資源抓取
1.2 資源整合
2 跨庫檢索去重分析
2.1 抓取結(jié)果冗余分析
1)收錄冗余
2)查全冗余
2.2 去重依據(jù)分析
3 圖書館電子資源自動(dòng)去重流程設(shè)計(jì)
4 實(shí)驗(yàn)分析
4.1 實(shí)驗(yàn)環(huán)境
4.2 資源準(zhǔn)備
4.3 去重時(shí)間對比分析
4.3.1 檢索時(shí)間對比分析
4.3.2 去重時(shí)間對比分析
5 結(jié)束語
【參考文獻(xiàn)】:
期刊論文
[1]高校圖書館電子資源專人負(fù)責(zé)制的實(shí)踐探索——以山西大學(xué)圖書館為例[J]. 郭建宏. 圖書館學(xué)刊. 2019(03)
[2]基于大數(shù)據(jù)決策的圖書館信息系統(tǒng)安全分析與管理[J]. 楊琳,劉怡麟. 電子設(shè)計(jì)工程. 2018(22)
[3]基于語義的數(shù)字圖書館檢索模型研究[J]. 馬佳立. 電子設(shè)計(jì)工程. 2018(22)
[4]電子資源管理與評估——以上海財(cái)經(jīng)大學(xué)圖書館的外文電子期刊為例[J]. 李娜. 圖書情報(bào)工作. 2018(15)
[5]一種在去重備份系統(tǒng)中數(shù)據(jù)碎片整理算法[J]. 韓瑩,單維峰,孫曉葉,郭娜,張翔. 科技通報(bào). 2018(06)
[6]基于混合聚類算法的圖書館管理系統(tǒng)研究[J]. 周運(yùn)麗. 計(jì)算機(jī)與數(shù)字工程. 2018(03)
[7]基于語言值聚合算法的數(shù)據(jù)去重產(chǎn)品選擇[J]. 梁律. 控制工程. 2018(01)
[8]圖書館數(shù)字資源聚合質(zhì)量預(yù)測模型構(gòu)建——基于改進(jìn)遺傳算法和BP神經(jīng)網(wǎng)絡(luò)[J]. 閆晶,畢強(qiáng),李潔,王福. 數(shù)據(jù)分析與知識發(fā)現(xiàn). 2017(12)
[9]提高高校圖書館電子資源利用效率的途徑分析[J]. 李永強(qiáng). 現(xiàn)代交際. 2017(20)
[10]北京高科大學(xué)聯(lián)盟圖書館電子資源聯(lián)合采購的實(shí)踐與探索[J]. 楊守文,王婷,張建文,高彥靜. 情報(bào)探索. 2017(10)
本文編號:3177604
【文章來源】:電子設(shè)計(jì)工程. 2020,28(12)
【文章頁數(shù)】:5 頁
【文章目錄】:
1 基于知識圖譜圖書館電子資源抓取與整合
1.1 資源抓取
1.2 資源整合
2 跨庫檢索去重分析
2.1 抓取結(jié)果冗余分析
1)收錄冗余
2)查全冗余
2.2 去重依據(jù)分析
3 圖書館電子資源自動(dòng)去重流程設(shè)計(jì)
4 實(shí)驗(yàn)分析
4.1 實(shí)驗(yàn)環(huán)境
4.2 資源準(zhǔn)備
4.3 去重時(shí)間對比分析
4.3.1 檢索時(shí)間對比分析
4.3.2 去重時(shí)間對比分析
5 結(jié)束語
【參考文獻(xiàn)】:
期刊論文
[1]高校圖書館電子資源專人負(fù)責(zé)制的實(shí)踐探索——以山西大學(xué)圖書館為例[J]. 郭建宏. 圖書館學(xué)刊. 2019(03)
[2]基于大數(shù)據(jù)決策的圖書館信息系統(tǒng)安全分析與管理[J]. 楊琳,劉怡麟. 電子設(shè)計(jì)工程. 2018(22)
[3]基于語義的數(shù)字圖書館檢索模型研究[J]. 馬佳立. 電子設(shè)計(jì)工程. 2018(22)
[4]電子資源管理與評估——以上海財(cái)經(jīng)大學(xué)圖書館的外文電子期刊為例[J]. 李娜. 圖書情報(bào)工作. 2018(15)
[5]一種在去重備份系統(tǒng)中數(shù)據(jù)碎片整理算法[J]. 韓瑩,單維峰,孫曉葉,郭娜,張翔. 科技通報(bào). 2018(06)
[6]基于混合聚類算法的圖書館管理系統(tǒng)研究[J]. 周運(yùn)麗. 計(jì)算機(jī)與數(shù)字工程. 2018(03)
[7]基于語言值聚合算法的數(shù)據(jù)去重產(chǎn)品選擇[J]. 梁律. 控制工程. 2018(01)
[8]圖書館數(shù)字資源聚合質(zhì)量預(yù)測模型構(gòu)建——基于改進(jìn)遺傳算法和BP神經(jīng)網(wǎng)絡(luò)[J]. 閆晶,畢強(qiáng),李潔,王福. 數(shù)據(jù)分析與知識發(fā)現(xiàn). 2017(12)
[9]提高高校圖書館電子資源利用效率的途徑分析[J]. 李永強(qiáng). 現(xiàn)代交際. 2017(20)
[10]北京高科大學(xué)聯(lián)盟圖書館電子資源聯(lián)合采購的實(shí)踐與探索[J]. 楊守文,王婷,張建文,高彥靜. 情報(bào)探索. 2017(10)
本文編號:3177604
本文鏈接:http://sikaile.net/tushudanganlunwen/3177604.html