一種基于網(wǎng)頁信息抽取的OA期刊資源采集方法研究
本文選題:OA期刊 切入點(diǎn):OA期刊資源采集 出處:《數(shù)字圖書館論壇》2017年05期
【摘要】:本文結(jié)合開放獲取期刊(Open Access Journal,OA期刊)資源特點(diǎn),針對無法通過OAI-PMH協(xié)議進(jìn)行資源采集的OA期刊,提出一種基于網(wǎng)頁信息抽取的資源采集策略。本文從網(wǎng)頁資源描述的角度總結(jié)OA期刊資源特點(diǎn)并對其分類;诰W(wǎng)頁信息抽取方法在OA期刊資源采集適用性,提出一種基于OA期刊網(wǎng)頁元數(shù)據(jù)抽取的采集方法,并在此方法的基礎(chǔ)上設(shè)計(jì)了采集系統(tǒng)。通過對國內(nèi)外不遵循OAI-PMH協(xié)議的10本OA期刊的網(wǎng)站實(shí)證采集,得到45 785篇論文的元數(shù)據(jù),證明該采集方法能有效地應(yīng)用于此類資源采集。研究豐富了OA期刊資源采集方式,對不遵循OAI-PMH協(xié)議的OA期刊資源采集提供方法借鑒。
[Abstract]:This combination of Open Access Journals (Open Access Journal, OA Journal) resources characteristics, for OA journals can not through the OAI-PMH protocol for resource acquisition, this paper proposed a resource acquisition strategy of Web Information Extraction Based on Web resources. From the description of the summary OA journal resource characteristics and the classification of Web information extraction method based on acquisition. The applicability of OA in periodical resources, put forward a method of acquisition OA Journal Web metadata extraction based on the basis of this method, the design of acquisition system. Through the acquisition of domestic and foreign empirical website does not follow the OAI-PMH protocol of the OA 10 journals, 45785 papers metadata, show that the acquisition method can be effectively used in this study enriches the way of resource acquisition. OA journal resource collection, provide a way for OA journal resource collection does not follow the OAI-PMH protocol.
【作者單位】: 中國農(nóng)業(yè)科學(xué)院農(nóng)業(yè)信息研究所;
【分類號】:G255.2
【參考文獻(xiàn)】
相關(guān)期刊論文 前8條
1 王思麗;馬建玲;王楠;李慧佳;;開放知識資源的元數(shù)據(jù)自動(dòng)采集策略研究[J];圖書館學(xué)研究;2013年12期
2 郭少友;;OAI-PMH元數(shù)據(jù)的關(guān)聯(lián)數(shù)據(jù)化方法研究[J];圖書情報(bào)工作;2011年02期
3 朱江;尚瑋姣;姜恩波;柴苗嶺;黃筱瑾;;會議文獻(xiàn)開放資源采集與服務(wù)系統(tǒng)的建設(shè)[J];情報(bào)理論與實(shí)踐;2010年07期
4 徐方;張靜;;國內(nèi)OAI-PMH協(xié)議研究綜述[J];現(xiàn)代情報(bào);2009年01期
5 蒲筱哥;;基于Web的信息抽取技術(shù)研究綜述[J];現(xiàn)代情報(bào);2007年10期
6 王芳;王小麗;;基于OAI協(xié)議的數(shù)字檔案館元數(shù)據(jù)互操作問題研究[J];現(xiàn)代圖書情報(bào)技術(shù);2007年03期
7 李勇文;OAI元數(shù)據(jù)搜索引擎的設(shè)計(jì)與實(shí)現(xiàn)[J];現(xiàn)代圖書情報(bào)技術(shù);2005年02期
8 董慧,丁波濤;用OAI-MHP協(xié)議解決數(shù)字圖書館互操作問題[J];情報(bào)科學(xué);2004年06期
相關(guān)碩士學(xué)位論文 前4條
1 宋辰;科技情報(bào)采集系統(tǒng)的設(shè)計(jì)及其快速文本聚類方法研究[D];北京工業(yè)大學(xué);2014年
2 于靜;基于頁面主體提取的WEB信息抽取技術(shù)研究[D];南京郵電大學(xué);2013年
3 楊東清;開放獲取期刊資源庫共建共享平臺的研究與開發(fā)[D];南京農(nóng)業(yè)大學(xué);2010年
4 董娟;基于頁面結(jié)構(gòu)分析的網(wǎng)頁信息抽取方法研究[D];中國石油大學(xué);2010年
【共引文獻(xiàn)】
相關(guān)期刊論文 前10條
1 柯平;劉旭青;柴峗;;省級公共圖書館評估標(biāo)準(zhǔn)解讀[J];圖書館;2017年06期
2 馬麗波;;新媒體環(huán)境下高校圖書館“微”服務(wù)[J];農(nóng)業(yè)圖書情報(bào)學(xué)刊;2017年06期
3 張雅琪;楊娜;李詣斐;柯平;;面向數(shù)字圖書館的公共圖書館評估[J];數(shù)字圖書館論壇;2017年05期
4 宋海艷;郭晶;董玨;;高校圖書館深度知識服務(wù)流程框架與實(shí)現(xiàn)路徑研究[J];圖書情報(bào)工作;2017年05期
5 黃如花;苗淼;;中美公共圖書館評估異同研究[J];圖書館建設(shè);2017年05期
6 張莉;;E-Research環(huán)境下高校圖書館嵌入式知識服務(wù)模式研究[J];圖書館學(xué)刊;2017年03期
7 康英;;教學(xué)研究型大學(xué)圖書館發(fā)展的文化認(rèn)知[J];邊疆經(jīng)濟(jì)與文化;2017年05期
8 陳可彥;譚必勇;;我國公共檔案館APP開發(fā)現(xiàn)狀及發(fā)展策略研究[J];信息資源管理學(xué)報(bào);2017年02期
9 胡媛;毛寧;;基于用戶畫像的數(shù)字圖書館知識社區(qū)用戶模型構(gòu)建[J];圖書館理論與實(shí)踐;2017年04期
10 王曉湘;;面向科研服務(wù)的高校和研究機(jī)構(gòu)圖書館轉(zhuǎn)型發(fā)展的戰(zhàn)略地圖[J];現(xiàn)代情報(bào);2017年04期
【二級參考文獻(xiàn)】
相關(guān)期刊論文 前10條
1 張曉林;;建立面向變化和可持續(xù)創(chuàng)新的發(fā)展管理機(jī)制[J];中國圖書館學(xué)報(bào);2006年01期
2 胡燕菘;國內(nèi)公共圖書館數(shù)字化建設(shè)項(xiàng)目綜述[J];圖書館;2005年04期
3 王世偉;上海圖書館近年來拓展網(wǎng)絡(luò)服務(wù)述略[J];圖書館學(xué)刊;2005年04期
4 張曉林;;從數(shù)字圖書館到E-Knowledge機(jī)制[J];中國圖書館學(xué)報(bào);2005年04期
5 胡燕菘;國內(nèi)數(shù)字圖書館研究項(xiàng)目綜述[J];高校圖書館工作;2005年02期
6 束漫;廣東數(shù)字圖書館建設(shè)的狀況、問題與建議[J];圖書館論壇;2004年01期
7 蘭小筠,張燕舞;我國數(shù)字圖書館研究論文(1994~2001年)定量分析[J];情報(bào)科學(xué);2002年06期
8 莫少強(qiáng);廣東省數(shù)字圖書館建設(shè)和資源共享的研究與實(shí)踐[J];圖書館論壇;2002年01期
9 張曉林;數(shù)字圖書館機(jī)制的范式演變及其挑戰(zhàn)[J];中國圖書館學(xué)報(bào);2001年06期
10 王世偉;數(shù)字圖書館——新世紀(jì)圖書館發(fā)展的重要機(jī)遇[J];河南圖書館學(xué)刊;2001年03期
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 崔麗芬;;理想與實(shí)踐——OA期刊的未來發(fā)展[J];現(xiàn)代情報(bào);2013年03期
2 韓燕麗;;我國OA期刊資源平臺研究[J];科技與出版;2013年11期
3 張紅芹;黃水清;;OA期刊質(zhì)量評價(jià)指標(biāo)體系初探[J];情報(bào)雜志;2007年03期
4 歐陽雪梅;張?zhí)O;廖光珍;張小強(qiáng);;OA知識庫和OA期刊的對比分析[J];編輯學(xué)報(bào);2007年04期
5 王國慶;OA期刊——學(xué)術(shù)出版領(lǐng)域的巨流[J];現(xiàn)代情報(bào);2005年10期
6 潘琳;;OA期刊的來源、分布與質(zhì)量分析研究[J];圖書館理論與實(shí)踐;2007年01期
7 田質(zhì)兵;;基于OA期刊的信息推送服務(wù)研究[J];情報(bào)探索;2010年08期
8 韓奮發(fā);;OA期刊模式與大學(xué)學(xué)科館員制度對接整合和創(chuàng)新發(fā)展[J];安康學(xué)院學(xué)報(bào);2012年03期
9 馬紅;;比較OA期刊與OA知識庫實(shí)現(xiàn)途徑的差異分析[J];現(xiàn)代情報(bào);2008年02期
10 馬紅;;基于OA期刊與OA知識庫實(shí)現(xiàn)途徑的比較分析[J];圖書館學(xué)研究;2008年02期
相關(guān)碩士學(xué)位論文 前2條
1 張遷;OA期刊站點(diǎn)資源抽取與存儲方法[D];燕山大學(xué);2014年
2 杜寶瑞;基于Hadoop的OA期刊論文資源發(fā)現(xiàn)及采集方法[D];燕山大學(xué);2013年
,本文編號:1705470
本文鏈接:http://sikaile.net/tushudanganlunwen/1705470.html