期刊論文元數(shù)據(jù)自動(dòng)抽取系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)
本文關(guān)鍵詞:期刊論文元數(shù)據(jù)自動(dòng)抽取系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)
更多相關(guān)文章: 元數(shù)據(jù) 命名實(shí)體 信息抽取 正則表達(dá)式
【摘要】:本文提出一種利用網(wǎng)頁文本結(jié)構(gòu)聚類從而抽取參考文獻(xiàn)元數(shù)據(jù)的方法,并利用期刊論文的自有格式和同一網(wǎng)站結(jié)構(gòu)相似的特征提取期刊論文的其余元數(shù)據(jù)。該方法首先將網(wǎng)頁期刊論文進(jìn)行文本塊的劃分,再利用正則表達(dá)式和文本結(jié)構(gòu)的特性實(shí)現(xiàn)元數(shù)據(jù)的自動(dòng)抽取。實(shí)驗(yàn)數(shù)據(jù)證明了該方法的有效性。
【作者單位】: 南京中醫(yī)藥大學(xué)經(jīng)貿(mào)管理學(xué)院信息管理系;
【關(guān)鍵詞】: 元數(shù)據(jù) 命名實(shí)體 信息抽取 正則表達(dá)式
【基金】:江蘇省社會(huì)科學(xué)基金項(xiàng)目“網(wǎng)絡(luò)輿情監(jiān)控預(yù)警模式研究”(項(xiàng)目編號(hào):10TQC008) 江蘇省高校哲學(xué)社會(huì)科學(xué)研究基金項(xiàng)目“基于本體的高校突發(fā)事件網(wǎng)絡(luò)輿情監(jiān)控預(yù)警模式研究”(項(xiàng)目編號(hào):2010SJB870003) 江蘇省教育科學(xué)“十二五”規(guī)劃2011年度課題“中國高等醫(yī)藥院校學(xué)術(shù)影響力研究”(項(xiàng)目編號(hào):C-c/2011/01/81) 南京中醫(yī)藥大學(xué)醫(yī)史文獻(xiàn)學(xué)科建設(shè)基金項(xiàng)目“基于海量科技文獻(xiàn)信息的中醫(yī)學(xué)知識(shí)組織研究”(項(xiàng)目編號(hào):WX2013-12) 江蘇省教育廳“青藍(lán)工程”資助(項(xiàng)目編號(hào):蘇教師(2014)23號(hào))資助的研究成果之一
【分類號(hào)】:TP393.092
【正文快照】: 目前,利用引文分析法進(jìn)行科學(xué)評(píng)價(jià)研究已經(jīng)相當(dāng)成熟,而且涌現(xiàn)出大批成果,但是一般研究機(jī)構(gòu)難以開展引文數(shù)據(jù)加工工作,因而也就無法利用第一手?jǐn)?shù)據(jù)進(jìn)行相關(guān)研究工作。究其原因:一是引文數(shù)據(jù)量太大,人力、物力有限;二是引文標(biāo)注格式不統(tǒng)一,對加工人員的素質(zhì)要求較高。如何克服大
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 肖剛;;元數(shù)據(jù)在P2P網(wǎng)絡(luò)下查詢改進(jìn)中的應(yīng)用[J];計(jì)算機(jī)與數(shù)字工程;2012年04期
2 高妮;周明全;耿國華;賀毅岳;;網(wǎng)絡(luò)科技資源平臺(tái)中元數(shù)據(jù)的設(shè)計(jì)與實(shí)現(xiàn)[J];計(jì)算機(jī)工程與應(yīng)用;2009年25期
3 周立軍;邢紅宏;張杰;;基于元數(shù)據(jù)的軍械保障信息資源共享服務(wù)研究[J];計(jì)算機(jī)系統(tǒng)應(yīng)用;2013年10期
4 李蓮花,劉淵;基于元數(shù)據(jù)的網(wǎng)絡(luò)資源管理系統(tǒng)的建設(shè)研究[J];信息技術(shù);2002年11期
5 張萍;網(wǎng)絡(luò)環(huán)境下的元數(shù)據(jù)研究[J];新疆石油教育學(xué)院學(xué)報(bào);2005年01期
6 郭瑞華,張玉莉;語義Web上DC元數(shù)據(jù)的描述及抽取技術(shù)[J];現(xiàn)代情報(bào);2005年06期
7 陳濤;肖儂;劉芳;;對象存儲(chǔ)系統(tǒng)中自適應(yīng)的元數(shù)據(jù)負(fù)載均衡機(jī)制[J];軟件學(xué)報(bào);2013年02期
8 尚佳;楊吉江;許有志;;基于XML的電子文件元數(shù)據(jù)捕獲系統(tǒng)研究[J];計(jì)算機(jī)與數(shù)字工程;2011年10期
9 王卷樂;游松財(cái);孫九林;;地學(xué)數(shù)據(jù)共享網(wǎng)絡(luò)中的元數(shù)據(jù)擴(kuò)展和互操作技術(shù)[J];蘭州大學(xué)學(xué)報(bào);2006年05期
10 張萍;OAI元數(shù)據(jù)獲取協(xié)議[J];情報(bào)理論與實(shí)踐;2003年06期
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前7條
1 許發(fā)見;元數(shù)據(jù)在教學(xué)網(wǎng)站中的應(yīng)用研究[D];河海大學(xué);2004年
2 袁俊超;G/S模式下分布式空間數(shù)據(jù)服務(wù)器群中的元數(shù)據(jù)組織與管理[D];成都理工大學(xué);2010年
3 廖程鋒;一種基于元數(shù)據(jù)的搜索引擎的設(shè)計(jì)與實(shí)現(xiàn)[D];中南大學(xué);2004年
4 趙治軍;OAI-PMH中元數(shù)據(jù)相似度計(jì)算的研究與實(shí)現(xiàn)[D];太原科技大學(xué);2009年
5 李相娜;基于LDAP的元數(shù)據(jù)服務(wù)器集群的研究與實(shí)現(xiàn)[D];華中科技大學(xué);2007年
6 張磊;基于P2P的信息共享Agent研究[D];浙江大學(xué);2005年
7 王愛國;基于校園網(wǎng)的XML信息表示及數(shù)據(jù)挖掘研究[D];山東大學(xué);2005年
,本文編號(hào):541602
本文鏈接:http://sikaile.net/wenshubaike/xingzhengshiwu/541602.html