提取方正排版文件廣義元數(shù)據(jù)并生成全文HTML的探索
發(fā)布時間:2017-12-21 03:09
本文關(guān)鍵詞:提取方正排版文件廣義元數(shù)據(jù)并生成全文HTML的探索 出處:《中國科技期刊研究》2016年02期 論文類型:期刊論文
更多相關(guān)文章: 廣義元數(shù)據(jù) 方正BD排版語言 VB編程軟件 自動全文提取 HTML文件
【摘要】:【目的】實現(xiàn)自動提取科技期刊全文元數(shù)據(jù)并生成HTML文件!痉椒ā恳苑秸虐嫖募䴙閷ο,在可以提取出來文章的標(biāo)題、摘要等元數(shù)據(jù)的基礎(chǔ)上,將文章的正文內(nèi)容元數(shù)據(jù)化,提出了包含圖、表、公式等的廣義元數(shù)據(jù)概念,并建立了提取圖、表元數(shù)據(jù)的提取規(guī)則,同時將方正排版數(shù)學(xué)公式轉(zhuǎn)化為La Te X表達(dá)式。然后利用VB編程軟件編寫了自動提取廣義元數(shù)據(jù)程序并將元數(shù)據(jù)重新組合生成HTML格式的文件。【結(jié)果】根據(jù)方正BD排版語言的特點,建立的提取規(guī)則能有效提取全文并元數(shù)據(jù)化,最后可直接生成HTML文件!窘Y(jié)論】實際應(yīng)用表明了利用廣義元數(shù)據(jù)生成HTML文件的有效性和可行性。
【作者單位】: 東北大學(xué)學(xué)報編輯部;
【基金】:遼寧省社會科學(xué)規(guī)劃基金資助項目(L12DXW011)
【分類號】:G230.7
【正文快照】: 東北大學(xué)學(xué)報編輯部,遼寧省沈陽市和平區(qū)文化路三巷11號110819目前,科技期刊的元數(shù)據(jù)[1]主要包含在網(wǎng)刊中提供標(biāo)題、作者、中英文摘要、關(guān)鍵詞及參考文獻(xiàn)等信息,這些信息基本包含了文章的研究內(nèi)容和大致的研究方法以及結(jié)果。但是由于信息量偏少,并不能完全體現(xiàn)論文的全部信息,
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前1條
1 周怡;胡大衛(wèi);段學(xué)儉;張世軍;張瑩瑩;章琢之;吳棄疾;;元數(shù)據(jù):數(shù)字出版發(fā)展的根基[J];編輯學(xué)刊;2011年05期
,本文編號:1314445
本文鏈接:http://sikaile.net/shekelunwen/chubanfaxing/1314445.html
最近更新
教材專著