科技論文中學(xué)術(shù)信息的提取方法綜述
發(fā)布時(shí)間:2018-03-13 01:35
本文選題:學(xué)術(shù)信息 切入點(diǎn):論文全文本 出處:《數(shù)字圖書(shū)館論壇》2017年10期 論文類(lèi)型:期刊論文
【摘要】:為更好地利用和挖掘?qū)W術(shù)論文文本,識(shí)別并提取學(xué)術(shù)論文中的學(xué)術(shù)信息已成為一種非常迫切的現(xiàn)實(shí)需求,在文本挖掘、信息檢索、主題監(jiān)測(cè)、信息計(jì)量學(xué)等領(lǐng)域都有廣闊的應(yīng)用前景。學(xué)術(shù)信息可以分為題錄信息、章節(jié)信息、引文信息、引用信息和其他信息。本文綜述了在PDF和HTML/XML兩種不同格式的學(xué)術(shù)論文全文中,提取各類(lèi)學(xué)術(shù)信息的主要方法,并指出這些方法主要面向的格式文本以及可用來(lái)提取的信息種類(lèi)。最后,本文列出了提取學(xué)術(shù)信息的常用工具。
[Abstract]:In order to make better use of and excavate the texts of academic papers and to identify and extract the academic information from academic papers, it has become a very urgent practical need. Information metrology and other fields have broad application prospects. Academic information can be divided into inscription information, chapter information, citation information, citation information and other information. The main methods of extracting all kinds of academic information are pointed out, and the format text and the kinds of information that can be used to extract them are pointed out. Finally, the common tools for extracting academic information are listed in this paper.
【作者單位】: 大連理工大學(xué)科學(xué)學(xué)與科技管理研究所;大連理工大學(xué)WISE實(shí)驗(yàn)室;
【基金】:國(guó)家自然科學(xué)基金項(xiàng)目“開(kāi)放獲取背景下的全文引文分析方法與應(yīng)用研究”(編號(hào):71503031)資助
【分類(lèi)號(hào)】:G254
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 陳云梅;;網(wǎng)上免費(fèi)學(xué)術(shù)信息資源的挖掘[J];農(nóng)業(yè)圖書(shū)情報(bào)學(xué)刊;2011年12期
2 胡紅亮;;網(wǎng)絡(luò)時(shí)代學(xué)術(shù)信息資源可信度研究[J];全球科技經(jīng)濟(jì)w,
本文編號(hào):1604268
本文鏈接:http://sikaile.net/tushudanganlunwen/1604268.html
最近更新
教材專(zhuān)著