引文元數(shù)據(jù)的自動發(fā)現(xiàn)和標注方法研究——以外文引文為例
[Abstract]:[objective] on the basis of summarizing the current extraction methods of citation metadata, combining semantic knowledge and machine learning methods, This paper explores the automatic extraction method of citation metadata. [methods] the neural network model is used to train the word vector of the manually segmented corpus in the experiment. The phenomenon that the same type of metadata appears relatively centrally in a certain position in vector space, The classification algorithm of support vector machine is used to automatically classify and annotate metadata. [results] in the experiment of using foreign citation data as test set, the method obtained high accuracy and recall rate. Especially for the phenomenon that citations contain many languages and abbreviations, they have good processing ability. [limitations] have some limitations in fine-grained extraction of temporal content of citation metadata. [conclusion] the experimental results show that, This method has a good effect on automatic discovery and tagging of citation metadata, and can greatly improve the applicability and fault tolerance of the method.
【作者單位】: 南京大學(xué)信息管理學(xué)院;江蘇省數(shù)據(jù)工程與知識服務(wù)重點實驗室;南京農(nóng)業(yè)大學(xué)信息科學(xué)技術(shù)學(xué)院;
【分類號】:G254
【參考文獻】
相關(guān)期刊論文 前3條
1 周練;;Word2vec的工作原理及應(yīng)用探究[J];科技情報開發(fā)與經(jīng)濟;2015年02期
2 蔣新;英美學(xué)術(shù)文獻的幾種主要引文方式[J];圖書與情報;2003年03期
3 李朝光,張銘,鄧志鴻,楊冬青,唐世渭;論文元數(shù)據(jù)信息的自動抽取[J];計算機工程與應(yīng)用;2002年21期
【共引文獻】
相關(guān)期刊論文 前10條
1 張興廳;文棟;雷健波;;中文消費者健康詞的發(fā)現(xiàn)方法研究[J];醫(yī)學(xué)信息學(xué)雜志;2017年05期
2 湯志康;李春英;湯庸;黃泳航;蔡奕彬;;學(xué)術(shù)社交平臺論文推薦方法[J];計算機與數(shù)字工程;2017年02期
3 姚靜天;王永利;侍秋艷;董振江;;基于聯(lián)合物品搭配度的推薦算法框架[J];上海理工大學(xué)學(xué)報;2017年01期
4 姜霖;王東波;;引文元數(shù)據(jù)的自動發(fā)現(xiàn)和標注方法研究——以外文引文為例[J];數(shù)據(jù)分析與知識發(fā)現(xiàn);2017年01期
5 曹軍;王虎;;外賣用戶差評影響因素研究——基于文本評論和Word2vec[J];現(xiàn)代商貿(mào)工業(yè);2017年02期
6 馮民;毛善鋒;;一種適合大批量期刊元數(shù)據(jù)自動化提取的程序設(shè)計[J];中國科技期刊研究;2016年10期
7 吳笛;李保強;;大數(shù)據(jù)背景下基于主題模型的學(xué)習(xí)資源聚合研究[J];電化教育研究;2016年09期
8 潘曉英;胡開開;朱靜;;一種基于TextRank的文本二次聚類算法[J];計算機技術(shù)與發(fā)展;2016年08期
9 寧建飛;劉降珍;;融合Word2vec與TextRank的關(guān)鍵詞抽取研究[J];現(xiàn)代圖書情報技術(shù);2016年06期
10 李保強;吳笛;;基于知識關(guān)聯(lián)的學(xué)習(xí)資源混合協(xié)同過濾推薦研究[J];電化教育研究;2016年06期
【二級參考文獻】
相關(guān)期刊論文 前1條
1 黃豫清,戚廣志,張福炎;從WEB文檔中構(gòu)造半結(jié)構(gòu)化信息的抽取器[J];軟件學(xué)報;2000年01期
【相似文獻】
相關(guān)期刊論文 前10條
1 于海燕,周順平;空間元數(shù)據(jù)系統(tǒng)的研究與設(shè)計[J];現(xiàn)代計算機(專業(yè)版);2002年09期
2 呂秋培,解素芳,李新利,盧曉慧,任鳳仙,于慧敏,劉彩霞,陳曉;關(guān)于元數(shù)據(jù)及其應(yīng)用[J];檔案學(xué)通訊;2003年03期
3 王繼周,李成名,林宗堅;面向共享的空間元數(shù)據(jù)管理框架研究與設(shè)計[J];國土資源遙感;2003年03期
4 李雙文;;論元數(shù)據(jù)的概念、層次和作用[J];云南檔案;2009年09期
5 楊茹;張愛文;;黑龍江省交通數(shù)字化中元數(shù)據(jù)創(chuàng)建問題研究[J];黑龍江工程學(xué)院學(xué)報(自然科學(xué)版);2010年03期
6 曹樹金,馬利霞;描述教育資源的元數(shù)據(jù)標準[J];大學(xué)圖書館學(xué)報;2004年02期
7 熊志剛,徐梅林;基于元數(shù)據(jù)及語意網(wǎng)的學(xué)習(xí)技術(shù)探討[J];開放教育研究;2004年05期
8 袁平,韓景潤,黨海飛;空間元數(shù)據(jù)自動生成技術(shù)研究[J];地理信息世界;2005年01期
9 李曉霞;;元數(shù)據(jù)在空間信息網(wǎng)上發(fā)布中的實現(xiàn)方法與應(yīng)用[J];計算機時代;2006年04期
10 傅海洋;黃俊;劉曉晨;;物流元數(shù)據(jù)及其管理研究[J];物流科技;2008年10期
相關(guān)會議論文 前10條
1 趙培翔;張銘;楊冬青;唐世渭;;數(shù)字化文檔元數(shù)據(jù)的自動提取[A];第二十屆全國數(shù)據(jù)庫學(xué)術(shù)會議論文集(研究報告篇)[C];2003年
2 陳勝鵬;邱文;;基于元數(shù)據(jù)的空間地理信息管理系統(tǒng)整合的研究與實現(xiàn)[A];中國測繪學(xué)會第九次全國會員代表大會暨學(xué)會成立50周年紀念大會論文集[C];2009年
3 萬甜甜;劉強;董海良;;西南資源環(huán)境信息元數(shù)據(jù)研究[A];第四屆海峽兩岸GIS發(fā)展研討會暨中國GIS協(xié)會第十屆年會論文集[C];2006年
4 白云;高國勇;;基于Web的城市地下管線元數(shù)據(jù)共享機制的研究[A];吉林省測繪學(xué)會2008年學(xué)術(shù)年會論文集(上)[C];2008年
5 殷寧欣;張衛(wèi)平;張濤;;空間信息系統(tǒng)中的模型方法元數(shù)據(jù)標準研究[A];吉林省測繪學(xué)會2008年學(xué)術(shù)年會論文集(上)[C];2008年
6 韓先培;趙軍;;基于Wikipedia的語義元數(shù)據(jù)生成[A];第四屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議論文集(上)[C];2008年
7 王蜀安;張銘;王愛華;楊冬青;;構(gòu)建基于OAI協(xié)議的可互操作數(shù)字圖書館元數(shù)據(jù)服務(wù)[A];第十九屆全國數(shù)據(jù)庫學(xué)術(shù)會議論文集(技術(shù)報告篇)[C];2002年
8 廖軼;黃磊;袁芳;;元數(shù)據(jù)在高校數(shù)據(jù)中心的應(yīng)用探索[A];中國高等教育學(xué)會教育信息化分會第十二次學(xué)術(shù)年會論文集[C];2014年
9 徐佳沅;;規(guī)劃信息數(shù)據(jù)庫的元數(shù)據(jù)集成管理研究[A];廣東省測繪學(xué)會第九次會員代表大會暨學(xué)術(shù)交流會論文集[C];2010年
10 陳X;李心科;;基于可擴展數(shù)據(jù)清理框架的元數(shù)據(jù)的研究[A];計算機技術(shù)與應(yīng)用進展·2007——全國第18屆計算機技術(shù)與應(yīng)用(CACIS)學(xué)術(shù)會議論文集[C];2007年
相關(guān)博士學(xué)位論文 前5條
1 劉海學(xué);基于語義標注的元數(shù)據(jù)自動構(gòu)建及其相關(guān)技術(shù)研究[D];華東師范大學(xué);2010年
2 符海芳;網(wǎng)絡(luò)地理信息組織和提取的研究及其在農(nóng)業(yè)信息中的應(yīng)用[D];中南大學(xué);2003年
3 辜寄蓉;基于元數(shù)據(jù)的綜合數(shù)據(jù)管理與信息共享[D];成都理工大學(xué);2003年
4 徐昊;科技知識對象的語義模式研究[D];吉林大學(xué);2013年
5 王霞;衛(wèi)生統(tǒng)計調(diào)查元數(shù)據(jù)概念模型的研究[D];第四軍醫(yī)大學(xué);2006年
相關(guān)碩士學(xué)位論文 前10條
1 安靜;基于元數(shù)據(jù)動態(tài)獲取的數(shù)據(jù)質(zhì)量檢查技術(shù)[D];中國地質(zhì)大學(xué)(北京);2015年
2 李欣;交通物流信息平臺元數(shù)據(jù)研究與應(yīng)用[D];長安大學(xué);2015年
3 施偉;高性能分布式文件系統(tǒng)元數(shù)據(jù)服務(wù)設(shè)計與實現(xiàn)[D];電子科技大學(xué);2014年
4 呂鵬程;一個分布式文件系統(tǒng)元數(shù)據(jù)服務(wù)器設(shè)計與實現(xiàn)[D];電子科技大學(xué);2015年
5 趙卓;禽肉質(zhì)量安全追溯元數(shù)據(jù)研究[D];河北科技師范學(xué)院;2014年
6 秦超;本體元數(shù)據(jù)設(shè)計、提取及應(yīng)用[D];南京大學(xué);2014年
7 白雷;云存儲中獨立元數(shù)據(jù)的設(shè)計與實現(xiàn)[D];西安電子科技大學(xué);2014年
8 袁進俊;DOA下分布式DRC的元數(shù)據(jù)分級存儲模型研究[D];成都理工大學(xué);2015年
9 張雷;DOA下的數(shù)據(jù)注冊中心元數(shù)據(jù)存儲策略研究[D];成都理工大學(xué);2013年
10 王芳;基于XML的網(wǎng)上閱卷系統(tǒng)設(shè)計[D];太原理工大學(xué);2016年
,本文編號:2406871
本文鏈接:http://sikaile.net/tushudanganlunwen/2406871.html