從數(shù)據(jù)挖掘偏差到文獻(xiàn)計(jì)量偏差
本文選題:數(shù)據(jù)挖掘 切入點(diǎn):數(shù)據(jù)挖掘偏差 出處:《情報(bào)理論與實(shí)踐》2017年10期 論文類(lèi)型:期刊論文
【摘要】:[目的/意義]互聯(lián)網(wǎng)的迅猛發(fā)展使得信息量增速不斷加快。作為從海量數(shù)據(jù)中發(fā)現(xiàn)有用知識(shí)的有力手段,數(shù)據(jù)挖掘成為近年的研究熱點(diǎn)。然而在數(shù)據(jù)挖掘過(guò)程中,輸出值和真實(shí)值之間往往存在著一定的差距,即數(shù)據(jù)挖掘偏差。[方法/過(guò)程]通過(guò)相關(guān)研究綜述了數(shù)據(jù)挖掘偏差的概念、研究進(jìn)展以及發(fā)展方向,并以數(shù)據(jù)挖掘的基本步驟類(lèi)比文獻(xiàn)計(jì)量的基本步驟,進(jìn)而提出文獻(xiàn)計(jì)量偏差的基本概念。從文獻(xiàn)來(lái)源選取、文獻(xiàn)數(shù)據(jù)預(yù)處理、文獻(xiàn)計(jì)量方法選取和計(jì)量結(jié)果解讀4個(gè)角度重點(diǎn)論述了文獻(xiàn)計(jì)量偏差的主要表現(xiàn)方式和解決辦法。[結(jié)果/結(jié)論]文章旨在呼吁未來(lái)該領(lǐng)域的相關(guān)研究關(guān)注文獻(xiàn)計(jì)量偏差及其帶來(lái)的負(fù)向影響,并期望相關(guān)研究能夠通過(guò)科學(xué)方法避免文獻(xiàn)計(jì)量偏差,從而得到更為準(zhǔn)確和可靠的結(jié)論。
[Abstract]:[objective / significance] the rapid development of the Internet has accelerated the increase in the amount of information. As a powerful means of finding useful knowledge from massive data, data mining has become a research hotspot in recent years. However, in the process of data mining, There is often a gap between the output value and the real value, that is, the deviation of data mining. [method / process] the concept, research progress and development direction of data mining deviation are summarized through relevant studies. The basic steps of data mining are analogous to the basic steps of document metrology, and then the basic concept of document metrology deviation is put forward. This paper mainly discusses the main manifestation and solution of bibliometric deviation from four angles: the selection of bibliometric methods and the interpretation of measurement results. [results / conclusions] this paper aims to appeal to the related research in this field to pay attention to bibliometrics in the future. Volume deviation and its negative effects, It is expected that the relevant research can avoid the metrological deviation through scientific methods, and thus obtain more accurate and reliable conclusions.
【作者單位】: 北京大學(xué)信息管理系;印第安納大學(xué)信息學(xué)與計(jì)算機(jī)學(xué)院;
【分類(lèi)號(hào)】:G353.1
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 杜慧敏;;基于數(shù)據(jù)挖掘的讀者流量與圖書(shū)館開(kāi)放能力分析系統(tǒng)[J];情報(bào)探索;2009年07期
2 高巖,胡靜濤;Web數(shù)據(jù)挖掘的原理、方法及用途[J];現(xiàn)代圖書(shū)情報(bào)技術(shù);2002年03期
3 何少卓;淺談數(shù)據(jù)挖掘及其在圖書(shū)館的應(yīng)用[J];圖書(shū)館界;2004年03期
4 黃蘭,孫林山,羅日輝;數(shù)據(jù)挖掘及其在圖書(shū)館管理中的應(yīng)用[J];華南熱帶農(nóng)業(yè)大學(xué)學(xué)報(bào);2005年02期
5 陳亞?wèn)|;;數(shù)據(jù)挖掘在圖書(shū)館中的應(yīng)用[J];中華醫(yī)學(xué)圖書(shū)情報(bào)雜志;2006年05期
6 張莉萍;;論圖書(shū)館個(gè)性化服務(wù)中用戶(hù)信息的Web數(shù)據(jù)挖掘[J];情報(bào)資料工作;2007年02期
7 張靜;;論數(shù)據(jù)挖掘與數(shù)據(jù)挖掘服務(wù)的實(shí)現(xiàn)[J];湘潭師范學(xué)院學(xué)報(bào)(社會(huì)科學(xué)版);2008年01期
8 王玉珍;;Web數(shù)據(jù)挖掘在數(shù)字圖書(shū)館個(gè)性化服務(wù)中的應(yīng)用[J];自動(dòng)化與儀器儀表;2010年03期
9 瑪依拉·再努拉;;淺談數(shù)據(jù)挖掘在圖書(shū)館個(gè)性化服務(wù)中的應(yīng)用[J];西域圖書(shū)館論壇;2010年04期
10 周文云;;數(shù)據(jù)挖掘在數(shù)字圖書(shū)館個(gè)性化服務(wù)中的研究與應(yīng)用[J];電腦知識(shí)與技術(shù);2011年28期
相關(guān)會(huì)議論文 前1條
1 雷三丫;劉慶敖;;數(shù)據(jù)挖掘在數(shù)字化圖書(shū)館個(gè)性化服務(wù)中的應(yīng)用[A];2008年中國(guó)高校通信類(lèi)院系學(xué)術(shù)研討會(huì)論文集(下冊(cè))[C];2009年
相關(guān)碩士學(xué)位論文 前10條
1 黃超;基于數(shù)據(jù)挖掘的移動(dòng)圖書(shū)館研究與實(shí)現(xiàn)[D];西安建筑科技大學(xué);2015年
2 韓雅麗;中醫(yī)藥數(shù)據(jù)挖掘文獻(xiàn)的信息計(jì)量學(xué)評(píng)價(jià)研究[D];山東中醫(yī)藥大學(xué);2016年
3 姜云龍;基于數(shù)據(jù)挖掘的高校大學(xué)生讀者閱讀趨向研究[D];東北師范大學(xué);2016年
4 李雅靜;基于數(shù)據(jù)挖掘的圖書(shū)館長(zhǎng)尾服務(wù)研究[D];北京交通大學(xué);2017年
5 肖健;數(shù)據(jù)挖掘在農(nóng)業(yè)數(shù)字圖書(shū)館中的應(yīng)用[D];湖南農(nóng)業(yè)大學(xué);2012年
6 曹美琴;數(shù)據(jù)挖掘在圖書(shū)館個(gè)性化服務(wù)中的應(yīng)用研究[D];西北大學(xué);2008年
7 楊華;數(shù)據(jù)挖掘在高校圖書(shū)館個(gè)性化推薦中的應(yīng)用研究[D];電子科技大學(xué);2009年
8 劉昶;基于數(shù)據(jù)挖掘的J高校圖書(shū)館圖書(shū)管理創(chuàng)新研究[D];南昌大學(xué);2014年
9 王斌;數(shù)據(jù)挖掘在高校圖書(shū)館服務(wù)中的應(yīng)用研究[D];西安理工大學(xué);2010年
10 劉瑩;基于XML的數(shù)字圖書(shū)館應(yīng)用模型設(shè)計(jì)[D];山東大學(xué);2007年
,本文編號(hào):1624647
本文鏈接:http://sikaile.net/tushudanganlunwen/1624647.html