天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

結(jié)合時(shí)間切片信息的作者共引分析方法與實(shí)證

發(fā)布時(shí)間:2019-11-11 01:35
【摘要】:[目的 /意義]傳統(tǒng)作者共引分析(ACA)方法將領(lǐng)域發(fā)展視為一個(gè)整體,忽略領(lǐng)域發(fā)展期間的變化,導(dǎo)致知識(shí)圖譜解讀會(huì)產(chǎn)生一定的偏差。本文旨在引入時(shí)間變量,找出領(lǐng)域發(fā)展期間的轉(zhuǎn)變關(guān)鍵節(jié)點(diǎn),并以此作為時(shí)間切片的劃分依據(jù),利用ACA繪制每個(gè)時(shí)間切片內(nèi)部的知識(shí)圖譜,觀察領(lǐng)域內(nèi)的子領(lǐng)域發(fā)展與核心作者的變化。[方法 /過(guò)程]首先通過(guò)作者的年度發(fā)文比例對(duì)時(shí)間切片進(jìn)行選取,借鑒經(jīng)濟(jì)學(xué)均線理論對(duì)曲線做平滑處理,選取曲線變化度較高的年份作為轉(zhuǎn)變節(jié)點(diǎn)切割時(shí)間段,并對(duì)每個(gè)時(shí)間切片內(nèi)進(jìn)行ACA的運(yùn)算與結(jié)果分析。[結(jié)果 /結(jié)論]結(jié)果顯示,隨著時(shí)間的變遷,領(lǐng)域知識(shí)圖譜發(fā)生了相應(yīng)的變化,利用作者發(fā)文比例選擇時(shí)間切點(diǎn)進(jìn)行綜合時(shí)間切片的作者共引分析提高了聚類(lèi)結(jié)果的群聚性,且有助于挖掘出科學(xué)共同體的更多細(xì)節(jié)。
【圖文】:

示意圖,共引分析,時(shí)間切片,方法流程


公式5)其中,V(n)越大代表該時(shí)間點(diǎn)的轉(zhuǎn)折度越大,值越小則代表改時(shí)間點(diǎn)的過(guò)渡相對(duì)平緩,本文選取轉(zhuǎn)折度最高的點(diǎn)作為時(shí)間切片。2.2綜合時(shí)間切片的作者共引分析方法傳統(tǒng)ACA方法的步驟包括:①選取共引研究數(shù)據(jù);②數(shù)據(jù)清洗與作者姓名消歧;③建立作者共引原始矩陣;④相關(guān)矩陣轉(zhuǎn)化;⑤作者共引可視化分析;⑥結(jié)果展示與解讀。但是這種方法難以準(zhǔn)確找到領(lǐng)域的不同更迭階段,不能有效揭示子領(lǐng)域的變遷情況。本文提出的“綜合時(shí)間切片的作者共引分析方法”則指在時(shí)間分段的情況下,對(duì)每個(gè)時(shí)間段進(jìn)行ACA分析。如圖1所示:圖1結(jié)合時(shí)間切片信息的作者共引分析方法流程示意圖首先計(jì)算作者發(fā)文比例及時(shí)間權(quán)重,繪制時(shí)間權(quán)重變化曲線,接著使用“基于均線理論的時(shí)間切片方法”對(duì)圖像做平滑處理,通過(guò)計(jì)算變化度選取極值作為領(lǐng)域的關(guān)鍵時(shí)間節(jié)點(diǎn),并劃分時(shí)間切片。在已有的時(shí)間切片基礎(chǔ)上,將數(shù)據(jù)分時(shí)間段分別作ACA分析,并繪制知識(shí)圖譜進(jìn)行解讀。通過(guò)對(duì)時(shí)間切片的劃分,可以比較不同時(shí)間段內(nèi)部的相異之處,有助于挖掘作者共引分析的更多細(xì)節(jié),悉知領(lǐng)域熱點(diǎn)的變遷和子領(lǐng)域研究的興衰情況。3實(shí)證結(jié)果3.1數(shù)據(jù)集的獲取筆者抓取了WebofScience(WOS)數(shù)據(jù)庫(kù)中的所有期刊信息,數(shù)據(jù)共包括20359篇文章和文章中的59162名作者,以及這些文章引用的558498篇參考文獻(xiàn)(引文)[21]。這批數(shù)據(jù)與參考文獻(xiàn)[21]所使用數(shù)據(jù)一致,其檢索式中要求所有數(shù)據(jù)介于1956-2016之間,,檢索時(shí)使用以下檢索詞,詞間用OR連接:informationretrieval、informationstorageandretrieval、queryprocess-137

信息檢索,時(shí)間切片,階段,原文


61卷第16期2017年8月ing、documentretrieval、dataretrieval、imageretrieval、textretrieval、contentbasedretrieval、content-basedretrieval、databasequery、databasequeries、querylanguage。在計(jì)算時(shí)間權(quán)重并利用均線理論對(duì)曲線做平滑處理時(shí),筆者使用了全部原文作者的信息,而在引入時(shí)間切片的作者共引分析中,為避免共引矩陣過(guò)于稀疏,僅選取了每個(gè)時(shí)間段內(nèi)發(fā)文量最高用的100名作者的信息作為數(shù)據(jù)集。3.2時(shí)間切片的結(jié)果展示筆者利用檢索到的全部原文作者信息計(jì)算時(shí)間權(quán)重并繪制出信息檢索領(lǐng)域變化曲線,如圖2所示。之后利用基于均線理論的時(shí)間切片方法對(duì)曲線進(jìn)行平滑處理,并通過(guò)計(jì)算變化度找到3個(gè)相應(yīng)時(shí)間切點(diǎn),分別是1969、1989和2007年。圖2信息檢索領(lǐng)域發(fā)文數(shù)量統(tǒng)計(jì)信息檢索領(lǐng)域的實(shí)際發(fā)展情況和得出的時(shí)間節(jié)點(diǎn)基本契合。1950以后,信息檢索領(lǐng)域開(kāi)始發(fā)展,進(jìn)入脫機(jī)檢索階段,這一時(shí)期使用的主要是順排文檔檢索技術(shù)。進(jìn)入20世紀(jì)60年代以后,由于搜索引擎的發(fā)展,信息檢索系統(tǒng)因商業(yè)和學(xué)術(shù)研究需要而建立。信息檢索領(lǐng)域逐漸從脫機(jī)批處理階段進(jìn)入網(wǎng)絡(luò)化階段開(kāi)端。此時(shí)期受計(jì)算機(jī)技術(shù)的限制,信息檢索尚處在發(fā)展初期,但研究和試驗(yàn)活動(dòng)非;钴S。此時(shí)期的代表人物為G.Salton[22]。Salton及其團(tuán)隊(duì)做出了眾多提高信息檢索(IR)系統(tǒng)的技術(shù)性報(bào)告,如向量空間模型(vectorspacemodel)的提出、對(duì)與查詢(xún)相關(guān)的文獻(xiàn)進(jìn)行排序的算法等。此時(shí)期也有學(xué)者提出了引入相關(guān)性反饋(relevancefeedback)的方法,這是IR系統(tǒng)利用機(jī)器學(xué)習(xí)的開(kāi)始[23]。20世紀(jì)70到80年代,信息檢索進(jìn)入聯(lián)機(jī)網(wǎng)絡(luò)化和多元化階段。計(jì)算機(jī)科學(xué)和通訊網(wǎng)技術(shù)的發(fā)展,使得用戶(hù)檢索較少受到空間的限制。數(shù)據(jù)庫(kù)技術(shù)、現(xiàn)代通信技術(shù)等促進(jìn)了信息檢索?


本文編號(hào):2559121

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/tushudanganlunwen/2559121.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶(hù)2eebe***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com