關鍵詞時間分布特征視角下的研究前沿探測研究
發(fā)布時間:2021-09-30 21:19
研究前沿探測作為科學計量學的重要研究內(nèi)容,對于學術領域有著重要意義。一個學科領域的研究前沿往往代表著領域內(nèi)最核心的研究主題與發(fā)展趨勢,對研究者科研選題及國家科技政策制定具有重要的參考價值。從研究前沿的概念提出至今,學者們提出了不同的研究前沿探測方法。主流方法有詞頻分析法、突顯詞檢測方法、共詞分析法和基于引文的方法等。關鍵詞是研究前沿探測的重要載體之一,基于關鍵詞的分析方法通常是將關鍵詞詞頻作為研究前沿探測的原始數(shù)據(jù),以詞頻的大小和詞頻變化的快慢為依據(jù),通過分析研究主題的發(fā)展趨勢和演化過程來探測學科領域的研究前沿。詞頻方法因數(shù)據(jù)處理簡單、結果分析直觀而被廣泛使用。但現(xiàn)有的詞頻方法依舊存在可改進之處,現(xiàn)有方法為了反映詞頻在時間維度的變化過程,通常會將詞頻做時間切片處理,這一操作簡化了數(shù)據(jù)計算,但忽略了時間窗口內(nèi)的關鍵詞時間分布特征,使得同一時間窗口內(nèi)的關鍵詞差異性消失,且詞頻變化在整個時間軸上的連續(xù)性也遭到破壞。本研究的目的正是為了克服上述缺陷,在較為全面保留關鍵詞原始時間分布特征的基礎上,能夠更加精細化刻畫關鍵詞的演化過程。本研究以《中文核心期刊概覽》的統(tǒng)計學、會計、電影電視藝術、測繪學...
【文章來源】:西南大學重慶市 211工程院校 教育部直屬院校
【文章頁數(shù)】:97 頁
【學位級別】:碩士
【部分圖文】:
圖3-4詞頻變化(時間窗口大小為天)??3.3研究方法與指標解釋??現(xiàn)有方法普遍需要采用時間窗口的方法,而如果以更細致的時間分布特?
西南大學肅士學ft論隻??將關鍵詞詞頻累積散點進行曲線擬合,即可得到關鍵詞累積分布函數(shù)??y?=?fit)??400??350??jr??300??250?I??200?I??150?.I??:,d|IIIIIfllllll?I??圖3-5關鍵詞詞頻累積過程??外)為以時間為自變量的函數(shù),取定義域內(nèi)任意f值,即有一個少值與之對應,J等??于〖時刻關鍵詞累積詞頻平滑化處理結果。??關鍵詞累積分布函數(shù)是對關鍵詞詞頻時間分布特征的精細化描述,它將詞頻的增??長過程視為連續(xù)的變化過程,保留了關鍵詞隨時間變化的動態(tài)信息,且關鍵詞累積分??布曲線且經(jīng)過平滑化處理后,數(shù)據(jù)偶然性誤差也I在一定程度上得到降低。關鍵詞詞??頻累積過程存在速度快慢與加速減速的區(qū)別,從關鍵詞累積分布函數(shù)識別關鍵詞的動??態(tài)發(fā)展過程可以通過函數(shù)求導來實現(xiàn)。??為此,本研究提出詞頻累積速度與詞頻累積加逋度兩個概念。I??詞頻累積速度;??S?=尸⑴??詞頻累積加速度??a?=?/?(t)??為方便說明,本研宄特設置了一組示例數(shù)據(jù)(如表3-1所示),圖3-6為關鍵詞??累積分布函數(shù)的示例圖像。曲線上某一點的斜率是詞頻累積的速度,在數(shù)學上的含義??為數(shù)據(jù)乎滑化處理后,一無內(nèi)關鍵詞的詞頻數(shù)量,反映的是關鍵詞在特定時刻的受關??注程度;速度的斜率為加速度,是指數(shù)據(jù)平滑化處理后,相鄰單位時間的關鍵詞詞頻??累積數(shù)暈變化率,反映下一個時刻速度的變化趨勢與變化方向,在微觀層面上反映變??量的發(fā)展?jié)摿ΑMㄟ^對關鍵詞累積分布函數(shù)求一階導數(shù)和二階導數(shù)可以得出詞頻累積??14??
速度與詞頻累積加速度函數(shù),它們共同描述了關鍵詞的變化過程,是與關鍵詞累積分??布函數(shù)等價的動態(tài)形式。??表3-1詞頻累積示例數(shù)據(jù)??時間.(舉控夫_.:)?■賽m頻數(shù)時間_(爆&?M軹詢頻*??1?0?2000?5??50?1?3000?6??300?2?5000?7??700?3?7300?8??1300?4?8500?9??
【參考文獻】:
期刊論文
[1]基于長尾關鍵詞的領域新興前沿探尋模型構建研究[J]. 廖鵬飛,李明鑫,萬鋒. 情報雜志. 2020(03)
[2]學科領域研究前沿探測方法研究述評[J]. 黃曉斌,吳高. 情報學報. 2019(08)
[3]主題-時序視域下中國圖書館學會年會主題分布及演化分析[J]. 郝晉清,王珺. 圖書情報工作. 2019(02)
[4]基于詞頻突變的我國兒童閱讀推廣前沿和發(fā)展趨勢研究[J]. 趙燕. 出版發(fā)行研究. 2019(01)
[5]領域前沿識別方法綜述[J]. 羅瑞,許海云,董坤. 圖書情報工作. 2018(23)
[6]關鍵詞詞頻變化視角下我國“科學數(shù)據(jù)”領域研究主題演化分析[J]. 姜鑫,王德莊,馬海群. 現(xiàn)代情報. 2018(01)
[7]基于核心詞、突變詞與新生詞的學科主題演化方法研究[J]. 劉敏娟,張學福,顏蘊. 情報雜志. 2016(12)
[8]關鍵詞詞頻變化視角下學科研究發(fā)展趨勢分析——以國內(nèi)情報學研究為例[J]. 周鑫,陳媛媛. 情報雜志. 2016(05)
[9]基于關鍵詞共現(xiàn)的研究前沿識別方法研究[J]. 鄭彥寧,許曉陽,劉志輝. 圖書情報工作. 2016(04)
[10]基于新生詞與知識圖譜的新興趨勢探測研究[J]. 馮佳,張云秋. 情報理論與實踐. 2015(11)
博士論文
[1]研究前沿識別與分析方法研究[D]. 馮佳.吉林大學 2017
本文編號:3416657
【文章來源】:西南大學重慶市 211工程院校 教育部直屬院校
【文章頁數(shù)】:97 頁
【學位級別】:碩士
【部分圖文】:
圖3-4詞頻變化(時間窗口大小為天)??3.3研究方法與指標解釋??現(xiàn)有方法普遍需要采用時間窗口的方法,而如果以更細致的時間分布特?
西南大學肅士學ft論隻??將關鍵詞詞頻累積散點進行曲線擬合,即可得到關鍵詞累積分布函數(shù)??y?=?fit)??400??350??jr??300??250?I??200?I??150?.I??:,d|IIIIIfllllll?I??圖3-5關鍵詞詞頻累積過程??外)為以時間為自變量的函數(shù),取定義域內(nèi)任意f值,即有一個少值與之對應,J等??于〖時刻關鍵詞累積詞頻平滑化處理結果。??關鍵詞累積分布函數(shù)是對關鍵詞詞頻時間分布特征的精細化描述,它將詞頻的增??長過程視為連續(xù)的變化過程,保留了關鍵詞隨時間變化的動態(tài)信息,且關鍵詞累積分??布曲線且經(jīng)過平滑化處理后,數(shù)據(jù)偶然性誤差也I在一定程度上得到降低。關鍵詞詞??頻累積過程存在速度快慢與加速減速的區(qū)別,從關鍵詞累積分布函數(shù)識別關鍵詞的動??態(tài)發(fā)展過程可以通過函數(shù)求導來實現(xiàn)。??為此,本研究提出詞頻累積速度與詞頻累積加逋度兩個概念。I??詞頻累積速度;??S?=尸⑴??詞頻累積加速度??a?=?/?(t)??為方便說明,本研宄特設置了一組示例數(shù)據(jù)(如表3-1所示),圖3-6為關鍵詞??累積分布函數(shù)的示例圖像。曲線上某一點的斜率是詞頻累積的速度,在數(shù)學上的含義??為數(shù)據(jù)乎滑化處理后,一無內(nèi)關鍵詞的詞頻數(shù)量,反映的是關鍵詞在特定時刻的受關??注程度;速度的斜率為加速度,是指數(shù)據(jù)平滑化處理后,相鄰單位時間的關鍵詞詞頻??累積數(shù)暈變化率,反映下一個時刻速度的變化趨勢與變化方向,在微觀層面上反映變??量的發(fā)展?jié)摿ΑMㄟ^對關鍵詞累積分布函數(shù)求一階導數(shù)和二階導數(shù)可以得出詞頻累積??14??
速度與詞頻累積加速度函數(shù),它們共同描述了關鍵詞的變化過程,是與關鍵詞累積分??布函數(shù)等價的動態(tài)形式。??表3-1詞頻累積示例數(shù)據(jù)??時間.(舉控夫_.:)?■賽m頻數(shù)時間_(爆&?M軹詢頻*??1?0?2000?5??50?1?3000?6??300?2?5000?7??700?3?7300?8??1300?4?8500?9??
【參考文獻】:
期刊論文
[1]基于長尾關鍵詞的領域新興前沿探尋模型構建研究[J]. 廖鵬飛,李明鑫,萬鋒. 情報雜志. 2020(03)
[2]學科領域研究前沿探測方法研究述評[J]. 黃曉斌,吳高. 情報學報. 2019(08)
[3]主題-時序視域下中國圖書館學會年會主題分布及演化分析[J]. 郝晉清,王珺. 圖書情報工作. 2019(02)
[4]基于詞頻突變的我國兒童閱讀推廣前沿和發(fā)展趨勢研究[J]. 趙燕. 出版發(fā)行研究. 2019(01)
[5]領域前沿識別方法綜述[J]. 羅瑞,許海云,董坤. 圖書情報工作. 2018(23)
[6]關鍵詞詞頻變化視角下我國“科學數(shù)據(jù)”領域研究主題演化分析[J]. 姜鑫,王德莊,馬海群. 現(xiàn)代情報. 2018(01)
[7]基于核心詞、突變詞與新生詞的學科主題演化方法研究[J]. 劉敏娟,張學福,顏蘊. 情報雜志. 2016(12)
[8]關鍵詞詞頻變化視角下學科研究發(fā)展趨勢分析——以國內(nèi)情報學研究為例[J]. 周鑫,陳媛媛. 情報雜志. 2016(05)
[9]基于關鍵詞共現(xiàn)的研究前沿識別方法研究[J]. 鄭彥寧,許曉陽,劉志輝. 圖書情報工作. 2016(04)
[10]基于新生詞與知識圖譜的新興趨勢探測研究[J]. 馮佳,張云秋. 情報理論與實踐. 2015(11)
博士論文
[1]研究前沿識別與分析方法研究[D]. 馮佳.吉林大學 2017
本文編號:3416657
本文鏈接:http://sikaile.net/guanlilunwen/keyanlw/3416657.html
最近更新
教材專著