基于LDA的國(guó)內(nèi)圖書情報(bào)學(xué)研究主題發(fā)現(xiàn)及其演化研究
發(fā)布時(shí)間:2021-10-29 06:39
21世紀(jì)信息化時(shí)代的圖書情報(bào)學(xué)充滿未知的機(jī)遇和挑戰(zhàn),隨著計(jì)算機(jī)技術(shù)與互聯(lián)網(wǎng)技術(shù)日新月異的發(fā)展及文獻(xiàn)出版速度的加快,圖書情報(bào)領(lǐng)域的研究成果呈現(xiàn)爆炸式增長(zhǎng)的態(tài)勢(shì),主題也更為多樣。主題模型可以幫助我們從信息文本中發(fā)現(xiàn)和提煉隱藏的、有積極作用的、可以分析的知識(shí)。LDA(Latent Dirichlet Allocation,隱含狄利克雷分配)是運(yùn)用最為廣泛的概率主題模型之一,是一個(gè)三層貝葉斯概率模型,由詞、主題和文檔三層結(jié)構(gòu)組成。通過(guò)詞袋(Bag Of Word)這一方法的運(yùn)用,復(fù)雜的文本信息被轉(zhuǎn)換成易于處理的數(shù)學(xué)信息。當(dāng)前,圖書情報(bào)領(lǐng)域聚焦于應(yīng)用該模型進(jìn)行科學(xué)文獻(xiàn)主題挖掘及主題演化研究。本文運(yùn)用LDA模型對(duì)國(guó)內(nèi)圖書情報(bào)學(xué)2006年至2017年這12年的研究文獻(xiàn)進(jìn)行主題發(fā)現(xiàn)。首先,運(yùn)用困惑度來(lái)確定模型主題數(shù)目,根據(jù)主題-詞項(xiàng)概率分布文件進(jìn)行主題標(biāo)識(shí);其次,根據(jù)文檔-主題概率分布文件計(jì)算各個(gè)主題的主題強(qiáng)度,對(duì)當(dāng)今國(guó)內(nèi)圖書情報(bào)學(xué)研究主題進(jìn)行具體分析;最后引入時(shí)間因素,依據(jù)主題強(qiáng)度分布情況對(duì)主題演化趨勢(shì)進(jìn)行分析,以期為我國(guó)圖書情報(bào)學(xué)相關(guān)研究提供數(shù)據(jù)支撐與參考。在中國(guó)知網(wǎng)(CNKI)學(xué)術(shù)期刊數(shù)據(jù)庫(kù)中,...
【文章來(lái)源】:曲阜師范大學(xué)山東省
【文章頁(yè)數(shù)】:51 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
國(guó)外以LIS為研究方向的發(fā)文量
圖 1-2 國(guó)內(nèi)以主題演化為研究方向的發(fā)文量2004 年,邱均平教授等人以三種核心期刊作為數(shù)據(jù)統(tǒng)計(jì)分析的來(lái)源,采用內(nèi)容分法,揭示了國(guó)內(nèi)外 2003 年情報(bào)學(xué)重要研究領(lǐng)域,探索其未來(lái)發(fā)展趨向[19];2007 年,成教授等運(yùn)用詞頻分析方法揭示了國(guó)內(nèi)外知識(shí)管理研究的熱點(diǎn),并從多個(gè)方面進(jìn)行了分析[20];2009 年,王萍選取三種國(guó)際教育技術(shù)期刊出版的文獻(xiàn)作為研究對(duì)象,利用進(jìn)行建模,并運(yùn)用相似度這一指標(biāo)進(jìn)行測(cè)度,實(shí)現(xiàn)主題挖掘的目的[21];2009 年何靜等一種客觀賦權(quán)法—熵值法,揭示了電子學(xué)與信息系統(tǒng)學(xué)科研究熱點(diǎn),預(yù)測(cè)未來(lái)發(fā)展趨2012 年,王莉亞等為了探究信息整合主題演化情況,運(yùn)用信息熵對(duì)來(lái)源數(shù)據(jù)進(jìn)行分析,進(jìn)而得到信息整合主題趨勢(shì)[23];2013 年,李勇等運(yùn)用相似度這一指標(biāo)進(jìn)行測(cè)度過(guò)觀察主題在各個(gè)時(shí)間窗口內(nèi)的變化,從主題偏移這一角度來(lái)探究主題演化趨勢(shì)[24]。2014 年,胡吉明等采用增量 Gibbs 抽樣估計(jì)算法對(duì) LDA 模型進(jìn)行了改進(jìn),構(gòu)建LDA 主題模型,運(yùn)用 LDA 主題模型進(jìn)行主題發(fā)現(xiàn),最后采用主題相似度和主題強(qiáng)度個(gè)指標(biāo)探析主題演化情況[25];2017 年,程淋等人綜合利用共詞分析、聚類分析、戰(zhàn)略圖等科學(xué)計(jì)量方法動(dòng)態(tài)分析了我國(guó)圖書情報(bào)學(xué)在三個(gè)時(shí)間段的研究主題,發(fā)現(xiàn)圖書情
圖 1-3 國(guó)內(nèi)以圖書情報(bào)為主題的發(fā)文量我國(guó)圖書情報(bào)—體化的歷程始于 1978 年,1979 年至 1984 年處于探索階段,此后主題為圖書情報(bào)的研究快速發(fā)展。1998 年,王崇德論述了互聯(lián)網(wǎng)使圖書情報(bào)學(xué)的理論、曾理與操作、服務(wù)工作產(chǎn)生了怎么樣的改變[27];2005 年,孫瑞英、畢強(qiáng)對(duì)內(nèi)容分析法的相關(guān)內(nèi)容進(jìn)行了闡述,主要對(duì)內(nèi)容分析法在圖書情報(bào)領(lǐng)域的研究現(xiàn)狀進(jìn)行了分析,最后闡述了內(nèi)容分析法在網(wǎng)絡(luò)數(shù)據(jù)分析方面的應(yīng)用前景和存在的弊端[28];2006 年,邱均平、段宇鋒提出知識(shí)在圖書情報(bào)學(xué)中領(lǐng)域中的地位越來(lái)越重要,學(xué)科研究多采用綜合性的方法,研究方法的綜合化趨勢(shì)愈來(lái)愈鮮明[29];2007 年,舒正勇、賈空寒等人用計(jì)量學(xué)方法,選擇 CNKI 作為來(lái)源數(shù)據(jù)庫(kù),對(duì)期刊論文的耦合情況進(jìn)行統(tǒng)計(jì),并充分地比較分析了耦合比率、藕荷強(qiáng)度、耦合最大論文、作者耦合這些數(shù)據(jù),從中發(fā)現(xiàn)圖書情報(bào)學(xué)研究的規(guī)律與特征[30];2014 年,張斌、賈茜通過(guò)對(duì)國(guó)內(nèi)圖書情報(bào)學(xué)期刊中的關(guān)鍵詞進(jìn)行統(tǒng)計(jì)分析,運(yùn)用文獻(xiàn)計(jì)量與聚類統(tǒng)計(jì)的方法,發(fā)現(xiàn)了國(guó)內(nèi)圖書情報(bào)學(xué)的知識(shí)分布與演化趨勢(shì)。最后比較分析了國(guó)內(nèi)外圖書情報(bào)學(xué)的知識(shí)結(jié)構(gòu)的異同[31];2015 年,吳丹、余文婷調(diào)查了 2010 年到 2014 年圖書情報(bào)學(xué)教育現(xiàn)狀,并對(duì)主要的發(fā)展趨勢(shì)進(jìn)行了總結(jié)[32];2018 年,史盛楠、李秀霞等人借助"二八定
【參考文獻(xiàn)】:
期刊論文
[1]大學(xué)生信息素養(yǎng)的群體差異性分析[J]. 王雅靜. 情報(bào)探索. 2018(12)
[2]2006—2016年管理科學(xué)與工程研究熱點(diǎn)主題研究——基于LDA概率主題模型分析[J]. 陳植元,楊海霞,王先甲. 珞珈管理評(píng)論. 2018(04)
[3]基于LDA模型的主題演化分析:以情報(bào)學(xué)文獻(xiàn)為例[J]. 朱茂然,王奕磊,高松,王洪偉,張曉鵬. 北京工業(yè)大學(xué)學(xué)報(bào). 2018(07)
[4]基于CTM模型的學(xué)科間知識(shí)交流分析——以圖書情報(bào)學(xué)和計(jì)算機(jī)信息科學(xué)間的知識(shí)交流為例[J]. 史盛楠,李秀霞,宋呈玉,謝瑞霞. 情報(bào)理論與實(shí)踐. 2018(07)
[5]基于共詞分析的我國(guó)圖書情報(bào)學(xué)研究主題演化分析[J]. 陳淋,屈文建. 新世紀(jì)圖書館. 2017(12)
[6]基于共詞分析法的學(xué)科主題演化研究方法的構(gòu)建[J]. 唐果媛. 圖書情報(bào)工作. 2017(23)
[7]基于結(jié)構(gòu)方程的移動(dòng)圖書館用戶體驗(yàn)滿意度模型研究[J]. 金小璞,畢新. 情報(bào)科學(xué). 2017(11)
[8]引文分布視角下期刊評(píng)價(jià)的P指數(shù)研究[J]. 陳衛(wèi)靜,張宇娥,藺梅芳. 圖書情報(bào)工作. 2017(17)
[9]基于軌跡聚類的個(gè)性化信息服務(wù)策略[J]. 高亞瑞璽,湯珊紅. 情報(bào)理論與實(shí)踐. 2017(06)
[10]基于UMLS的肺癌治療研究熱點(diǎn)分析[J]. 宮小翠,安新穎,趙迎光. 中華醫(yī)學(xué)圖書情報(bào)雜志. 2017(01)
博士論文
[1]研究前沿識(shí)別與分析方法研究[D]. 馮佳.吉林大學(xué) 2017
碩士論文
[1]基于LDA的國(guó)內(nèi)數(shù)字圖書館研究主題發(fā)現(xiàn)與演化[D]. 吳君麟.南昌大學(xué) 2017
[2]基于社會(huì)網(wǎng)絡(luò)分析的醫(yī)學(xué)領(lǐng)域主題演化探測(cè)研究[D]. 宮小翠.北京協(xié)和醫(yī)學(xué)院 2017
[3]基于科學(xué)計(jì)量的我國(guó)圖書情報(bào)學(xué)文獻(xiàn)分析[D]. 李國(guó)安.山西大學(xué) 2016
[4]基于知識(shí)圖譜的我國(guó)圖書情報(bào)學(xué)發(fā)展研究[D]. 陳淋.南昌大學(xué) 2016
[5]中國(guó)典型管理期刊文獻(xiàn)主題發(fā)現(xiàn)與演化分析[D]. 馬秀敏.大連理工大學(xué) 2011
[6]基于LDA的主題演化研究與實(shí)現(xiàn)[D]. 崔凱.國(guó)防科學(xué)技術(shù)大學(xué) 2010
本文編號(hào):3464159
【文章來(lái)源】:曲阜師范大學(xué)山東省
【文章頁(yè)數(shù)】:51 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
國(guó)外以LIS為研究方向的發(fā)文量
圖 1-2 國(guó)內(nèi)以主題演化為研究方向的發(fā)文量2004 年,邱均平教授等人以三種核心期刊作為數(shù)據(jù)統(tǒng)計(jì)分析的來(lái)源,采用內(nèi)容分法,揭示了國(guó)內(nèi)外 2003 年情報(bào)學(xué)重要研究領(lǐng)域,探索其未來(lái)發(fā)展趨向[19];2007 年,成教授等運(yùn)用詞頻分析方法揭示了國(guó)內(nèi)外知識(shí)管理研究的熱點(diǎn),并從多個(gè)方面進(jìn)行了分析[20];2009 年,王萍選取三種國(guó)際教育技術(shù)期刊出版的文獻(xiàn)作為研究對(duì)象,利用進(jìn)行建模,并運(yùn)用相似度這一指標(biāo)進(jìn)行測(cè)度,實(shí)現(xiàn)主題挖掘的目的[21];2009 年何靜等一種客觀賦權(quán)法—熵值法,揭示了電子學(xué)與信息系統(tǒng)學(xué)科研究熱點(diǎn),預(yù)測(cè)未來(lái)發(fā)展趨2012 年,王莉亞等為了探究信息整合主題演化情況,運(yùn)用信息熵對(duì)來(lái)源數(shù)據(jù)進(jìn)行分析,進(jìn)而得到信息整合主題趨勢(shì)[23];2013 年,李勇等運(yùn)用相似度這一指標(biāo)進(jìn)行測(cè)度過(guò)觀察主題在各個(gè)時(shí)間窗口內(nèi)的變化,從主題偏移這一角度來(lái)探究主題演化趨勢(shì)[24]。2014 年,胡吉明等采用增量 Gibbs 抽樣估計(jì)算法對(duì) LDA 模型進(jìn)行了改進(jìn),構(gòu)建LDA 主題模型,運(yùn)用 LDA 主題模型進(jìn)行主題發(fā)現(xiàn),最后采用主題相似度和主題強(qiáng)度個(gè)指標(biāo)探析主題演化情況[25];2017 年,程淋等人綜合利用共詞分析、聚類分析、戰(zhàn)略圖等科學(xué)計(jì)量方法動(dòng)態(tài)分析了我國(guó)圖書情報(bào)學(xué)在三個(gè)時(shí)間段的研究主題,發(fā)現(xiàn)圖書情
圖 1-3 國(guó)內(nèi)以圖書情報(bào)為主題的發(fā)文量我國(guó)圖書情報(bào)—體化的歷程始于 1978 年,1979 年至 1984 年處于探索階段,此后主題為圖書情報(bào)的研究快速發(fā)展。1998 年,王崇德論述了互聯(lián)網(wǎng)使圖書情報(bào)學(xué)的理論、曾理與操作、服務(wù)工作產(chǎn)生了怎么樣的改變[27];2005 年,孫瑞英、畢強(qiáng)對(duì)內(nèi)容分析法的相關(guān)內(nèi)容進(jìn)行了闡述,主要對(duì)內(nèi)容分析法在圖書情報(bào)領(lǐng)域的研究現(xiàn)狀進(jìn)行了分析,最后闡述了內(nèi)容分析法在網(wǎng)絡(luò)數(shù)據(jù)分析方面的應(yīng)用前景和存在的弊端[28];2006 年,邱均平、段宇鋒提出知識(shí)在圖書情報(bào)學(xué)中領(lǐng)域中的地位越來(lái)越重要,學(xué)科研究多采用綜合性的方法,研究方法的綜合化趨勢(shì)愈來(lái)愈鮮明[29];2007 年,舒正勇、賈空寒等人用計(jì)量學(xué)方法,選擇 CNKI 作為來(lái)源數(shù)據(jù)庫(kù),對(duì)期刊論文的耦合情況進(jìn)行統(tǒng)計(jì),并充分地比較分析了耦合比率、藕荷強(qiáng)度、耦合最大論文、作者耦合這些數(shù)據(jù),從中發(fā)現(xiàn)圖書情報(bào)學(xué)研究的規(guī)律與特征[30];2014 年,張斌、賈茜通過(guò)對(duì)國(guó)內(nèi)圖書情報(bào)學(xué)期刊中的關(guān)鍵詞進(jìn)行統(tǒng)計(jì)分析,運(yùn)用文獻(xiàn)計(jì)量與聚類統(tǒng)計(jì)的方法,發(fā)現(xiàn)了國(guó)內(nèi)圖書情報(bào)學(xué)的知識(shí)分布與演化趨勢(shì)。最后比較分析了國(guó)內(nèi)外圖書情報(bào)學(xué)的知識(shí)結(jié)構(gòu)的異同[31];2015 年,吳丹、余文婷調(diào)查了 2010 年到 2014 年圖書情報(bào)學(xué)教育現(xiàn)狀,并對(duì)主要的發(fā)展趨勢(shì)進(jìn)行了總結(jié)[32];2018 年,史盛楠、李秀霞等人借助"二八定
【參考文獻(xiàn)】:
期刊論文
[1]大學(xué)生信息素養(yǎng)的群體差異性分析[J]. 王雅靜. 情報(bào)探索. 2018(12)
[2]2006—2016年管理科學(xué)與工程研究熱點(diǎn)主題研究——基于LDA概率主題模型分析[J]. 陳植元,楊海霞,王先甲. 珞珈管理評(píng)論. 2018(04)
[3]基于LDA模型的主題演化分析:以情報(bào)學(xué)文獻(xiàn)為例[J]. 朱茂然,王奕磊,高松,王洪偉,張曉鵬. 北京工業(yè)大學(xué)學(xué)報(bào). 2018(07)
[4]基于CTM模型的學(xué)科間知識(shí)交流分析——以圖書情報(bào)學(xué)和計(jì)算機(jī)信息科學(xué)間的知識(shí)交流為例[J]. 史盛楠,李秀霞,宋呈玉,謝瑞霞. 情報(bào)理論與實(shí)踐. 2018(07)
[5]基于共詞分析的我國(guó)圖書情報(bào)學(xué)研究主題演化分析[J]. 陳淋,屈文建. 新世紀(jì)圖書館. 2017(12)
[6]基于共詞分析法的學(xué)科主題演化研究方法的構(gòu)建[J]. 唐果媛. 圖書情報(bào)工作. 2017(23)
[7]基于結(jié)構(gòu)方程的移動(dòng)圖書館用戶體驗(yàn)滿意度模型研究[J]. 金小璞,畢新. 情報(bào)科學(xué). 2017(11)
[8]引文分布視角下期刊評(píng)價(jià)的P指數(shù)研究[J]. 陳衛(wèi)靜,張宇娥,藺梅芳. 圖書情報(bào)工作. 2017(17)
[9]基于軌跡聚類的個(gè)性化信息服務(wù)策略[J]. 高亞瑞璽,湯珊紅. 情報(bào)理論與實(shí)踐. 2017(06)
[10]基于UMLS的肺癌治療研究熱點(diǎn)分析[J]. 宮小翠,安新穎,趙迎光. 中華醫(yī)學(xué)圖書情報(bào)雜志. 2017(01)
博士論文
[1]研究前沿識(shí)別與分析方法研究[D]. 馮佳.吉林大學(xué) 2017
碩士論文
[1]基于LDA的國(guó)內(nèi)數(shù)字圖書館研究主題發(fā)現(xiàn)與演化[D]. 吳君麟.南昌大學(xué) 2017
[2]基于社會(huì)網(wǎng)絡(luò)分析的醫(yī)學(xué)領(lǐng)域主題演化探測(cè)研究[D]. 宮小翠.北京協(xié)和醫(yī)學(xué)院 2017
[3]基于科學(xué)計(jì)量的我國(guó)圖書情報(bào)學(xué)文獻(xiàn)分析[D]. 李國(guó)安.山西大學(xué) 2016
[4]基于知識(shí)圖譜的我國(guó)圖書情報(bào)學(xué)發(fā)展研究[D]. 陳淋.南昌大學(xué) 2016
[5]中國(guó)典型管理期刊文獻(xiàn)主題發(fā)現(xiàn)與演化分析[D]. 馬秀敏.大連理工大學(xué) 2011
[6]基于LDA的主題演化研究與實(shí)現(xiàn)[D]. 崔凱.國(guó)防科學(xué)技術(shù)大學(xué) 2010
本文編號(hào):3464159
本文鏈接:http://sikaile.net/tushudanganlunwen/3464159.html
最近更新
教材專著