Prophet預(yù)測-修正的主題強度演化模型——以干細胞領(lǐng)域為實證
發(fā)布時間:2021-05-18 11:59
[目的/意義]主題演化對科技前沿探測、創(chuàng)新戰(zhàn)略部署具有十分重要的作用。[方法/過程]將主題演化分析過程分解為主題的表示、相似性關(guān)聯(lián)和強度演化計算幾個步驟,提出一種主題強度演化與預(yù)測模型,使用LDA模型進行主題的表示,提出內(nèi)容、共現(xiàn)和趨勢相似度等維度進行主題關(guān)聯(lián)計算,引入基于Prophet的預(yù)測-修正模型進行主題演化趨勢預(yù)測。并以干細胞領(lǐng)域為例,進行演化的實證分析。[結(jié)果/結(jié)論]實驗表明,對每個研究主題采用Logistic增長模型進行預(yù)測R2Score都達到0.90以上,表明Prophet中的Logistic增長模型與該領(lǐng)域主題增長趨勢規(guī)律相符合,能夠較好地擬合主題強度的演化趨勢。提出的主題演化模型對專業(yè)領(lǐng)域內(nèi)主題分布與演化分析有一定的借鑒意義。
【文章來源】:圖書情報工作. 2020,64(08)北大核心CSSCI
【文章頁數(shù)】:15 頁
【文章目錄】:
1 研究現(xiàn)狀
(1)數(shù)據(jù)價值高。
(2)數(shù)據(jù)不完整。
2 研究方法流程
2.1 主題表示建模
(1)主題模型參數(shù)選擇問題。
(2)主題的語義增強問題。
2.2 主題關(guān)聯(lián)
2.2.1 主題強度
2.2.2 主題相似性度量方法
2.2.3 三種主題相似性度量方法的一致性
2.3 主題趨勢預(yù)測
3 實證研究
3.1 數(shù)據(jù)預(yù)處理
(1)關(guān)鍵詞抽取。
(2)主題的語義增強。
3.2 干細胞領(lǐng)域研究主題的抽取
3.3 主題強度計算及關(guān)聯(lián)性分析
(1)3種相似度度量方法結(jié)果。
(2)3種相似性度量方法的一致性分析結(jié)果。
3.4 主題強度演化分析與預(yù)測
3.5 主題強度演化分析與預(yù)測結(jié)果展示
4 總結(jié)討論
【參考文獻】:
期刊論文
[1]基于Chunk-LDAvis的核心技術(shù)主題識別方法研究[J]. 劉自強,許海云,岳麗欣,方曙. 圖書情報工作. 2019(09)
[2]基于醫(yī)學(xué)文獻的主題演化類型與演化路徑識別方法研究[J]. 范少萍,安新穎,單連慧,晏歸來,宮小翠. 情報理論與實踐. 2019(03)
[3]技術(shù)主題演化研究方法綜述[J]. 羅文馨,王園園. 知識管理論壇. 2018(05)
[4]LDA模型的優(yōu)化及其主題數(shù)量選擇研究——以科技文獻為例[J]. 王婷婷,韓滿,王宇. 數(shù)據(jù)分析與知識發(fā)現(xiàn). 2018(01)
[5]基于PhraseLDA模型的主題短語挖掘方法研究[J]. 張琴,張智雄. 圖書情報工作. 2017(08)
[6]面向TRIZ的領(lǐng)域?qū)@夹g(shù)挖掘系統(tǒng)設(shè)計與實踐[J]. 胡正銀,劉春江,隗玲,楊寧,徐源,許海云,文奕. 圖書情報工作. 2017(01)
碩士論文
[1]基于名詞短語提取與詞條權(quán)重分析的話題提取算法研究[D]. 孫孟孟.浙江大學(xué) 2014
本文編號:3193751
【文章來源】:圖書情報工作. 2020,64(08)北大核心CSSCI
【文章頁數(shù)】:15 頁
【文章目錄】:
1 研究現(xiàn)狀
(1)數(shù)據(jù)價值高。
(2)數(shù)據(jù)不完整。
2 研究方法流程
2.1 主題表示建模
(1)主題模型參數(shù)選擇問題。
(2)主題的語義增強問題。
2.2 主題關(guān)聯(lián)
2.2.1 主題強度
2.2.2 主題相似性度量方法
2.2.3 三種主題相似性度量方法的一致性
2.3 主題趨勢預(yù)測
3 實證研究
3.1 數(shù)據(jù)預(yù)處理
(1)關(guān)鍵詞抽取。
(2)主題的語義增強。
3.2 干細胞領(lǐng)域研究主題的抽取
3.3 主題強度計算及關(guān)聯(lián)性分析
(1)3種相似度度量方法結(jié)果。
(2)3種相似性度量方法的一致性分析結(jié)果。
3.4 主題強度演化分析與預(yù)測
3.5 主題強度演化分析與預(yù)測結(jié)果展示
4 總結(jié)討論
【參考文獻】:
期刊論文
[1]基于Chunk-LDAvis的核心技術(shù)主題識別方法研究[J]. 劉自強,許海云,岳麗欣,方曙. 圖書情報工作. 2019(09)
[2]基于醫(yī)學(xué)文獻的主題演化類型與演化路徑識別方法研究[J]. 范少萍,安新穎,單連慧,晏歸來,宮小翠. 情報理論與實踐. 2019(03)
[3]技術(shù)主題演化研究方法綜述[J]. 羅文馨,王園園. 知識管理論壇. 2018(05)
[4]LDA模型的優(yōu)化及其主題數(shù)量選擇研究——以科技文獻為例[J]. 王婷婷,韓滿,王宇. 數(shù)據(jù)分析與知識發(fā)現(xiàn). 2018(01)
[5]基于PhraseLDA模型的主題短語挖掘方法研究[J]. 張琴,張智雄. 圖書情報工作. 2017(08)
[6]面向TRIZ的領(lǐng)域?qū)@夹g(shù)挖掘系統(tǒng)設(shè)計與實踐[J]. 胡正銀,劉春江,隗玲,楊寧,徐源,許海云,文奕. 圖書情報工作. 2017(01)
碩士論文
[1]基于名詞短語提取與詞條權(quán)重分析的話題提取算法研究[D]. 孫孟孟.浙江大學(xué) 2014
本文編號:3193751
本文鏈接:http://sikaile.net/tushudanganlunwen/3193751.html