面向趨勢預(yù)測的熱點主題演化分析方法研究
【文章頁數(shù)】:13 頁
【部分圖文】:
圖1CBOW模型和Skip-Gram模型示意圖[29]
作為生成詞向量的經(jīng)典模型之一,Word2Vec模型[28-29]得到眾多學者的認可,并且集成在Python的Gensim工具包中,使用方式簡潔、高效。Word2Vec中訓練神經(jīng)網(wǎng)絡(luò)模型具體可以分為兩種:CBOW模型和Skip-Gram模型,基本原理如圖1所示。CBOW模型(Con....
圖2論文數(shù)量年度分布
在干細胞(StemCell)領(lǐng)域進行實證研究,由于美國是干細胞研究的領(lǐng)先國家,主要以美國干細胞研究論文作為數(shù)據(jù)來源。具體選擇WebofScience數(shù)據(jù)庫收錄的干細胞領(lǐng)域相關(guān)文獻,檢索策略為:以“stemcell*”作為檢索詞進行題名檢索,時間跨度為2000年1月1日-2....
圖3最優(yōu)主題個數(shù)確定
由圖3可知,當主題個數(shù)位于25和40時一致性分數(shù)變化發(fā)生明顯轉(zhuǎn)折,并且在40之后趨于穩(wěn)定,即當主題個數(shù)在25之后隨著主題個數(shù)的增多,一致性分數(shù)只增加了0.05,因此選取25~40之間的主題個數(shù),結(jié)合人工判讀結(jié)果最終確定主題個數(shù)為32,根據(jù)選定的最優(yōu)主題個數(shù)進行LDA主題識別。32....
圖4干細胞領(lǐng)域主題時間序列(2000年-2018年)
根據(jù)研究方法所述步驟對5個熱點主題進行ARIMA模型構(gòu)建,其中ARIMA模型的構(gòu)建中參數(shù)確定和模型檢驗是十分重要的步驟,具體實驗過程中利用BIC指標確定模型參數(shù),即遍歷所有可能參數(shù)計算模型BIC值,其中最小值為最優(yōu)參數(shù),從而可確定最后模型參數(shù),結(jié)果如表3所示。確定模型參數(shù)之后,對....
本文編號:3958089
本文鏈接:http://sikaile.net/tushudanganlunwen/3958089.html