天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 社科論文 > 圖書檔案論文 >

面向趨勢預(yù)測的熱點主題演化分析方法研究

發(fā)布時間:2024-04-19 02:25
  【目的】從外部數(shù)量特征和內(nèi)部文本特征兩個層面,構(gòu)建科學的數(shù)理模型和內(nèi)容預(yù)測模型,進而對熱點研究主題演化趨勢進行預(yù)測分析!痉椒ā炕贚DA模型進行主題識別并構(gòu)建主題時間序列,結(jié)合均值與線性回歸擬合確定熱點主題;利用ARIMA模型和Word2Vec模型從主題強度和主題內(nèi)容兩個層面預(yù)測分析熱點主題趨勢!窘Y(jié)果】對美國干細胞領(lǐng)域進行實證研究,篩選出造血干細胞移植技術(shù)、癌癥干細胞和干細胞抑制作用、干細胞誘導分化、衍生配子技術(shù)、造血干細胞5個熱點主題并預(yù)測其發(fā)展趨勢!揪窒蕖炕赪ord2Vec模型對主題內(nèi)容趨勢進行分析主要以單個詞匯為基礎(chǔ),解讀過程中可能存在歧義。【結(jié)論】與人工解讀為主的主題趨勢預(yù)測分析方法相比,本研究所提方法能在一定程度上提高預(yù)測分析的效率與科學性。

【文章頁數(shù)】:13 頁

【部分圖文】:

圖1CBOW模型和Skip-Gram模型示意圖[29]

圖1CBOW模型和Skip-Gram模型示意圖[29]

作為生成詞向量的經(jīng)典模型之一,Word2Vec模型[28-29]得到眾多學者的認可,并且集成在Python的Gensim工具包中,使用方式簡潔、高效。Word2Vec中訓練神經(jīng)網(wǎng)絡(luò)模型具體可以分為兩種:CBOW模型和Skip-Gram模型,基本原理如圖1所示。CBOW模型(Con....


圖2論文數(shù)量年度分布

圖2論文數(shù)量年度分布

在干細胞(StemCell)領(lǐng)域進行實證研究,由于美國是干細胞研究的領(lǐng)先國家,主要以美國干細胞研究論文作為數(shù)據(jù)來源。具體選擇WebofScience數(shù)據(jù)庫收錄的干細胞領(lǐng)域相關(guān)文獻,檢索策略為:以“stemcell*”作為檢索詞進行題名檢索,時間跨度為2000年1月1日-2....


圖3最優(yōu)主題個數(shù)確定

圖3最優(yōu)主題個數(shù)確定

由圖3可知,當主題個數(shù)位于25和40時一致性分數(shù)變化發(fā)生明顯轉(zhuǎn)折,并且在40之后趨于穩(wěn)定,即當主題個數(shù)在25之后隨著主題個數(shù)的增多,一致性分數(shù)只增加了0.05,因此選取25~40之間的主題個數(shù),結(jié)合人工判讀結(jié)果最終確定主題個數(shù)為32,根據(jù)選定的最優(yōu)主題個數(shù)進行LDA主題識別。32....


圖4干細胞領(lǐng)域主題時間序列(2000年-2018年)

圖4干細胞領(lǐng)域主題時間序列(2000年-2018年)

根據(jù)研究方法所述步驟對5個熱點主題進行ARIMA模型構(gòu)建,其中ARIMA模型的構(gòu)建中參數(shù)確定和模型檢驗是十分重要的步驟,具體實驗過程中利用BIC指標確定模型參數(shù),即遍歷所有可能參數(shù)計算模型BIC值,其中最小值為最優(yōu)參數(shù),從而可確定最后模型參數(shù),結(jié)果如表3所示。確定模型參數(shù)之后,對....



本文編號:3958089

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/tushudanganlunwen/3958089.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶24f7f***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com