面向科技文獻(xiàn)的主題發(fā)現(xiàn)及演化預(yù)測方法研究與應(yīng)用
【文章頁數(shù)】:90 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖2-2OLDA概率圖模型
第二章相關(guān)工作基礎(chǔ)11設(shè)置相應(yīng)的權(quán)重值,以此作為當(dāng)前時間片中主題建模的先驗參數(shù)。內(nèi)容演化矩陣不僅代表了歷史時間片的主題信息對當(dāng)前時間片的主題建模過程的不同影響力,也保證了主題建模過程的連續(xù)性。其中,主題模型的先驗計算如公式(2-2)所示:=1(2-2)其中代表時間片t中主題k的先....
圖3-1IOLDA概率圖模型
第三章面向科技文獻(xiàn)的IOLDA主題模型研究21圖3-1IOLDA概率圖模型3.3IOLDA模型的生成過程和算法過程3.3.1IOLDA模型的文本生成過程傳統(tǒng)的OLDA在線主題模型的文本生成過程如下:在某個時間片中,首先從主題分布中抽取一個主題;然后根據(jù)該主題的詞分布抽取一個詞匯;....
圖3-3科技文獻(xiàn)存儲形式
電子科技大學(xué)碩士學(xué)位論文24實驗過程將會使用人工和自動的方式去除一些重復(fù)信息,同時針對部分缺失數(shù)據(jù)將會進(jìn)行人工填充,以減少對接下來實驗的影響。圖3-3科技文獻(xiàn)存儲形式圖3-4機(jī)器學(xué)習(xí)領(lǐng)域每年度文獻(xiàn)數(shù)量3.4.1.3文本分詞傳統(tǒng)LDA主題模型是一種詞袋模型,即不考慮詞匯的文法和順序....
圖3-4機(jī)器學(xué)習(xí)領(lǐng)域每年度文獻(xiàn)數(shù)量
電子科技大學(xué)碩士學(xué)位論文24實驗過程將會使用人工和自動的方式去除一些重復(fù)信息,同時針對部分缺失數(shù)據(jù)將會進(jìn)行人工填充,以減少對接下來實驗的影響。圖3-3科技文獻(xiàn)存儲形式圖3-4機(jī)器學(xué)習(xí)領(lǐng)域每年度文獻(xiàn)數(shù)量3.4.1.3文本分詞傳統(tǒng)LDA主題模型是一種詞袋模型,即不考慮詞匯的文法和順序....
本文編號:3922300
本文鏈接:http://sikaile.net/tushudanganlunwen/3922300.html