天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 碩博論文 > 信息類碩士論文 >

基于LSTM和LDA的可再生能源領(lǐng)域主題分類研究

發(fā)布時間:2021-08-19 18:04
  如今,各學(xué)科的科研文獻數(shù)量都呈現(xiàn)快速增長的趨勢,并且學(xué)科之間日益深化交叉,呈現(xiàn)出研究主題分支眾多,發(fā)展不平衡的狀態(tài),這種情況加重了科研人員精準(zhǔn)搜索信息的難度,也不利于科研人員理清學(xué)科的研究進展和跟蹤領(lǐng)域前沿。本文以研究電氣電子學(xué)科可再生能源領(lǐng)域的文獻為例,作為這個重要領(lǐng)域的一個新嘗試,將隱含狄利克雷分布(Latent Dirichlet Allocation,LDA)和長短期記憶網(wǎng)絡(luò)(Long Short-Term Memory,LSTM)方法運用到該領(lǐng)域的主題分布探測中,旨在為學(xué)術(shù)研究人員提供該領(lǐng)域最清晰的發(fā)展背景和組織結(jié)構(gòu)。首先,本文通過應(yīng)用統(tǒng)計分析,LDA主題模型和自回歸整合移動平均模型(AutoRegressive Integrated Moving Average,ARIMA),將電氣電子學(xué)科可再生能源領(lǐng)域文獻劃分為29個不同的主題,并在兩個時間段內(nèi)分析主題的增長特征。在此基礎(chǔ)上,根據(jù)每個主題的發(fā)展軌跡,預(yù)測它們未來的發(fā)展熱度,并分類為冷,熱和穩(wěn)定三種。本文還匯總了每個主題中最受歡迎的期刊和引文的統(tǒng)計數(shù)據(jù),從而使研究人員和期刊編輯易于欣賞和應(yīng)用,進而本文結(jié)合現(xiàn)有技術(shù)和文獻分析... 

【文章來源】:山東大學(xué)山東省 211工程院校 985工程院校 教育部直屬院校

【文章頁數(shù)】:82 頁

【學(xué)位級別】:碩士

【部分圖文】:

基于LSTM和LDA的可再生能源領(lǐng)域主題分類研究


圖2-1連續(xù)詞袋模型的訓(xùn)練框架??CBOW模型是具有三層結(jié)構(gòu)的神經(jīng)網(wǎng)絡(luò):輸入層,投影層和輸出層[35]

概率模型,文檔,單詞,主題


?yp{zx\dD)?■■■?p{zK\dD)y??每個主題i由大小為V的詞匯表(所有文檔中的單詞集合)的概率分布??確定,表示以主題T為條件在詞匯表中檢測單詞v的可能性。LDA??模型認為一篇文檔是通過以下過程生成的:??第一步:從泊松分布中抽取文檔長度??第二步:通過狄利克雷分布獲取文檔的主題分布0??第三步:生成一篇文檔的每一個詞時for?n=l?to?N:??(a):從文檔的主題分布中,抽取一個特定主題腦omz_a/(<9);??(b):從概率,約抽取一個單詞wn。??圖2-2為LDA概率模型圖,分為三層級別,參數(shù)a和戶是語料庫級的??參數(shù),在生成語料庫的時采樣一次。變量&是文檔級的變量,更薪每篇文檔??時采樣一次。\?和%?是單詞級變量,更新每個單詞時采樣一次。??a-ofo^tn??a?〇?z?w?n??D??圖2-2?LDA概率模型圖??10??

變分,概率模型,最優(yōu)化,文檔


?山東大學(xué)碩士學(xué)位論文???根據(jù)圖2-2,可知戶(4?|?a)表示以a為條件觀察文檔d的主題分布&的概??率。;?(7,??丨&)表示在文檔的主題分布條件概率下,文檔d中單詞XI的主題??是的概率。最終在和/?的條件概率下,第d篇文章第n個單詞的概??率是通過計算所有可能的主題分配、文檔中所有單詞的乘??積和文本中所有文檔的乘積之和,語料庫生成的概率為公式P-5)。??D?f?N,?)??Y[p^ed?I??)?nZ^,??I?&j)P(Wd,n?I?■?(2-5)??j=i?Vn=l?Zd-??y????LDA建模的目標(biāo)是找到每篇文檔中每個單詞的最佳主題分配,以及最??大化每個主題的最佳單詞概率,若直接求解需要將所有文檔中所有單詞的所??有可能主題分配相加,然而計算上無法實現(xiàn),因此,LDA的核心推理問題??是確定給定文檔的潛在變量的后驗分布[9],如公式(2-6)。??p^Z\W,a,P)?=?P^zMa^)?(2-6)??p{w\a,P)??David?Blie提出的利用變分推理方法為近似似然和后驗分布求解提供了??一種確定性方法[37]。變分推理的基礎(chǔ)是基于凸函數(shù)Jensen不等式的性質(zhì),??通過近似LDA后驗分布從而將計算問題重新表述為一個優(yōu)化問題,近似后??驗分布的變分分布概率模型圖如圖2-3所示,近似分布的分布特征為式P-7):??q{0,?z\/,</>)?=?q{61?r)Yl^zn?1(2-7)??'.爾?.???D_??圖2-3近似LDA后驗的變分分布概率模型圖??最后利用EM算法在E步中找到變分參數(shù)最優(yōu)化值。在M步中最??大化對數(shù)似然,求解模型的a和0參數(shù)。?

【參考文獻】:
期刊論文
[1]轉(zhuǎn)型時代能源安全問題思考與中國方案[J]. 李俊峰,江思羽.  中國能源. 2020(01)
[2]專業(yè)社交媒體中的主題知識元抽取方法研究[J]. 林杰,苗潤生,張振宇.  圖書情報工作. 2019(14)
[3]整合主題的學(xué)科知識網(wǎng)絡(luò)構(gòu)建與演化分析框架研究[J]. 關(guān)鵬,王曰芬,曹嘉君.  情報科學(xué). 2018(09)
[4]基于CTM模型的觀點挖掘和可視化[J]. 馬長林,謝羅迪,陳夢麗.  計算機工程與科學(xué). 2018(04)
[5]基于word2vec和LSTM的飲食健康文本分類研究[J]. 趙明,杜會芳,董翠翠,陳長松.  農(nóng)業(yè)機械學(xué)報. 2017(10)
[6]時間序列數(shù)據(jù)挖掘綜述[J]. 賈澎濤,何華燦,劉麗,孫濤.  計算機應(yīng)用研究. 2007(11)



本文編號:3351883

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/3351883.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶69d9f***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com
最好看的人妻中文字幕| 国产成人精品综合久久久看| 好吊妞视频免费在线观看| 成人精品一区二区三区在线| 黄色在线免费高清观看| 日本男人女人干逼视频| 国产又粗又猛又黄又爽视频免费| 少妇被粗大进猛进出处故事| 国产精品免费福利在线| 久久婷婷综合色拍亚洲| 91精品国产av一区二区| 日韩欧美一区二区久久婷婷| 国产免费无遮挡精品视频| 亚洲中文在线观看小视频| 国产欧美日韩不卡在线视频| 日韩亚洲精品国产第二页| 日韩精品视频一二三区| 国产一区二区三区色噜噜| 情一色一区二区三区四| 99亚洲综合精品成人网色播 | 熟女乱一区二区三区四区| 熟女少妇久久一区二区三区| 欧美日韩人妻中文一区二区| 精品欧美国产一二三区| 久久精品少妇内射毛片| 男人操女人下面国产剧情| 午夜视频成人在线免费| 91人妻久久精品一区二区三区 | 亚洲综合天堂一二三区| 色哟哟哟在线观看视频| 精品人妻一区二区四区| 国产又色又爽又黄又大| 久久黄片免费播放大全| 激情综合网俺也狠狠地| 男生和女生哪个更好色| 日本熟妇五十一区二区三区| 国产日韩精品激情在线观看| 亚洲一区二区精品免费| 国产欧美日韩精品自拍| 日韩一区二区三区免费av| 国产成人国产精品国产三级|