基于LDA-BiLSTM模型的高校網(wǎng)絡(luò)輿情監(jiān)測方法及實證
發(fā)布時間:2021-04-08 01:50
[目的/意義]高校網(wǎng)絡(luò)輿情能夠反映學(xué)生的思想動態(tài)。實時甄別高校網(wǎng)絡(luò)信息內(nèi)容,監(jiān)測潛在輿情,對于合理引導(dǎo)學(xué)生思想、維護高校形象具有重要意義。[方法/過程]提出基于LDA-BiLSTM模型的高校網(wǎng)絡(luò)輿情監(jiān)測方法,以高校百度貼吧為數(shù)據(jù)源,提取數(shù)據(jù)中的熱門主題,獲取熱門主題下回復(fù)文本的情感極性,分析其潛在輿情。[結(jié)果/結(jié)論]結(jié)果表明,此方法能夠獲取高校貼吧熱門主題及其情感極性,監(jiān)測潛在輿情,為高校網(wǎng)絡(luò)輿情管理提供有效方法和模型。
【文章來源】:情報理論與實踐. 2020,43(11)北大核心CSSCI
【文章頁數(shù)】:6 頁
【部分圖文】:
高校網(wǎng)絡(luò)輿情監(jiān)測流程
詞性是能夠標(biāo)識語義信息的重要語法特征[16]。在處理具體事件的語料時,詞性對LDA主題模型的影響相對較小,因為此時主題模型提取的詞語圍繞該事件產(chǎn)生,相對來說可讀性較高。但是在處理主題比較泛化的語料時,由于內(nèi)容主體未知,其中提取的形容詞、副詞等可讀性很差,難以辨別真正的關(guān)注點,而名詞則能幫助我們較好地解讀文本的中心思想。詞性過濾算法結(jié)合了詞典匹配和隱含馬爾科夫模型(Hidden Markov Model,HMM),其中詞典匹配方法基于前綴詞典進行詞圖掃描,快速構(gòu)建包含全部可能分詞結(jié)果的有向無環(huán)圖,然后使用動態(tài)規(guī)劃的方法找出最大概率路徑,從而實現(xiàn)分詞功能,同時在前綴詞典中查找該詞的詞性。
式中, P(λ|o)P(o) 的最大值即為目標(biāo)值,而求解maxP(λ|o)P(o) 的方法是Veterbi算法,其核心思想是:如果最終的最優(yōu)路徑經(jīng)過某個Oi,那么從初始節(jié)點到Oi-1點的路徑必然也是一個最優(yōu)路徑。路徑狀態(tài)轉(zhuǎn)移見圖3。通過基于詞性過濾的LDA主題模型處理,可以提取語料的熱門主題及其關(guān)鍵詞,研究關(guān)鍵詞可知該主題的大體內(nèi)容。后續(xù)還要分析熱門主題的情感極性,長短時記憶網(wǎng)絡(luò)(LSTM)模型可以很好地完成此項任務(wù)。
【參考文獻】:
期刊論文
[1]高校網(wǎng)絡(luò)輿情共振現(xiàn)象仿真及應(yīng)對策略研究[J]. 李藝全,張燕剛. 情報雜志. 2019(12)
[2]一種融合主題模型的短文本情感分類方法[J]. 吳彥文,黃凱,王馨悅,林嫻. 小型微型計算機系統(tǒng). 2019(10)
[3]基于特征融合分段卷積神經(jīng)網(wǎng)絡(luò)的情感分析[J]. 周泳東,章韻,曹艷蓉,黃海平. 計算機工程與設(shè)計. 2019(10)
[4]基于LDA模型和Doc2vec的學(xué)術(shù)摘要聚類方法[J]. 張衛(wèi)衛(wèi),胡亞琦,翟廣宇,劉志鵬. 計算機工程與應(yīng)用. 2020(06)
[5]基于SOAR模型的高校網(wǎng)絡(luò)輿情應(yīng)急響應(yīng)研究[J]. 凌晨,馮俊文,吳鵬,張善飛. 情報科學(xué). 2019(09)
[6]高校學(xué)生網(wǎng)絡(luò)輿情的動態(tài)監(jiān)測路徑與防控機制研究[J]. 李中原. 現(xiàn)代情報. 2019(08)
[7]高校網(wǎng)絡(luò)輿情管理如何一步到位[J]. 尹中華,趙建有. 人民論壇. 2019(15)
[8]基于動態(tài)貝葉斯網(wǎng)絡(luò)的網(wǎng)絡(luò)輿情危機等級預(yù)測模型[J]. 楊靜,鄒梅,黃微. 情報科學(xué). 2019(05)
[9]基于主題一致性和情感支持的評論意見領(lǐng)袖識別方法研究[J]. 安璐,胡俊陽,李綱. 管理科學(xué). 2019(01)
[10]電商評論綜合分析系統(tǒng)的設(shè)計與實現(xiàn)——情感分析與觀點挖掘的研究與應(yīng)用[J]. 郭博,李守光,王昊,張曉軍,龔偉,于昭君,孫宇. 數(shù)據(jù)分析與知識發(fā)現(xiàn). 2017(12)
本文編號:3124610
【文章來源】:情報理論與實踐. 2020,43(11)北大核心CSSCI
【文章頁數(shù)】:6 頁
【部分圖文】:
高校網(wǎng)絡(luò)輿情監(jiān)測流程
詞性是能夠標(biāo)識語義信息的重要語法特征[16]。在處理具體事件的語料時,詞性對LDA主題模型的影響相對較小,因為此時主題模型提取的詞語圍繞該事件產(chǎn)生,相對來說可讀性較高。但是在處理主題比較泛化的語料時,由于內(nèi)容主體未知,其中提取的形容詞、副詞等可讀性很差,難以辨別真正的關(guān)注點,而名詞則能幫助我們較好地解讀文本的中心思想。詞性過濾算法結(jié)合了詞典匹配和隱含馬爾科夫模型(Hidden Markov Model,HMM),其中詞典匹配方法基于前綴詞典進行詞圖掃描,快速構(gòu)建包含全部可能分詞結(jié)果的有向無環(huán)圖,然后使用動態(tài)規(guī)劃的方法找出最大概率路徑,從而實現(xiàn)分詞功能,同時在前綴詞典中查找該詞的詞性。
式中, P(λ|o)P(o) 的最大值即為目標(biāo)值,而求解maxP(λ|o)P(o) 的方法是Veterbi算法,其核心思想是:如果最終的最優(yōu)路徑經(jīng)過某個Oi,那么從初始節(jié)點到Oi-1點的路徑必然也是一個最優(yōu)路徑。路徑狀態(tài)轉(zhuǎn)移見圖3。通過基于詞性過濾的LDA主題模型處理,可以提取語料的熱門主題及其關(guān)鍵詞,研究關(guān)鍵詞可知該主題的大體內(nèi)容。后續(xù)還要分析熱門主題的情感極性,長短時記憶網(wǎng)絡(luò)(LSTM)模型可以很好地完成此項任務(wù)。
【參考文獻】:
期刊論文
[1]高校網(wǎng)絡(luò)輿情共振現(xiàn)象仿真及應(yīng)對策略研究[J]. 李藝全,張燕剛. 情報雜志. 2019(12)
[2]一種融合主題模型的短文本情感分類方法[J]. 吳彥文,黃凱,王馨悅,林嫻. 小型微型計算機系統(tǒng). 2019(10)
[3]基于特征融合分段卷積神經(jīng)網(wǎng)絡(luò)的情感分析[J]. 周泳東,章韻,曹艷蓉,黃海平. 計算機工程與設(shè)計. 2019(10)
[4]基于LDA模型和Doc2vec的學(xué)術(shù)摘要聚類方法[J]. 張衛(wèi)衛(wèi),胡亞琦,翟廣宇,劉志鵬. 計算機工程與應(yīng)用. 2020(06)
[5]基于SOAR模型的高校網(wǎng)絡(luò)輿情應(yīng)急響應(yīng)研究[J]. 凌晨,馮俊文,吳鵬,張善飛. 情報科學(xué). 2019(09)
[6]高校學(xué)生網(wǎng)絡(luò)輿情的動態(tài)監(jiān)測路徑與防控機制研究[J]. 李中原. 現(xiàn)代情報. 2019(08)
[7]高校網(wǎng)絡(luò)輿情管理如何一步到位[J]. 尹中華,趙建有. 人民論壇. 2019(15)
[8]基于動態(tài)貝葉斯網(wǎng)絡(luò)的網(wǎng)絡(luò)輿情危機等級預(yù)測模型[J]. 楊靜,鄒梅,黃微. 情報科學(xué). 2019(05)
[9]基于主題一致性和情感支持的評論意見領(lǐng)袖識別方法研究[J]. 安璐,胡俊陽,李綱. 管理科學(xué). 2019(01)
[10]電商評論綜合分析系統(tǒng)的設(shè)計與實現(xiàn)——情感分析與觀點挖掘的研究與應(yīng)用[J]. 郭博,李守光,王昊,張曉軍,龔偉,于昭君,孫宇. 數(shù)據(jù)分析與知識發(fā)現(xiàn). 2017(12)
本文編號:3124610
本文鏈接:http://sikaile.net/shekelunwen/shgj/3124610.html
最近更新
教材專著