基于社會網(wǎng)絡(luò)分析的網(wǎng)絡(luò)輿情主題事件演化研究
發(fā)布時間:2021-01-31 06:01
隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,網(wǎng)絡(luò)空間成為民眾對某一事件持有觀點、態(tài)度的重要表達場所,從而形成網(wǎng)絡(luò)輿情。網(wǎng)絡(luò)輿情借助互聯(lián)網(wǎng)具有信息實時性、受眾普遍性、超越時空性和傳播快速性等特征。網(wǎng)絡(luò)輿情是對現(xiàn)實世界輿情事件的反映,利用其獨有的特性,使得輿情事件快速傳播。這些新特點對政府治理公共輿情事件的時效性和準(zhǔn)確性提出了新的挑戰(zhàn),因此加強對網(wǎng)絡(luò)輿情,尤其是網(wǎng)絡(luò)輿情演化的研究具有重要的價值和現(xiàn)實意義,F(xiàn)有對網(wǎng)絡(luò)輿情演化的研究思路主要是基于兩個視角:一是從網(wǎng)絡(luò)輿情參與用戶的角度,對其參與輿情事件的數(shù)量及特點劃分階段,或根據(jù)輿情傳播方式,借助模型仿真研究輿情用戶變化;另一種是從輿情文本的角度,對其進行情感分析、主題發(fā)現(xiàn)及主題熱度演變等的研究。但單獨從參與用戶或輿情文本角度不能系統(tǒng)化地揭示網(wǎng)絡(luò)輿情主題事件的演化活動,因此本文采用社會網(wǎng)絡(luò)分析法,綜合上述兩種研究思路,對網(wǎng)絡(luò)輿情參與用戶與文本內(nèi)容實施整合研究,利用文本挖掘技術(shù)與系統(tǒng)仿真技術(shù)系統(tǒng)研究網(wǎng)絡(luò)輿情主題事件的演化活動。本文首先介紹了網(wǎng)絡(luò)輿情及網(wǎng)絡(luò)輿情演化、社會網(wǎng)絡(luò)、短文本挖掘的國內(nèi)外研究現(xiàn)狀;其次系統(tǒng)梳理了網(wǎng)絡(luò)輿情、社會網(wǎng)絡(luò)分析法、文本挖掘與系統(tǒng)仿真的理論知識...
【文章來源】:福州大學(xué)福建省 211工程院校
【文章頁數(shù)】:79 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖1-1社會網(wǎng)絡(luò)文獻時間分布??,,
類自然語言描述的文本轉(zhuǎn)化為機器可以識別的信息,需要把文涉及到文本表示技術(shù)。當(dāng)前常用的文本表示模型有:向量空間卷積神經(jīng)網(wǎng)絡(luò)和LDA?(潛在狄利克雷分布)主題模型等。本掘中應(yīng)用較多的LDA主題模型。??模型是把文本看成由詞匯組成,文本隱藏著若干主題,主題是這樣就可以把文本由詞項分布的高維空間轉(zhuǎn)化為主題分布的2-1所示,更為清晰快速的挖掘文檔內(nèi)容。主題模型主要利用來源于隱性語義索引(Latent?Semantic?Indexing,LSI)?[71],Hof上提出了概率隱性語義索引(probabilistic?Latent?Semantic?Ind此后,Blei?等[73]在?PLSA?基礎(chǔ)上提出?LDA?(Latent?Dirichlet?Alloc,即引入Dirichlet先驗分布得到的文檔-主題-詞項的三層貝葉圖模型表示如圖2-2所示:??P?(詞語|文檔)=2主題P(詞語|主題)*P(主題|文檔)??文檔?主題??
圖2-2?LDA圖模型表示??,M表示文檔數(shù)量,>^第111篇文檔的單詞個數(shù),K表示主題所有單詞的個數(shù)。wm,n表示第m篇文檔中第n個單詞,zm,n表示n個單詞對應(yīng)的主題;0m表示第m篇文檔中所有主題的概率中主題為k里的所有單詞的概率分布;ot和P是Dirichlet分布生成0和〇這兩個參數(shù)的參數(shù)。矩形為相應(yīng)變量重復(fù)采樣次〇k,對應(yīng)遍歷所有主題的單詞概率分布,從M篇文檔中選擇中所有單詞Nm找到其對應(yīng)主題zm,n,然后遍歷完所有M篇文檔。變量,即wm,n文檔中單詞的分布是己知的,空心圓為待估計的主題個數(shù)K的確定學(xué)術(shù)界暫時沒有統(tǒng)一的標(biāo)準(zhǔn),由于面對的,因此需要不斷實驗驗證得到最佳主題數(shù)。其中一種方法是xity)確定,它表示一篇文檔d屬于某一主題p的不確定程度,B主題數(shù)目曲線來確定最優(yōu)主題數(shù)目;另外一種是基于密度的自型選擇方法,首先選取初始K值,得到初始模型,計算各topic
【參考文獻】:
期刊論文
[1]基于閉頻繁項集短文本聚類[J]. 張少磊,王忠. 計算機應(yīng)用. 2016(S2)
[2]基于社會網(wǎng)絡(luò)分析的微博社區(qū)網(wǎng)絡(luò)結(jié)構(gòu)及傳播特性研究[J]. 杜洪濤,孟慶國,王君澤. 情報學(xué)報. 2016 (08)
[3]基于Hadoop的微博輿情監(jiān)控系統(tǒng)模型研究[J]. 楊愛東,劉東蘇. 現(xiàn)代圖書情報技術(shù). 2016(05)
[4]基于文檔對象模型與行塊分布算法的網(wǎng)頁信息抽取[J]. 高慶寧,吳鵬,張晶晶. 情報理論與實踐. 2016(04)
[5]基于頻繁項集的海量短文本聚類與主題抽取[J]. 彭敏,黃佳佳,朱佳暉,黃濟民,劉紀(jì)平. 計算機研究與發(fā)展. 2015(09)
[6]突發(fā)事件網(wǎng)絡(luò)輿情中網(wǎng)民群體行為演化的Agent建模與仿真研究[J]. 吳鵬,楊爽,張晶晶,高慶寧. 現(xiàn)代圖書情報技術(shù). 2015(Z1)
[7]融合BTM主題特征的短文本分類方法[J]. 鄭誠,吳文岫,代寧. 計算機工程與應(yīng)用. 2016(13)
[8]時空分異視角下非常規(guī)突發(fā)事件網(wǎng)絡(luò)輿情演化研究——以“上海12.31踩踏事件”為例[J]. 劉國巍,程國輝,姜金貴. 情報雜志. 2015(06)
[9]基于影響模型的網(wǎng)絡(luò)輿情演化與傳播仿真研究[J]. 朱毅華,張超群. 情報雜志. 2015(02)
[10]基于LDA特征擴展的短文本分類[J]. 呂超鎮(zhèn),姬東鴻,吳飛飛. 計算機工程與應(yīng)用. 2015(04)
碩士論文
[1]基于頻繁詞集詞共現(xiàn)網(wǎng)絡(luò)的短文本聚類方法[D]. 李偉.北京交通大學(xué) 2016
[2]基于社會網(wǎng)絡(luò)分析的Web社區(qū)發(fā)現(xiàn)[D]. 舒昕.蘭州交通大學(xué) 2013
本文編號:3010331
【文章來源】:福州大學(xué)福建省 211工程院校
【文章頁數(shù)】:79 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖1-1社會網(wǎng)絡(luò)文獻時間分布??,,
類自然語言描述的文本轉(zhuǎn)化為機器可以識別的信息,需要把文涉及到文本表示技術(shù)。當(dāng)前常用的文本表示模型有:向量空間卷積神經(jīng)網(wǎng)絡(luò)和LDA?(潛在狄利克雷分布)主題模型等。本掘中應(yīng)用較多的LDA主題模型。??模型是把文本看成由詞匯組成,文本隱藏著若干主題,主題是這樣就可以把文本由詞項分布的高維空間轉(zhuǎn)化為主題分布的2-1所示,更為清晰快速的挖掘文檔內(nèi)容。主題模型主要利用來源于隱性語義索引(Latent?Semantic?Indexing,LSI)?[71],Hof上提出了概率隱性語義索引(probabilistic?Latent?Semantic?Ind此后,Blei?等[73]在?PLSA?基礎(chǔ)上提出?LDA?(Latent?Dirichlet?Alloc,即引入Dirichlet先驗分布得到的文檔-主題-詞項的三層貝葉圖模型表示如圖2-2所示:??P?(詞語|文檔)=2主題P(詞語|主題)*P(主題|文檔)??文檔?主題??
圖2-2?LDA圖模型表示??,M表示文檔數(shù)量,>^第111篇文檔的單詞個數(shù),K表示主題所有單詞的個數(shù)。wm,n表示第m篇文檔中第n個單詞,zm,n表示n個單詞對應(yīng)的主題;0m表示第m篇文檔中所有主題的概率中主題為k里的所有單詞的概率分布;ot和P是Dirichlet分布生成0和〇這兩個參數(shù)的參數(shù)。矩形為相應(yīng)變量重復(fù)采樣次〇k,對應(yīng)遍歷所有主題的單詞概率分布,從M篇文檔中選擇中所有單詞Nm找到其對應(yīng)主題zm,n,然后遍歷完所有M篇文檔。變量,即wm,n文檔中單詞的分布是己知的,空心圓為待估計的主題個數(shù)K的確定學(xué)術(shù)界暫時沒有統(tǒng)一的標(biāo)準(zhǔn),由于面對的,因此需要不斷實驗驗證得到最佳主題數(shù)。其中一種方法是xity)確定,它表示一篇文檔d屬于某一主題p的不確定程度,B主題數(shù)目曲線來確定最優(yōu)主題數(shù)目;另外一種是基于密度的自型選擇方法,首先選取初始K值,得到初始模型,計算各topic
【參考文獻】:
期刊論文
[1]基于閉頻繁項集短文本聚類[J]. 張少磊,王忠. 計算機應(yīng)用. 2016(S2)
[2]基于社會網(wǎng)絡(luò)分析的微博社區(qū)網(wǎng)絡(luò)結(jié)構(gòu)及傳播特性研究[J]. 杜洪濤,孟慶國,王君澤. 情報學(xué)報. 2016 (08)
[3]基于Hadoop的微博輿情監(jiān)控系統(tǒng)模型研究[J]. 楊愛東,劉東蘇. 現(xiàn)代圖書情報技術(shù). 2016(05)
[4]基于文檔對象模型與行塊分布算法的網(wǎng)頁信息抽取[J]. 高慶寧,吳鵬,張晶晶. 情報理論與實踐. 2016(04)
[5]基于頻繁項集的海量短文本聚類與主題抽取[J]. 彭敏,黃佳佳,朱佳暉,黃濟民,劉紀(jì)平. 計算機研究與發(fā)展. 2015(09)
[6]突發(fā)事件網(wǎng)絡(luò)輿情中網(wǎng)民群體行為演化的Agent建模與仿真研究[J]. 吳鵬,楊爽,張晶晶,高慶寧. 現(xiàn)代圖書情報技術(shù). 2015(Z1)
[7]融合BTM主題特征的短文本分類方法[J]. 鄭誠,吳文岫,代寧. 計算機工程與應(yīng)用. 2016(13)
[8]時空分異視角下非常規(guī)突發(fā)事件網(wǎng)絡(luò)輿情演化研究——以“上海12.31踩踏事件”為例[J]. 劉國巍,程國輝,姜金貴. 情報雜志. 2015(06)
[9]基于影響模型的網(wǎng)絡(luò)輿情演化與傳播仿真研究[J]. 朱毅華,張超群. 情報雜志. 2015(02)
[10]基于LDA特征擴展的短文本分類[J]. 呂超鎮(zhèn),姬東鴻,吳飛飛. 計算機工程與應(yīng)用. 2015(04)
碩士論文
[1]基于頻繁詞集詞共現(xiàn)網(wǎng)絡(luò)的短文本聚類方法[D]. 李偉.北京交通大學(xué) 2016
[2]基于社會網(wǎng)絡(luò)分析的Web社區(qū)發(fā)現(xiàn)[D]. 舒昕.蘭州交通大學(xué) 2013
本文編號:3010331
本文鏈接:http://sikaile.net/xinwenchuanbolunwen/3010331.html
最近更新
教材專著