基于微博的負面熱點新聞早期預(yù)測分析
發(fā)布時間:2021-03-12 06:55
隨著網(wǎng)絡(luò)和通訊技術(shù)的發(fā)展,微博成為了重要的輿論場所,公眾直接在微博平臺上抒發(fā)情感和表達意見。微博平臺傳遞公眾心聲,富含重要輿情價值的信息。而且其傳播廣度和速度遠遠超越了傳統(tǒng)新聞媒體,會造成輿論事件影響的迅速擴散,增加事件解決的難度。所以微博平臺是政府輿情監(jiān)控必須重視的平臺。而在政府的輿情監(jiān)控系統(tǒng)中,負面熱點新聞的早期預(yù)測尤其關(guān)鍵。因為負面新聞影響社會穩(wěn)定,破壞性極顯著,只有及時預(yù)測發(fā)現(xiàn)網(wǎng)絡(luò)負面熱點新聞,幫助政府部門把握住處理負面熱點事件的最佳時機,才能最小化負面熱點新聞帶來的傷害,維護好社會的安定。但是由于負面新聞的突發(fā)性和復(fù)雜性,目前負面熱點新聞早期預(yù)測這個課題還沒有很好地被研究解決。故本文將通過對媒體報導(dǎo)事件在微博中走勢的全面分析,和對關(guān)注該事件的用戶的情感走勢分析,判斷預(yù)測該事件是否是輿情負面熱點,很好地解決負面熱點新聞早期預(yù)測的問題。本文主要從以下方面作出貢獻:1.探討了國內(nèi)外熱點新聞發(fā)現(xiàn)的研究現(xiàn)狀和微博平臺的情況,發(fā)現(xiàn)將微博平臺用于負面熱點發(fā)現(xiàn)的可行性,并創(chuàng)新性的提出基于微博平臺的負面熱點發(fā)現(xiàn)技術(shù),打破以往的負面熱點發(fā)現(xiàn)技術(shù)范疇。2.探究分析負面熱點新聞特征和微博平臺特征,創(chuàng)...
【文章來源】:華南理工大學(xué)廣東省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:74 頁
【學(xué)位級別】:碩士
【部分圖文】:
負面熱點新聞指標(biāo)關(guān)系圖
第三章 負面熱點新聞早期預(yù)測對應(yīng)新浪微博上的用戶反應(yīng)信息主要是先將報導(dǎo)新聞標(biāo)題作為關(guān)鍵詞,利用新浪微博搜索,最后把相應(yīng)的搜索結(jié)果采集下來。數(shù)據(jù)采集的過程中還注意信息的去重,主要是新聞?wù)军c新聞報導(dǎo)的去重。文本分析處理模塊主要是針對微博文本進行中文分詞和相應(yīng)的詞頻統(tǒng)計,tf*idf 作為詞的權(quán)重,用向量空間表示一個話題,來把話題進行歸類,判斷話題的深度。此外,它還涉及借助負面詞出現(xiàn)的比例來判斷新聞的破壞性。數(shù)據(jù)統(tǒng)計分析模塊主要是統(tǒng)計分析出話題描述的各個指標(biāo)及熱點七因素的計算。預(yù)測模型就是利用本文提出的預(yù)測算法,通過簡單的機器學(xué)習(xí)和人工參與,得到負面熱點預(yù)測的指標(biāo),對以后的新聞進行負面熱點判斷。系統(tǒng)的一般流程就是首先新聞數(shù)據(jù)采集,然后對新聞數(shù)據(jù)進行文本分析和統(tǒng)計分析,得到新聞數(shù)據(jù)熱點七因素和破壞性的值,最后利用預(yù)測模塊進行判斷預(yù)測。具體流程見下圖:
圖 5.1 新聞樣本敏感性維度對比話題的敏感性度量該話題受到公眾的持續(xù)關(guān)注度。從上圖三類新聞均值線可以看出,全國熱點的敏感度最高,均值達到 1.1;地方熱點此致,均值為 0.61;而非熱點的敏感性最低,而且差別比較大,為-0.39。這也驗證了敏感度高的話題能夠立即得到廣大公眾的關(guān)注,更容易成為熱點話題。敏感性這個維度可以很好的衡量一個新聞話題熱度,而且對三類新聞話題區(qū)分度也明顯,對熱點新聞的預(yù)測起到很大作用。但是從上圖可以看出,全國熱點的敏感值線和地方熱點的敏感值線出現(xiàn)交叉,表明不是敏感值高的話題就一定是全國熱點話題,也不是敏感值相對較低的話題就不能成為全國熱點話題,還要考量其他維度的影響。同樣,地方熱點的敏感值線和非熱點的敏感值線也出現(xiàn)交叉,表明一開始敏感值低的話題也可能發(fā)展成為地方熱點話題。5.3.2 話題潛在發(fā)展力維度依照本文定義的話題潛在發(fā)展力因素計算公式,求得21個新聞樣本的潛在發(fā)展力,結(jié)果如表 5.3:
【參考文獻】:
期刊論文
[1]基于社會網(wǎng)絡(luò)中心性分析的微博信息傳播研究——以Sina微博為例[J]. 平亮,宗利永. 圖書情報知識. 2010(06)
[2]從受眾視角解讀微博現(xiàn)象[J]. 何瑤,陳曉芝. 新聞愛好者. 2010(19)
[3]從微博的特點看危機潛伏期政府如何預(yù)警——以富士康跳樓事件為例[J]. 張兵,張金華. 新聞世界. 2010(09)
[4]大學(xué)生微博使用動機模型實證研究[J]. 李芳,曲豫賓. 福建論壇(社科教育版). 2010(08)
[5]由突發(fā)事件看微博的傳播機制[J]. 陳紅玉. 傳媒觀察. 2010(08)
[6]微博傳播環(huán)境下輿論生成初探[J]. 呂航,張婷. 新聞傳播. 2010(06)
[7]傳播學(xué)視域中的微博研究[J]. 楊曉茹. 當(dāng)代傳播. 2010(02)
[8]話題發(fā)現(xiàn)與追蹤技術(shù)研究[J]. 張曉艷,王挺. 計算機科學(xué)與探索. 2009(04)
[9]基于聚類的網(wǎng)絡(luò)輿情熱點發(fā)現(xiàn)及分析[J]. 王偉,許鑫. 現(xiàn)代圖書情報技術(shù). 2009(03)
[10]貨運量影響因素分析——多元線性回歸分析[J]. 宋彩平,韓飛. 現(xiàn)代商貿(mào)工業(yè). 2009(06)
本文編號:3077881
【文章來源】:華南理工大學(xué)廣東省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:74 頁
【學(xué)位級別】:碩士
【部分圖文】:
負面熱點新聞指標(biāo)關(guān)系圖
第三章 負面熱點新聞早期預(yù)測對應(yīng)新浪微博上的用戶反應(yīng)信息主要是先將報導(dǎo)新聞標(biāo)題作為關(guān)鍵詞,利用新浪微博搜索,最后把相應(yīng)的搜索結(jié)果采集下來。數(shù)據(jù)采集的過程中還注意信息的去重,主要是新聞?wù)军c新聞報導(dǎo)的去重。文本分析處理模塊主要是針對微博文本進行中文分詞和相應(yīng)的詞頻統(tǒng)計,tf*idf 作為詞的權(quán)重,用向量空間表示一個話題,來把話題進行歸類,判斷話題的深度。此外,它還涉及借助負面詞出現(xiàn)的比例來判斷新聞的破壞性。數(shù)據(jù)統(tǒng)計分析模塊主要是統(tǒng)計分析出話題描述的各個指標(biāo)及熱點七因素的計算。預(yù)測模型就是利用本文提出的預(yù)測算法,通過簡單的機器學(xué)習(xí)和人工參與,得到負面熱點預(yù)測的指標(biāo),對以后的新聞進行負面熱點判斷。系統(tǒng)的一般流程就是首先新聞數(shù)據(jù)采集,然后對新聞數(shù)據(jù)進行文本分析和統(tǒng)計分析,得到新聞數(shù)據(jù)熱點七因素和破壞性的值,最后利用預(yù)測模塊進行判斷預(yù)測。具體流程見下圖:
圖 5.1 新聞樣本敏感性維度對比話題的敏感性度量該話題受到公眾的持續(xù)關(guān)注度。從上圖三類新聞均值線可以看出,全國熱點的敏感度最高,均值達到 1.1;地方熱點此致,均值為 0.61;而非熱點的敏感性最低,而且差別比較大,為-0.39。這也驗證了敏感度高的話題能夠立即得到廣大公眾的關(guān)注,更容易成為熱點話題。敏感性這個維度可以很好的衡量一個新聞話題熱度,而且對三類新聞話題區(qū)分度也明顯,對熱點新聞的預(yù)測起到很大作用。但是從上圖可以看出,全國熱點的敏感值線和地方熱點的敏感值線出現(xiàn)交叉,表明不是敏感值高的話題就一定是全國熱點話題,也不是敏感值相對較低的話題就不能成為全國熱點話題,還要考量其他維度的影響。同樣,地方熱點的敏感值線和非熱點的敏感值線也出現(xiàn)交叉,表明一開始敏感值低的話題也可能發(fā)展成為地方熱點話題。5.3.2 話題潛在發(fā)展力維度依照本文定義的話題潛在發(fā)展力因素計算公式,求得21個新聞樣本的潛在發(fā)展力,結(jié)果如表 5.3:
【參考文獻】:
期刊論文
[1]基于社會網(wǎng)絡(luò)中心性分析的微博信息傳播研究——以Sina微博為例[J]. 平亮,宗利永. 圖書情報知識. 2010(06)
[2]從受眾視角解讀微博現(xiàn)象[J]. 何瑤,陳曉芝. 新聞愛好者. 2010(19)
[3]從微博的特點看危機潛伏期政府如何預(yù)警——以富士康跳樓事件為例[J]. 張兵,張金華. 新聞世界. 2010(09)
[4]大學(xué)生微博使用動機模型實證研究[J]. 李芳,曲豫賓. 福建論壇(社科教育版). 2010(08)
[5]由突發(fā)事件看微博的傳播機制[J]. 陳紅玉. 傳媒觀察. 2010(08)
[6]微博傳播環(huán)境下輿論生成初探[J]. 呂航,張婷. 新聞傳播. 2010(06)
[7]傳播學(xué)視域中的微博研究[J]. 楊曉茹. 當(dāng)代傳播. 2010(02)
[8]話題發(fā)現(xiàn)與追蹤技術(shù)研究[J]. 張曉艷,王挺. 計算機科學(xué)與探索. 2009(04)
[9]基于聚類的網(wǎng)絡(luò)輿情熱點發(fā)現(xiàn)及分析[J]. 王偉,許鑫. 現(xiàn)代圖書情報技術(shù). 2009(03)
[10]貨運量影響因素分析——多元線性回歸分析[J]. 宋彩平,韓飛. 現(xiàn)代商貿(mào)工業(yè). 2009(06)
本文編號:3077881
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/3077881.html
最近更新
教材專著