天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 社科論文 > 新聞傳播論文 >

基于微博平臺(tái)的社交網(wǎng)絡(luò)輿情分析方法

發(fā)布時(shí)間:2020-07-12 06:06
【摘要】:近年來,微博平臺(tái)快速發(fā)展,逐漸形成一個(gè)很大的網(wǎng)絡(luò)媒體。通過微博評(píng)論參與各種熱門話題,能比傳統(tǒng)媒體更早地做出話題檢測(cè),以此挖掘輿論觀點(diǎn)的反應(yīng)。針對(duì)大眾話題互動(dòng)背后的文本對(duì)象主題,分析其內(nèi)在的語義相關(guān)性,不僅具有很高的理論研究?jī)r(jià)值,也存在著巨大的社會(huì)、經(jīng)濟(jì)價(jià)值。傳統(tǒng)的話題檢測(cè)方法主要適用于傳統(tǒng)媒體的文本,對(duì)于處理微博短文本稀疏的結(jié)構(gòu)效果不明顯,論文提出了基于文本聚類的模型檢測(cè)方法和主題分析模型。在該方法中,首先根據(jù)微博特有的數(shù)據(jù)結(jié)構(gòu),進(jìn)行預(yù)處理。并針對(duì)數(shù)據(jù)稀疏的問題,基于詞向量利用聚類算法來豐富數(shù)據(jù)結(jié)果信息。最后,在傳統(tǒng)的潛在狄利克雷主題分配(LDA)模型基礎(chǔ)上進(jìn)行擴(kuò)展。與傳統(tǒng)算法相比較,論文提出的方法在新浪微博測(cè)試語料集上取得了更好的性能,效果優(yōu)于單一的聚類算法或話題檢測(cè)模型。在提出基于文本聚類和主題模型進(jìn)行話題檢測(cè)的基礎(chǔ)上,又提出了基于Pagerank微博信息傳播影響力評(píng)價(jià)模型,該模型可重點(diǎn)關(guān)注微博信息傳輸過程中數(shù)據(jù)結(jié)構(gòu)的傳輸質(zhì)量,從中總結(jié)出影響微博用戶行為特征的三個(gè)方面,也即用戶節(jié)點(diǎn)活躍度、用戶節(jié)點(diǎn)受關(guān)注度、用戶節(jié)點(diǎn)質(zhì)量。最終將三者的加權(quán)平均值與微博節(jié)點(diǎn)的粉絲數(shù)量平衡后引入PageRank算法進(jìn)行計(jì)算,經(jīng)過比較發(fā)現(xiàn),該方法優(yōu)于傳統(tǒng)PageRank網(wǎng)頁(yè)排名方法。論文最后,通過對(duì)具體實(shí)例進(jìn)行分析研究,設(shè)計(jì)實(shí)現(xiàn)了輿情分析原型系統(tǒng),驗(yàn)證了論文提出的話題檢測(cè)方法與影響力評(píng)估模型的可行性。
【學(xué)位授予單位】:南京郵電大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類號(hào)】:G206
【圖文】:

文本聚類,文本轉(zhuǎn)換,自然語言,分析流程


圖2.1文本聚類分析流程逡逑聚類分析的第一步,需要將自然語言文文本中的特征值抽取出來構(gòu)造出特征要文本專業(yè)領(lǐng)域的知識(shí)進(jìn)行參與,從出特征值矩陣。逡逑歷了第一步的特征值抽取之后,就可W聚類算法通常考慮的方面不同,因而到不同的聚類結(jié)果。聚類算法一般考慮用模型的方法等。目前聚類算法的種小密度和全局參數(shù)考慮在內(nèi),但卻沒有均,因而會(huì)造成聚類質(zhì)量的下降;基于達(dá)到終止條件形成有層次類別的效果;7逡逑

傳播網(wǎng)絡(luò),節(jié)點(diǎn)圖,信息,可視化


本節(jié)選取新浪微博社區(qū)@人民日?qǐng)?bào)在2014年3月8日發(fā)布的有關(guān)馬航MH370航班失聯(lián)逡逑的信息為研究對(duì)象。該條微博信息的轉(zhuǎn)發(fā)數(shù)量達(dá)到了二十二萬,該微博下的評(píng)論數(shù)量超過了逡逑兩萬,是一個(gè)討論和轉(zhuǎn)發(fā)較為活躍的微博信息,圖3.2為此微博信息在傳播中的節(jié)點(diǎn)網(wǎng)絡(luò)結(jié)逡逑構(gòu)圖:逡逑蠢逡逑.‘╁義?逦/邋:翻辶x希義希В,/邋'?皆?秸幃逦**辶x掀澹危苠澹檬″義希3?圖3.2微博傳播網(wǎng)絡(luò)節(jié)點(diǎn)圖逡逑W3.2中的每個(gè)節(jié)點(diǎn)代表一條微博信息,連線間的關(guān)系代表轉(zhuǎn)發(fā)關(guān)系,該圖表可視化地逡逑18逡逑

趨勢(shì)圖,變化趨勢(shì),實(shí)驗(yàn)結(jié)果,趨勢(shì)


10邐20邐30邐40邐50邐60邐70邐80邐90邐100逡逑圖3.6邋K值變化趨勢(shì)逡逑圖3.6是實(shí)驗(yàn)結(jié)果隨著K值的改變而變化的趨勢(shì)。不同實(shí)驗(yàn)數(shù)據(jù)集的大小不同,最合適逡逑的K值的大小也會(huì)改變。我們從上圖中可W看出,最適宜本文中數(shù)據(jù)集的K=40。故本文下逡逑面的研究都是基于K=40的基礎(chǔ)的。逡逑實(shí)驗(yàn)采用3.5.2節(jié)中介紹的評(píng)測(cè)標(biāo)準(zhǔn)作為相應(yīng)算法的性能指標(biāo)。對(duì)比結(jié)果如圖3.7所示。逡逑0.7邋—I——WW -i逡逑0.6邋—邋IH邐邐——|H—逡逑0.5^邐■邐:邋^邋■HW逡逑I二=逡逑0邋9—邐\邋:邋....邐邐邐邋WKSm逡逑;M邐I.邋]邋.邐:?■邋I邋I逡逑準(zhǔn)確率邐召回率邐f值逡逑圖3.7邋LDA與本文算法性能測(cè)評(píng)對(duì)比逡逑W上實(shí)驗(yàn)數(shù)據(jù)可W得到W下結(jié)論:首先,相較于單純的LDA算法,本論文提出的分析模逡逑型在各項(xiàng)性能指標(biāo)上都有較大的提高。這主要是因?yàn)楸疚牡乃惴ǹ紤]了微博數(shù)據(jù)自身結(jié)構(gòu)化逡逑的信息,采用了基于特征擴(kuò)展的技術(shù),豐富了原始數(shù)據(jù)的特征信息。其次,引入微博信息中逡逑涉及的超文本連接中信息,可W較大的提高話題提取性能。在單一的LDA話題檢測(cè)算法中,逡逑沒有引入基于詞向量的聚類技術(shù),使得數(shù)據(jù)矩陣高度稀疏也是使得算法沒能達(dá)到滿意結(jié)果的逡逑原因。因此,本文算法中提出的基于引入微博數(shù)據(jù)結(jié)構(gòu)化信息1^及聚類算法的話題檢測(cè)方法,逡逑雖然增加了計(jì)算的復(fù)雜度

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 梁麗雯;;網(wǎng)絡(luò)輿情分析師或成就業(yè)香餑餑[J];金融科技時(shí)代;2014年01期

2 ;做好輿情分析是有效引導(dǎo)的前提[J];中國(guó)記者;2001年03期

3 楊玫;;輿情分析:圖書館為領(lǐng)導(dǎo)決策服務(wù)的新探索[J];圖書館論壇;2006年05期

4 宋占茹;;圖書館開展網(wǎng)絡(luò)輿情分析工作初探[J];情報(bào)探索;2010年08期

5 何順蘭;王興起;胡宏宇;姜明;;多媒體輿情分析系統(tǒng)設(shè)計(jì)與研究[J];杭州電子科技大學(xué)學(xué)報(bào);2010年05期

6 顏建華;劉巖;傅黎犁;劉亞民;;基于網(wǎng)絡(luò)的輿情分析系統(tǒng)及其應(yīng)用研究[J];醫(yī)學(xué)信息學(xué)雜志;2011年08期

7 侯文昌;;傳媒新角色—輿情分析師的專業(yè)素養(yǎng) “朝陽職業(yè)”四年成長(zhǎng)史[J];中國(guó)記者;2011年09期

8 劉鵬飛;;“尋路”輿情分析師:一些心得,幾點(diǎn)忠告[J];中國(guó)記者;2011年09期

9 劉巖;傅黎犁;顏建華;;醫(yī)學(xué)情報(bào)研究機(jī)構(gòu)開展輿情分析服務(wù)的實(shí)踐[J];中華醫(yī)學(xué)圖書情報(bào)雜志;2012年01期

10 曹勁松;;政府形象傳播的輿情分析[J];江海學(xué)刊;2012年03期

相關(guān)會(huì)議論文 前4條

1 宋占茹;;圖書館網(wǎng)絡(luò)輿情分析工作新探[A];華北地區(qū)高校圖協(xié)第二十四屆學(xué)術(shù)年會(huì)論文(文章)匯編[C];2010年

2 何順蘭;王興起;胡宏宇;姜明;;多媒體輿情分析系統(tǒng)設(shè)計(jì)與研究[A];浙江省電子學(xué)會(huì)2010學(xué)術(shù)年會(huì)論文集[C];2010年

3 孫江;;天津薊縣萊德商廈火災(zāi)信息發(fā)布、媒體報(bào)道及網(wǎng)絡(luò)輿情分析[A];2013中國(guó)消防協(xié)會(huì)科學(xué)技術(shù)年會(huì)論文集[C];2013年

4 梁飛;呂洪波;姚錦峰;;輿情分析中語料庫(kù)降維[A];2008'中國(guó)信息技術(shù)與應(yīng)用學(xué)術(shù)論壇論文集(一)[C];2008年

相關(guān)重要報(bào)紙文章 前10條

1 本報(bào)記者 降蘊(yùn)彰;輿情分析師來了[N];經(jīng)濟(jì)觀察報(bào);2013年

2 福建三明學(xué)院 鄭祥專;教育輿情分析須堅(jiān)持“四性”[N];中國(guó)教育報(bào);2009年

3 記者 王慶華;克旗全面啟動(dòng)法律援助輿情分析工作[N];赤峰日?qǐng)?bào);2010年

4 本報(bào)記者 傅江平;輿情分析為食品安全監(jiān)管提供支撐[N];中國(guó)質(zhì)量報(bào);2012年

5 記者 馬獻(xiàn)忠;“段子文化的輿情分析”課題結(jié)項(xiàng)[N];中國(guó)社會(huì)科學(xué)報(bào);2011年

6 本報(bào)記者 孫艷敏;網(wǎng)絡(luò)輿情分析師:不只是替領(lǐng)導(dǎo)看看網(wǎng)[N];檢察日?qǐng)?bào);2013年

7 記者 魏志強(qiáng) 通訊員 杜勝輝;青工的心情 團(tuán)委的事情[N];中國(guó)石油報(bào);2010年

8 楊麗娟 張音;走近網(wǎng)絡(luò)輿情分析師[N];人民日?qǐng)?bào);2011年

9 于雅倩 本報(bào)記者 王寧;身邊煩惱有地兒說[N];丹東日?qǐng)?bào);2009年

10 趙強(qiáng);回應(yīng)輿論關(guān)切 怎能語焉不詳[N];人民日?qǐng)?bào);2014年

相關(guān)博士學(xué)位論文 前1條

1 馮時(shí);面向網(wǎng)絡(luò)輿情分析的觀點(diǎn)挖掘關(guān)鍵技術(shù)研究[D];東北大學(xué);2011年

相關(guān)碩士學(xué)位論文 前10條

1 姜朋;山東大學(xué)輿情分析系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];山東大學(xué);2015年

2 朱慧;基于輿情分析研判的突發(fā)事件預(yù)警平臺(tái)的設(shè)計(jì)與實(shí)現(xiàn)[D];電子科技大學(xué);2011年

3 高衛(wèi)民;城市公安網(wǎng)絡(luò)輿情分析系統(tǒng)的設(shè)計(jì)與開發(fā)[D];天津大學(xué);2014年

4 張鵬星;基于文本傾向性分析的網(wǎng)絡(luò)輿情分析及其趨勢(shì)預(yù)測(cè)[D];云南財(cái)經(jīng)大學(xué);2014年

5 許志凱;網(wǎng)絡(luò)輿情分析關(guān)鍵技術(shù)的研究與實(shí)現(xiàn)[D];哈爾濱工業(yè)大學(xué);2011年

6 張劭捷;基于微博社交網(wǎng)絡(luò)的輿情分析模型及實(shí)現(xiàn)[D];華南理工大學(xué);2011年

7 王濤;微博輿情分析系統(tǒng)信息處理模塊的設(shè)計(jì)與實(shí)現(xiàn)[D];東華大學(xué);2014年

8 馬梅;基于大數(shù)據(jù)的網(wǎng)絡(luò)輿情分析系統(tǒng)模型研究[D];西安電子科技大學(xué);2014年

9 王然;輿情分析系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];北京郵電大學(xué);2013年

10 謝宜瑾;網(wǎng)絡(luò)輿情分析與管理技術(shù)的研究與實(shí)現(xiàn)[D];廣東工業(yè)大學(xué);2012年



本文編號(hào):2751540

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/xinwenchuanbolunwen/2751540.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶1c70e***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com