基于社交網(wǎng)絡(luò)的輿情關(guān)鍵技術(shù)研究
本文關(guān)鍵詞:基于社交網(wǎng)絡(luò)的輿情關(guān)鍵技術(shù)研究 出處:《吉林大學(xué)》2017年碩士論文 論文類型:學(xué)位論文
更多相關(guān)文章: 網(wǎng)絡(luò)輿情 機(jī)器學(xué)習(xí) 文本傾向性分析 word2vec 微信平臺(tái)
【摘要】:隨著移動(dòng)互聯(lián)網(wǎng)的深入發(fā)展以及5G時(shí)代的到來(lái),各類社交應(yīng)用持續(xù)發(fā)展,互聯(lián)網(wǎng)平臺(tái)呈現(xiàn)泛社交化。社交網(wǎng)絡(luò)中的典型代表微信、微博,在輿情監(jiān)測(cè)分析中均扮演著重要的角色。相較于微博平臺(tái)輿情監(jiān)測(cè)技術(shù)的日漸成熟,基于微信平臺(tái)的相關(guān)研究較為匱乏,因此,本文重點(diǎn)研究了基于微信平臺(tái)的輿情監(jiān)測(cè)分析關(guān)鍵技術(shù)。本文根據(jù)社交網(wǎng)絡(luò)的輿情系統(tǒng)需求,設(shè)計(jì)系統(tǒng)總體架構(gòu),解決微信平臺(tái)公眾號(hào)數(shù)據(jù)獲取問(wèn)題,并對(duì)網(wǎng)絡(luò)輿情進(jìn)行傾向性分析。本文提出word2vec模型與機(jī)器學(xué)習(xí)相結(jié)合的微信文本傾向性分析模型,能夠有效提高分類準(zhǔn)確率、精確度、召回率。本文的主要工作如下:(1)設(shè)計(jì)了微信平臺(tái)輿情監(jiān)測(cè)分析系統(tǒng)框架,并對(duì)框架內(nèi)的各功能模塊逐一設(shè)計(jì)實(shí)現(xiàn)。闡述了系統(tǒng)任務(wù)執(zhí)行流程,設(shè)計(jì)并實(shí)現(xiàn)數(shù)據(jù)采集功能、數(shù)據(jù)存儲(chǔ)功能、文本傾向性分析功能、輿情報(bào)告展示功能。(2)通過(guò)Python爬蟲及Hook技術(shù)相結(jié)合的方式,實(shí)現(xiàn)微信平臺(tái)公眾號(hào)數(shù)據(jù)的自動(dòng)獲取,并存儲(chǔ)于服務(wù)器MySQL數(shù)據(jù)庫(kù)中。在數(shù)據(jù)采集模塊中詳細(xì)說(shuō)明了各組件工作原理及采集流程,明確移動(dòng)終端組件、服務(wù)器端組件構(gòu)成及通信方式,利用多個(gè)移動(dòng)終端采集,提高采集速率。信息通過(guò)去噪處理后存儲(chǔ),為輿情分析提供數(shù)據(jù)支持。(3)本文在研究特征選擇算法及分類算法的基礎(chǔ)上,進(jìn)一步研究了word2vec模型,提出機(jī)器學(xué)習(xí)方法與word2vec相結(jié)合的微信文本傾向性分析模型。并將提出的模型與傳統(tǒng)分類模型作對(duì)比研究,通過(guò)模型調(diào)優(yōu),使其在微信文本傾向性分類中效果更好。實(shí)驗(yàn)結(jié)果表明,本文提出的模型,在微信平臺(tái)文本傾向性分析中表現(xiàn)良好。準(zhǔn)確率達(dá)到84%,精確度達(dá)到86%,召回率達(dá)到83%,對(duì)比傳統(tǒng)分類模型分別提升5%、7%和5%,ROC曲線AUC值達(dá)到0.88,總體分類性能得到提升。本文的主要貢獻(xiàn)和創(chuàng)新點(diǎn)如下:(1)提出了機(jī)器學(xué)習(xí)與word2vec相結(jié)合的微信數(shù)據(jù)輿情分析模型,利用機(jī)器學(xué)習(xí)調(diào)優(yōu)方法,對(duì)模型進(jìn)行實(shí)驗(yàn)訓(xùn)練,使得系統(tǒng)分類性能整體得到提高,并實(shí)現(xiàn)微信文本的傾向性分析。(2)設(shè)計(jì)并實(shí)現(xiàn)了微信平臺(tái)的數(shù)據(jù)采集功能,利用Python爬蟲和Hook技術(shù)相結(jié)合的方式,解決了傳統(tǒng)網(wǎng)頁(yè)爬蟲訪問(wèn)服務(wù)器頻率受限的問(wèn)題。通過(guò)多個(gè)移動(dòng)終端并行采集,提高了數(shù)據(jù)采集速率,實(shí)現(xiàn)了微信數(shù)據(jù)的大規(guī)模獲取,為后續(xù)實(shí)驗(yàn)研究提供數(shù)據(jù)支持。
[Abstract]:With the further development of mobile Internet and 5G era, all kinds of social sustainable development, the Internet platform has Pan social. Social networks are the typical representatives of WeChat, micro-blog, in the public opinion monitoring and analysis play an important role. Compared to the micro-blog platform and monitoring technology, based on the related research of WeChat platform is scarce, therefore, this paper focuses on the research of public opinion monitoring WeChat platform. Based on the analysis of key technology based on the needs of the public opinion system of the social network, the overall system architecture design, solve the problem of obtaining WeChat platform public number data, and public opinion on the network orientation analysis. In this paper, WeChat text orientation word2vec model and machine learning the combination analysis model, can effectively improve the classification accuracy, precision and recall. The main work of this paper are as follows: (1) the design of WeChat Taiwan public opinion monitoring and analysis system, and the functional modules of the design and implementation of the framework. One describes the system task execution process, the design and implementation of data acquisition, data storage, text orientation analysis, public opinion reports show. (2) through the combination of Python and Hook crawler technology combination, realize the automatic get the WeChat platform public number data, and stored in the MySQL server database. The data acquisition module in detail the various components and working principle of the acquisition process, clear mobile terminal components, server components and communication mode, using multiple mobile terminal acquisition, increasing the acquisition rate. Through denoising after storage. Provide data support for the analysis of public opinion. (3) the basic algorithm and classification algorithm in the study of characteristics, further study of the word2vec model, a machine learning method WeChat text orientation combined with word2vec analysis model. Compared with the traditional model and proposes the classification model, through the model optimization, the effect is better in the WeChat text orientation classification. The experimental results show that the proposed model performs well in the WeChat platform text orientation analysis. The accuracy rate of reached 84%, precision 86%, recall rate reached 83%, 5% improve the traditional classification and comparison model respectively, 7% and 5%, the ROC curve of AUC value reached 0.88, the overall classification performance has been improved. The main contributions and innovations of this paper are as follows: (1) proposed a model of WeChat data public opinion machine learning combined with word2vec analysis. Using machine learning optimization method, experimental training on the system model, the overall classification performance is improved, and the tendency analysis of WeChat text. (2) the design and implementation of data acquisition of WeChat platform The function, using the combination of Python and Hook crawler technology combination, to solve the traditional web crawler server access frequency is limited. Collected in parallel by the plurality of mobile terminals, improves the data acquisition rate, to achieve a large-scale acquisition of WeChat data, provide data support for subsequent experimental research.
【學(xué)位授予單位】:吉林大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2017
【分類號(hào)】:TP393.09;TP181
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 劉毅;;略論網(wǎng)絡(luò)輿情的概念、特點(diǎn)、表達(dá)與傳播[J];理論界;2007年01期
2 陶建杰;;網(wǎng)絡(luò)輿情聯(lián)動(dòng)應(yīng)急機(jī)制初探[J];青年記者;2007年15期
3 胡圣方;楊文德;;網(wǎng)絡(luò)輿情管理的問(wèn)題及對(duì)策[J];甘肅政法成人教育學(xué)院學(xué)報(bào);2007年04期
4 吳明友;;校園網(wǎng)絡(luò)輿情的應(yīng)對(duì)策略分析[J];中國(guó)教育信息化;2008年24期
5 張麗紅;;試論網(wǎng)絡(luò)輿情傳播對(duì)文化的影響[J];前沿;2008年04期
6 姜?jiǎng)俸?;網(wǎng)絡(luò)輿情熱點(diǎn)的形成與發(fā)展、現(xiàn)狀及輿論引導(dǎo)[J];理論月刊;2008年04期
7 李子德;;論和諧社會(huì)視野中不良網(wǎng)絡(luò)輿情的預(yù)警[J];中國(guó)石油大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版);2008年04期
8 劉軍;;互聯(lián)網(wǎng)時(shí)代網(wǎng)絡(luò)輿情的應(yīng)急處理[J];理論學(xué)習(xí);2009年01期
9 周志強(qiáng);;網(wǎng)絡(luò)輿情與“口香糖思想”[J];人民論壇;2009年04期
10 許鑫;章成志;李雯靜;;國(guó)內(nèi)網(wǎng)絡(luò)輿情研究的回顧與展望[J];情報(bào)理論與實(shí)踐;2009年03期
相關(guān)會(huì)議論文 前10條
1 任銘;陳俊鑫;;我國(guó)網(wǎng)絡(luò)輿情及管理策略研究[A];2011年全國(guó)通信安全學(xué)術(shù)會(huì)議論文集[C];2011年
2 潘崇霞;;網(wǎng)絡(luò)輿情演化的階段分析[A];信息化、工業(yè)化融合與服務(wù)創(chuàng)新——第十三屆計(jì)算機(jī)模擬與信息技術(shù)學(xué)術(shù)會(huì)議論文集[C];2011年
3 潘慶芳;周萍;;涉路網(wǎng)絡(luò)輿情的現(xiàn)狀及應(yīng)對(duì)建議[A];中國(guó)公路學(xué)會(huì)高速公路運(yùn)營(yíng)管理分會(huì)2011年度年會(huì)暨第十八次全國(guó)高速公路運(yùn)營(yíng)管理工作研討會(huì)論文集[C];2011年
4 李大鵬;;加強(qiáng)新形勢(shì)下檢察機(jī)關(guān)網(wǎng)絡(luò)輿情體系建設(shè)[A];第27次全國(guó)計(jì)算機(jī)安全學(xué)術(shù)交流會(huì)論文集[C];2012年
5 曹俊喜;劉云;徐希源;;電力行業(yè)網(wǎng)絡(luò)輿情監(jiān)測(cè)分析技術(shù)研究與系統(tǒng)設(shè)計(jì)[A];2012年電力通信管理暨智能電網(wǎng)通信技術(shù)論壇論文集[C];2013年
6 冉治平;;提高網(wǎng)絡(luò)輿情應(yīng)對(duì)能力的幾點(diǎn)思考[A];浙江煙草(2012年第3期總第122期)[C];2012年
7 疏學(xué)明;鄭魁;張輝;袁宏永;;突發(fā)事件中網(wǎng)絡(luò)輿情信息管理方式探討[A];中國(guó)突發(fā)事件防范與快速處置優(yōu)秀成果選編[C];2009年
8 耿騫;劉穎;;網(wǎng)絡(luò)輿情的形成、傳播及監(jiān)測(cè)方法[A];科學(xué)發(fā)展:文化軟實(shí)力與民族復(fù)興——紀(jì)念中華人民共和國(guó)成立60周年論文集(下卷)[C];2009年
9 韓偉;張洪濤;;網(wǎng)絡(luò)輿情與青少年媒介認(rèn)知能力構(gòu)建[A];網(wǎng)絡(luò)時(shí)代的青少年和青少年工作研究報(bào)告——第六屆中國(guó)青少年發(fā)展論壇暨中國(guó)青少年研究會(huì)優(yōu)秀論文集(2010)[C];2010年
10 曾華藝;;網(wǎng)絡(luò)輿情危機(jī)事件指標(biāo)體系探討[A];信息化、工業(yè)化融合與服務(wù)創(chuàng)新——第十三屆計(jì)算機(jī)模擬與信息技術(shù)學(xué)術(shù)會(huì)議論文集[C];2011年
相關(guān)重要報(bào)紙文章 前10條
1 記者 劉自賢 通訊員 吳濤;網(wǎng)絡(luò)輿情助推漢江中院司法為民[N];湖北日?qǐng)?bào);2010年
2 通訊員 王宏杰;注重網(wǎng)絡(luò)輿情監(jiān)督 網(wǎng)上網(wǎng)下良性互動(dòng)[N];檢察日?qǐng)?bào);2010年
3 四川省地稅局直屬分局 韋一新 胡曉馳;正確應(yīng)對(duì)征納糾紛引發(fā)的網(wǎng)絡(luò)輿情危機(jī)[N];中國(guó)稅務(wù)報(bào);2010年
4 唐莉 記者 郭樹仁;梅河口檢察院加強(qiáng)涉檢網(wǎng)絡(luò)輿情研判與應(yīng)對(duì)工作[N];北方法制報(bào);2010年
5 記者 盧志堅(jiān) 通訊員 胡連芳;江蘇大豐:征聘百名“網(wǎng)絡(luò)輿情監(jiān)督員”[N];檢察日?qǐng)?bào);2009年
6 見習(xí)記者 施燕燕;應(yīng)對(duì)網(wǎng)絡(luò)輿情與三項(xiàng)重點(diǎn)工作息息相關(guān)[N];檢察日?qǐng)?bào);2010年
7 記者 吳漢松;提升引導(dǎo)網(wǎng)絡(luò)輿情能力[N];石獅日?qǐng)?bào);2010年
8 四川省內(nèi)江市工商局 吳明顯 楊曉彬;建議加強(qiáng)網(wǎng)絡(luò)輿情收集分析及引導(dǎo)工作(下)[N];中國(guó)工商報(bào);2010年
9 吳明顯;內(nèi)江積極加強(qiáng)網(wǎng)絡(luò)輿情監(jiān)測(cè)[N];中國(guó)工商報(bào);2010年
10 本報(bào)記者 白真智;探秘網(wǎng)絡(luò)輿情市場(chǎng)[N];人民日?qǐng)?bào);2010年
相關(guān)博士學(xué)位論文 前10條
1 張玉強(qiáng);網(wǎng)絡(luò)輿情危機(jī)的政府適度反應(yīng)研究[D];中央民族大學(xué);2011年
2 何健;高校大學(xué)生網(wǎng)絡(luò)輿情特征與管理對(duì)策研究[D];西南大學(xué);2015年
3 石新宇;當(dāng)代大學(xué)生網(wǎng)絡(luò)輿情分析及對(duì)策研究[D];遼寧大學(xué);2015年
4 曹學(xué)艷;突發(fā)事件動(dòng)態(tài)網(wǎng)絡(luò)輿情挖掘與應(yīng)對(duì)研究[D];電子科技大學(xué);2013年
5 劉泉;基于個(gè)體社會(huì)屬性的網(wǎng)絡(luò)輿情演化模型研究[D];大連理工大學(xué);2016年
6 方付建;突發(fā)事件網(wǎng)絡(luò)輿情演變研究[D];華中科技大學(xué);2011年
7 張偉;基于復(fù)雜社會(huì)網(wǎng)絡(luò)的網(wǎng)絡(luò)輿情演化模型研究[D];哈爾濱工業(yè)大學(xué);2014年
8 陳t熀,
本文編號(hào):1414507
本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/1414507.html