基于社交網絡的輿情關鍵技術研究
本文關鍵詞:基于社交網絡的輿情關鍵技術研究 出處:《吉林大學》2017年碩士論文 論文類型:學位論文
更多相關文章: 網絡輿情 機器學習 文本傾向性分析 word2vec 微信平臺
【摘要】:隨著移動互聯(lián)網的深入發(fā)展以及5G時代的到來,各類社交應用持續(xù)發(fā)展,互聯(lián)網平臺呈現(xiàn)泛社交化。社交網絡中的典型代表微信、微博,在輿情監(jiān)測分析中均扮演著重要的角色。相較于微博平臺輿情監(jiān)測技術的日漸成熟,基于微信平臺的相關研究較為匱乏,因此,本文重點研究了基于微信平臺的輿情監(jiān)測分析關鍵技術。本文根據(jù)社交網絡的輿情系統(tǒng)需求,設計系統(tǒng)總體架構,解決微信平臺公眾號數(shù)據(jù)獲取問題,并對網絡輿情進行傾向性分析。本文提出word2vec模型與機器學習相結合的微信文本傾向性分析模型,能夠有效提高分類準確率、精確度、召回率。本文的主要工作如下:(1)設計了微信平臺輿情監(jiān)測分析系統(tǒng)框架,并對框架內的各功能模塊逐一設計實現(xiàn)。闡述了系統(tǒng)任務執(zhí)行流程,設計并實現(xiàn)數(shù)據(jù)采集功能、數(shù)據(jù)存儲功能、文本傾向性分析功能、輿情報告展示功能。(2)通過Python爬蟲及Hook技術相結合的方式,實現(xiàn)微信平臺公眾號數(shù)據(jù)的自動獲取,并存儲于服務器MySQL數(shù)據(jù)庫中。在數(shù)據(jù)采集模塊中詳細說明了各組件工作原理及采集流程,明確移動終端組件、服務器端組件構成及通信方式,利用多個移動終端采集,提高采集速率。信息通過去噪處理后存儲,為輿情分析提供數(shù)據(jù)支持。(3)本文在研究特征選擇算法及分類算法的基礎上,進一步研究了word2vec模型,提出機器學習方法與word2vec相結合的微信文本傾向性分析模型。并將提出的模型與傳統(tǒng)分類模型作對比研究,通過模型調優(yōu),使其在微信文本傾向性分類中效果更好。實驗結果表明,本文提出的模型,在微信平臺文本傾向性分析中表現(xiàn)良好。準確率達到84%,精確度達到86%,召回率達到83%,對比傳統(tǒng)分類模型分別提升5%、7%和5%,ROC曲線AUC值達到0.88,總體分類性能得到提升。本文的主要貢獻和創(chuàng)新點如下:(1)提出了機器學習與word2vec相結合的微信數(shù)據(jù)輿情分析模型,利用機器學習調優(yōu)方法,對模型進行實驗訓練,使得系統(tǒng)分類性能整體得到提高,并實現(xiàn)微信文本的傾向性分析。(2)設計并實現(xiàn)了微信平臺的數(shù)據(jù)采集功能,利用Python爬蟲和Hook技術相結合的方式,解決了傳統(tǒng)網頁爬蟲訪問服務器頻率受限的問題。通過多個移動終端并行采集,提高了數(shù)據(jù)采集速率,實現(xiàn)了微信數(shù)據(jù)的大規(guī)模獲取,為后續(xù)實驗研究提供數(shù)據(jù)支持。
[Abstract]:With the further development of mobile Internet and 5G era, all kinds of social sustainable development, the Internet platform has Pan social. Social networks are the typical representatives of WeChat, micro-blog, in the public opinion monitoring and analysis play an important role. Compared to the micro-blog platform and monitoring technology, based on the related research of WeChat platform is scarce, therefore, this paper focuses on the research of public opinion monitoring WeChat platform. Based on the analysis of key technology based on the needs of the public opinion system of the social network, the overall system architecture design, solve the problem of obtaining WeChat platform public number data, and public opinion on the network orientation analysis. In this paper, WeChat text orientation word2vec model and machine learning the combination analysis model, can effectively improve the classification accuracy, precision and recall. The main work of this paper are as follows: (1) the design of WeChat Taiwan public opinion monitoring and analysis system, and the functional modules of the design and implementation of the framework. One describes the system task execution process, the design and implementation of data acquisition, data storage, text orientation analysis, public opinion reports show. (2) through the combination of Python and Hook crawler technology combination, realize the automatic get the WeChat platform public number data, and stored in the MySQL server database. The data acquisition module in detail the various components and working principle of the acquisition process, clear mobile terminal components, server components and communication mode, using multiple mobile terminal acquisition, increasing the acquisition rate. Through denoising after storage. Provide data support for the analysis of public opinion. (3) the basic algorithm and classification algorithm in the study of characteristics, further study of the word2vec model, a machine learning method WeChat text orientation combined with word2vec analysis model. Compared with the traditional model and proposes the classification model, through the model optimization, the effect is better in the WeChat text orientation classification. The experimental results show that the proposed model performs well in the WeChat platform text orientation analysis. The accuracy rate of reached 84%, precision 86%, recall rate reached 83%, 5% improve the traditional classification and comparison model respectively, 7% and 5%, the ROC curve of AUC value reached 0.88, the overall classification performance has been improved. The main contributions and innovations of this paper are as follows: (1) proposed a model of WeChat data public opinion machine learning combined with word2vec analysis. Using machine learning optimization method, experimental training on the system model, the overall classification performance is improved, and the tendency analysis of WeChat text. (2) the design and implementation of data acquisition of WeChat platform The function, using the combination of Python and Hook crawler technology combination, to solve the traditional web crawler server access frequency is limited. Collected in parallel by the plurality of mobile terminals, improves the data acquisition rate, to achieve a large-scale acquisition of WeChat data, provide data support for subsequent experimental research.
【學位授予單位】:吉林大學
【學位級別】:碩士
【學位授予年份】:2017
【分類號】:TP393.09;TP181
【相似文獻】
相關期刊論文 前10條
1 劉毅;;略論網絡輿情的概念、特點、表達與傳播[J];理論界;2007年01期
2 陶建杰;;網絡輿情聯(lián)動應急機制初探[J];青年記者;2007年15期
3 胡圣方;楊文德;;網絡輿情管理的問題及對策[J];甘肅政法成人教育學院學報;2007年04期
4 吳明友;;校園網絡輿情的應對策略分析[J];中國教育信息化;2008年24期
5 張麗紅;;試論網絡輿情傳播對文化的影響[J];前沿;2008年04期
6 姜勝洪;;網絡輿情熱點的形成與發(fā)展、現(xiàn)狀及輿論引導[J];理論月刊;2008年04期
7 李子德;;論和諧社會視野中不良網絡輿情的預警[J];中國石油大學學報(社會科學版);2008年04期
8 劉軍;;互聯(lián)網時代網絡輿情的應急處理[J];理論學習;2009年01期
9 周志強;;網絡輿情與“口香糖思想”[J];人民論壇;2009年04期
10 許鑫;章成志;李雯靜;;國內網絡輿情研究的回顧與展望[J];情報理論與實踐;2009年03期
相關會議論文 前10條
1 任銘;陳俊鑫;;我國網絡輿情及管理策略研究[A];2011年全國通信安全學術會議論文集[C];2011年
2 潘崇霞;;網絡輿情演化的階段分析[A];信息化、工業(yè)化融合與服務創(chuàng)新——第十三屆計算機模擬與信息技術學術會議論文集[C];2011年
3 潘慶芳;周萍;;涉路網絡輿情的現(xiàn)狀及應對建議[A];中國公路學會高速公路運營管理分會2011年度年會暨第十八次全國高速公路運營管理工作研討會論文集[C];2011年
4 李大鵬;;加強新形勢下檢察機關網絡輿情體系建設[A];第27次全國計算機安全學術交流會論文集[C];2012年
5 曹俊喜;劉云;徐希源;;電力行業(yè)網絡輿情監(jiān)測分析技術研究與系統(tǒng)設計[A];2012年電力通信管理暨智能電網通信技術論壇論文集[C];2013年
6 冉治平;;提高網絡輿情應對能力的幾點思考[A];浙江煙草(2012年第3期總第122期)[C];2012年
7 疏學明;鄭魁;張輝;袁宏永;;突發(fā)事件中網絡輿情信息管理方式探討[A];中國突發(fā)事件防范與快速處置優(yōu)秀成果選編[C];2009年
8 耿騫;劉穎;;網絡輿情的形成、傳播及監(jiān)測方法[A];科學發(fā)展:文化軟實力與民族復興——紀念中華人民共和國成立60周年論文集(下卷)[C];2009年
9 韓偉;張洪濤;;網絡輿情與青少年媒介認知能力構建[A];網絡時代的青少年和青少年工作研究報告——第六屆中國青少年發(fā)展論壇暨中國青少年研究會優(yōu)秀論文集(2010)[C];2010年
10 曾華藝;;網絡輿情危機事件指標體系探討[A];信息化、工業(yè)化融合與服務創(chuàng)新——第十三屆計算機模擬與信息技術學術會議論文集[C];2011年
相關重要報紙文章 前10條
1 記者 劉自賢 通訊員 吳濤;網絡輿情助推漢江中院司法為民[N];湖北日報;2010年
2 通訊員 王宏杰;注重網絡輿情監(jiān)督 網上網下良性互動[N];檢察日報;2010年
3 四川省地稅局直屬分局 韋一新 胡曉馳;正確應對征納糾紛引發(fā)的網絡輿情危機[N];中國稅務報;2010年
4 唐莉 記者 郭樹仁;梅河口檢察院加強涉檢網絡輿情研判與應對工作[N];北方法制報;2010年
5 記者 盧志堅 通訊員 胡連芳;江蘇大豐:征聘百名“網絡輿情監(jiān)督員”[N];檢察日報;2009年
6 見習記者 施燕燕;應對網絡輿情與三項重點工作息息相關[N];檢察日報;2010年
7 記者 吳漢松;提升引導網絡輿情能力[N];石獅日報;2010年
8 四川省內江市工商局 吳明顯 楊曉彬;建議加強網絡輿情收集分析及引導工作(下)[N];中國工商報;2010年
9 吳明顯;內江積極加強網絡輿情監(jiān)測[N];中國工商報;2010年
10 本報記者 白真智;探秘網絡輿情市場[N];人民日報;2010年
相關博士學位論文 前10條
1 張玉強;網絡輿情危機的政府適度反應研究[D];中央民族大學;2011年
2 何健;高校大學生網絡輿情特征與管理對策研究[D];西南大學;2015年
3 石新宇;當代大學生網絡輿情分析及對策研究[D];遼寧大學;2015年
4 曹學艷;突發(fā)事件動態(tài)網絡輿情挖掘與應對研究[D];電子科技大學;2013年
5 劉泉;基于個體社會屬性的網絡輿情演化模型研究[D];大連理工大學;2016年
6 方付建;突發(fā)事件網絡輿情演變研究[D];華中科技大學;2011年
7 張偉;基于復雜社會網絡的網絡輿情演化模型研究[D];哈爾濱工業(yè)大學;2014年
8 陳t熀,
本文編號:1414507
本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/1414507.html