基于輿情系統(tǒng)的食品安全信息情感傾向性研究
發(fā)布時間:2024-05-12 01:42
隨著互聯(lián)網(wǎng)技術(shù)的快速發(fā)展,文本數(shù)據(jù)每天都在呈爆炸式增長,這些數(shù)據(jù)包含了用戶在微博、微信、論壇等社交媒體平臺所發(fā)表的動態(tài)信息、各大新聞媒體門戶網(wǎng)站的新聞內(nèi)容、各個電商網(wǎng)站下商品的評論信息、用戶往來溝通的帖子郵件等,這些文本數(shù)據(jù)看似復(fù)雜,實(shí)則蘊(yùn)含著大量有用信息,包含了公眾的觀點(diǎn)以及情感傾向。近來年,針對文本情感分析的研究逐漸增多,這些研究可以幫助企業(yè)了解用戶對某一商品或服務(wù)的情感態(tài)度,還可以針對某些熱點(diǎn)輿情事件,為相關(guān)單位制定一些政策提供決策支持,及時疏導(dǎo)負(fù)面情緒等。本文主要從跟人們生活息息相關(guān)的食品安全信息出發(fā),以“非洲豬瘟”為例,借助中國吉林網(wǎng)輿情系統(tǒng)中公眾關(guān)于“非洲豬瘟”事件的原創(chuàng)型評論數(shù)據(jù),采用機(jī)器學(xué)習(xí)的方法對其進(jìn)行情感傾向性分析。主要研究內(nèi)容如下:(1)情感分析理論概況情感分析作為自然語言處理的一個重要研究領(lǐng)域,需要了解與學(xué)習(xí)其中的相關(guān)理論知識,包括自然語言處理的方法,情感分析的概念、目標(biāo),在不同的應(yīng)用場景下,情感分析所需要的完成的任務(wù),以及根據(jù)所處理的文本粒度不同,情感傾向性分析可以劃分三個級別等。(2)關(guān)鍵技術(shù)研究中文文本情感分析的首要任務(wù),需要對文本進(jìn)行預(yù)處理,包括:中文分...
【文章頁數(shù)】:70 頁
【學(xué)位級別】:碩士
【部分圖文】:
本文編號:3970672
【文章頁數(shù)】:70 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖2.1某購物網(wǎng)站的評價頁面
見圖2.1,從評價可以分析得到:客戶對人參有苦味和顏色是黑色的情況不是很滿意,那么就要考慮人參品質(zhì)的問題,及時調(diào)整自家的產(chǎn)品質(zhì)量。(2)輿情分析方面
圖2.2文本粒度劃分
根據(jù)所處理文本的顆粒度,情感傾向性研究可以劃分三個級別:篇章級、句子級和屬性級,見圖2.2。(1)篇章級情感分析
圖3.1主流分詞方法
中文分詞的方法可主要?dú)w納為基于詞典的規(guī)則分詞方法、基于概率的統(tǒng)計(jì)分詞方法以及兩者混合的方法[22],見圖3.1;谠~典的規(guī)則分詞是早期的分詞方法,通過人工整理一些分詞詞庫,將文本中的詞語按照一定的規(guī)則進(jìn)行匹配,匹配成功則切分出該詞語,實(shí)踐過程相對容易,但是該方法對未登陸詞卻很難....
圖3.2詞性標(biāo)注方法
詞性標(biāo)注的方式分為三大類:基于詞典的匹配查找方法、基于統(tǒng)計(jì)的方法以及兩者混合的方法,見圖3.2:基于字符串匹配的詞典查找方法是先對文本進(jìn)行分詞處理,然后從詞典中查找每個詞語的詞性,見表3-1,對其標(biāo)注即可,該標(biāo)注方法的優(yōu)點(diǎn)是標(biāo)注過程相對簡單高效,但是該方法需要人工制定消除歧義規(guī)則....
本文編號:3970672
本文鏈接:http://sikaile.net/xinwenchuanbolunwen/3970672.html
最近更新
教材專著