政務(wù)微博評(píng)論中情感極性分析方法研究——以上海公安機(jī)構(gòu)微博為例
發(fā)布時(shí)間:2021-09-19 00:24
[目的/意義]研究政務(wù)微博評(píng)論中的情感極性分析方法,為政務(wù)微博情感傾向判斷提供依據(jù)并為未來情感分析研究指出方向。[方法/過程]基于字典的情感分析方法構(gòu)建情感極性分析模型,以上海公安機(jī)構(gòu)微博為實(shí)例,驗(yàn)證模型的可用性,并分析微博已有屬性信息在情感分析中的作用。最后對(duì)微博的這些信息以及情感極性進(jìn)行相關(guān)性分析。[結(jié)果/結(jié)論]本文的情感極性分析模型具有可用性,微博評(píng)論量和轉(zhuǎn)發(fā)量之間存在著顯著正相關(guān)性,并且在轉(zhuǎn)發(fā)量較低時(shí),評(píng)論量與情感極性存在著顯著負(fù)相關(guān)關(guān)系。且當(dāng)微博點(diǎn)贊量大于評(píng)論量時(shí),微博內(nèi)容自身帶有正向情感傾向。
【文章來源】:現(xiàn)代情報(bào). 2020,40(03)CSSCI
【文章頁數(shù)】:12 頁
【部分圖文】:
政務(wù)微博評(píng)論情感分析模型總體框架
微博評(píng)論文本主體都是由一些短文本組成,還有很大部分是由個(gè)別詞組成,所以傳統(tǒng)的句法結(jié)構(gòu)分析在評(píng)論文本中并不適用,這里直接根據(jù)精確模式分詞后的詞性標(biāo)注,需要分是否有謂語動(dòng)詞來分析。如果沒有謂語動(dòng)詞,即無情感詞可匹配,不采取任何操作,或情感極性值記為0;如果有謂語動(dòng)詞,提取評(píng)論中的謂語動(dòng)詞來遍歷情感詞典中的詞以判斷謂語動(dòng)詞的情感極性得到初步的情感極性判斷,然后根據(jù)是否含有否定詞來重新判斷評(píng)論的情感極性,最后根據(jù)情感詞典中的程度詞典來賦予極性權(quán)重,得出單條評(píng)論的情感極性值。在實(shí)際處理中,為了追求準(zhǔn)確與便捷,也可以用評(píng)論句子中的所有詞去遍歷情感詞典,避免詞性標(biāo)注不準(zhǔn)確帶來的遺漏。之后依次去遍歷否定詞典和程度詞典,得到更有說服力的結(jié)論。單條政務(wù)微博評(píng)論的情感分析簡要流程如圖2所示。2.4 顯式信息分析
從得出的相關(guān)系數(shù)表中,還可以得出在n<224時(shí),情感極性與評(píng)論和轉(zhuǎn)發(fā)之間也有較為顯著的相關(guān)性,但隨著樣本n的增加,相關(guān)性減小。即說明假設(shè)二中微博評(píng)論情感與點(diǎn)贊、評(píng)論和轉(zhuǎn)發(fā)都沒有直接的相關(guān)性。假設(shè)二并目前還不能成立,已有的三大屬性信息還不能直接代替文本情感分析方法去判斷微博評(píng)論情感傾向,還需要平臺(tái)未來提供更多的顯式信息。因此對(duì)微博和評(píng)論做進(jìn)一步深度分析,用來排除一些個(gè)別因素,如單個(gè)指標(biāo)數(shù)量極多的情況,本研究進(jìn)行了分段式回歸分析,多次試驗(yàn)后發(fā)現(xiàn)以評(píng)論量進(jìn)行分段效果較好,研究在評(píng)論量各分段區(qū)間內(nèi)評(píng)論、轉(zhuǎn)發(fā)和點(diǎn)贊與情感的關(guān)系,分析結(jié)果如表5所示。當(dāng)評(píng)論量在0~90區(qū)間時(shí),僅轉(zhuǎn)發(fā)與情感分別在5%和1%水平上顯著正相關(guān),而評(píng)論和點(diǎn)贊與情感的相關(guān)性不顯著;當(dāng)評(píng)論量在0~60區(qū)間時(shí),評(píng)論和轉(zhuǎn)發(fā)與情感的相關(guān)系數(shù)分別為-0.008和0.011,分別在5%和1%水平上顯著。當(dāng)評(píng)論量在0~30區(qū)間時(shí),評(píng)論和轉(zhuǎn)發(fā)與情感的相關(guān)系數(shù)分別為-0.022和0.007,且都在1%水平上顯著;當(dāng)評(píng)論量在0~10區(qū)間時(shí),評(píng)論和轉(zhuǎn)發(fā)與情感的相關(guān)系數(shù)分別為-0.013和0.004,且都在5%水平上顯著;即假設(shè)三中在轉(zhuǎn)發(fā)量較低時(shí)評(píng)論量與微博評(píng)論情感呈負(fù)相關(guān)關(guān)系。
【參考文獻(xiàn)】:
期刊論文
[1]基于情感分析的災(zāi)害網(wǎng)絡(luò)輿情研究——以雅安地震為例[J]. 劉雯,高峰,洪凌子. 圖書情報(bào)工作. 2013(20)
[2]基于情感分析的評(píng)論挖掘模型研究[J]. 唐曉波,肖璐. 情報(bào)理論與實(shí)踐. 2013(07)
本文編號(hào):3400627
【文章來源】:現(xiàn)代情報(bào). 2020,40(03)CSSCI
【文章頁數(shù)】:12 頁
【部分圖文】:
政務(wù)微博評(píng)論情感分析模型總體框架
微博評(píng)論文本主體都是由一些短文本組成,還有很大部分是由個(gè)別詞組成,所以傳統(tǒng)的句法結(jié)構(gòu)分析在評(píng)論文本中并不適用,這里直接根據(jù)精確模式分詞后的詞性標(biāo)注,需要分是否有謂語動(dòng)詞來分析。如果沒有謂語動(dòng)詞,即無情感詞可匹配,不采取任何操作,或情感極性值記為0;如果有謂語動(dòng)詞,提取評(píng)論中的謂語動(dòng)詞來遍歷情感詞典中的詞以判斷謂語動(dòng)詞的情感極性得到初步的情感極性判斷,然后根據(jù)是否含有否定詞來重新判斷評(píng)論的情感極性,最后根據(jù)情感詞典中的程度詞典來賦予極性權(quán)重,得出單條評(píng)論的情感極性值。在實(shí)際處理中,為了追求準(zhǔn)確與便捷,也可以用評(píng)論句子中的所有詞去遍歷情感詞典,避免詞性標(biāo)注不準(zhǔn)確帶來的遺漏。之后依次去遍歷否定詞典和程度詞典,得到更有說服力的結(jié)論。單條政務(wù)微博評(píng)論的情感分析簡要流程如圖2所示。2.4 顯式信息分析
從得出的相關(guān)系數(shù)表中,還可以得出在n<224時(shí),情感極性與評(píng)論和轉(zhuǎn)發(fā)之間也有較為顯著的相關(guān)性,但隨著樣本n的增加,相關(guān)性減小。即說明假設(shè)二中微博評(píng)論情感與點(diǎn)贊、評(píng)論和轉(zhuǎn)發(fā)都沒有直接的相關(guān)性。假設(shè)二并目前還不能成立,已有的三大屬性信息還不能直接代替文本情感分析方法去判斷微博評(píng)論情感傾向,還需要平臺(tái)未來提供更多的顯式信息。因此對(duì)微博和評(píng)論做進(jìn)一步深度分析,用來排除一些個(gè)別因素,如單個(gè)指標(biāo)數(shù)量極多的情況,本研究進(jìn)行了分段式回歸分析,多次試驗(yàn)后發(fā)現(xiàn)以評(píng)論量進(jìn)行分段效果較好,研究在評(píng)論量各分段區(qū)間內(nèi)評(píng)論、轉(zhuǎn)發(fā)和點(diǎn)贊與情感的關(guān)系,分析結(jié)果如表5所示。當(dāng)評(píng)論量在0~90區(qū)間時(shí),僅轉(zhuǎn)發(fā)與情感分別在5%和1%水平上顯著正相關(guān),而評(píng)論和點(diǎn)贊與情感的相關(guān)性不顯著;當(dāng)評(píng)論量在0~60區(qū)間時(shí),評(píng)論和轉(zhuǎn)發(fā)與情感的相關(guān)系數(shù)分別為-0.008和0.011,分別在5%和1%水平上顯著。當(dāng)評(píng)論量在0~30區(qū)間時(shí),評(píng)論和轉(zhuǎn)發(fā)與情感的相關(guān)系數(shù)分別為-0.022和0.007,且都在1%水平上顯著;當(dāng)評(píng)論量在0~10區(qū)間時(shí),評(píng)論和轉(zhuǎn)發(fā)與情感的相關(guān)系數(shù)分別為-0.013和0.004,且都在5%水平上顯著;即假設(shè)三中在轉(zhuǎn)發(fā)量較低時(shí)評(píng)論量與微博評(píng)論情感呈負(fù)相關(guān)關(guān)系。
【參考文獻(xiàn)】:
期刊論文
[1]基于情感分析的災(zāi)害網(wǎng)絡(luò)輿情研究——以雅安地震為例[J]. 劉雯,高峰,洪凌子. 圖書情報(bào)工作. 2013(20)
[2]基于情感分析的評(píng)論挖掘模型研究[J]. 唐曉波,肖璐. 情報(bào)理論與實(shí)踐. 2013(07)
本文編號(hào):3400627
本文鏈接:http://sikaile.net/falvlunwen/fanzuizhian/3400627.html
最近更新
教材專著