天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

面向社交網(wǎng)絡(luò)的文本傾向性比對(duì)方法的研究與實(shí)現(xiàn)

發(fā)布時(shí)間:2020-04-10 00:16
【摘要】:隨著移動(dòng)網(wǎng)絡(luò)的普及,以微博為代表的社交網(wǎng)絡(luò)逐漸成為人們獲取信息、表達(dá)觀點(diǎn)的重要渠道。社交網(wǎng)絡(luò)中的文本篇幅短,數(shù)據(jù)量大,有著重要的數(shù)據(jù)挖掘價(jià)值,是輿情分析的重要數(shù)據(jù)源。文本傾向性比對(duì),即通過比對(duì)已知傾向性的文本,確定待分析文本的傾向性,是文本傾向性分析的一種手段。文本傾向性分析是自然語言處理和輿情分析等領(lǐng)域的研究熱點(diǎn),以往的研究大多忽視了文本上下文語境包含的潛在情感因素,或者使用神經(jīng)網(wǎng)絡(luò)、深度學(xué)習(xí)等機(jī)制,原理復(fù)雜,不適于處理微博等短文本數(shù)據(jù)。針對(duì)這些問題,本文提出了一種文本傾向性比對(duì)方法,并通過實(shí)驗(yàn)驗(yàn)證了其有效性,最后結(jié)合Hadoop分布式計(jì)算平臺(tái)進(jìn)行了系統(tǒng)的設(shè)計(jì)和實(shí)現(xiàn)。本文的主要工作有:1.針對(duì)微博等社交網(wǎng)絡(luò)篇幅短、數(shù)據(jù)量大的特點(diǎn),提出了一種文本傾向性比對(duì)方法,將待分析文本與代表正向、負(fù)向及中性的標(biāo)準(zhǔn)文本進(jìn)行語義相似度比對(duì),將其分為更相似的一類。此外,還提出了標(biāo)準(zhǔn)文本的選用原則。2.在語義相似度計(jì)算方面,提出了融合語義相似度概念及其計(jì)算方法。計(jì)算相關(guān)子空間中的文本相似度以及情感子空間中的文本情感相似度,并將二者結(jié)合起來,既利用了情感詞和觀點(diǎn)詞中的顯性情感因素,又利用了文本上下文語境中隱含的情感因素,使該語義相似度更適于傾向性分析。3.結(jié)合Hadoop分布式計(jì)算平臺(tái),對(duì)使用融合語義相似度的文本傾向性比對(duì)方法做了系統(tǒng)實(shí)現(xiàn)。由數(shù)據(jù)采集層通過微博API獲取數(shù)據(jù),并將其存儲(chǔ)在本地?cái)?shù)據(jù)庫(kù)。對(duì)文本進(jìn)行并行的預(yù)處理后,結(jié)合本文提出的傾向性比對(duì)方法,并行地分析出文本傾向,提高了數(shù)據(jù)處理的效率。結(jié)果展示層調(diào)取傾向性分析結(jié)果,并對(duì)其進(jìn)行展示。
【圖文】:

面向社交網(wǎng)絡(luò)的文本傾向性比對(duì)方法的研究與實(shí)現(xiàn)


圖2.邋1文本傾向性分析處理流程逡逑Figure邋2.1邋Processing邋of邋the邋text邋orientation邋analysis逡逑

面向社交網(wǎng)絡(luò)的文本傾向性比對(duì)方法的研究與實(shí)現(xiàn)


文本的生成模型
【學(xué)位授予單位】:北京交通大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2019
【分類號(hào)】:TP391.1;TP393.092

【參考文獻(xiàn)】

相關(guān)期刊論文 前6條

1 梁喜濤;顧磊;;中文分詞與詞性標(biāo)注研究[J];計(jì)算機(jī)技術(shù)與發(fā)展;2015年02期

2 李欣;王素格;李德玉;;面向文本情感聚類的維度判別方法[J];計(jì)算機(jī)工程與應(yīng)用;2015年07期

3 厲小軍;戴霖;施寒瀟;黃琦;;文本傾向性分析綜述[J];浙江大學(xué)學(xué)報(bào)(工學(xué)版);2011年07期

4 宋鴻彥;劉軍;姚天f ;劉全升;黃高輝;;漢語意見型主觀性文本標(biāo)注語料庫(kù)的構(gòu)建[J];中文信息學(xué)報(bào);2009年02期

5 徐琳宏;林鴻飛;趙晶;;情感語料庫(kù)的構(gòu)建和分析[J];中文信息學(xué)報(bào);2008年01期

6 徐琳宏;林鴻飛;潘宇;任惠;陳建美;;情感詞匯本體的構(gòu)造[J];情報(bào)學(xué)報(bào);2008年02期

相關(guān)碩士學(xué)位論文 前4條

1 劉超然;在線新聞網(wǎng)民評(píng)論情感傾向性分析及可視化研究[D];哈爾濱工業(yè)大學(xué);2018年

2 馮月華;基于Hadoop的分布式中文微博情感分析研究與實(shí)現(xiàn)[D];蘭州大學(xué);2017年

3 張?jiān)春?基于Hadoop平臺(tái)的高可用性云存儲(chǔ)系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];哈爾濱工業(yè)大學(xué);2014年

4 陳飛宏;基于向量空間模型的中文文本相似度算法研究[D];電子科技大學(xué);2011年

,

本文編號(hào):2621469

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/guanlilunwen/ydhl/2621469.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶0df01***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com