天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 軟件論文 >

基于多特征融合的微博情感分析研究

發(fā)布時(shí)間:2021-07-27 01:39
  隨著網(wǎng)絡(luò)時(shí)代的到來和科技的進(jìn)步,以微博為代表的社交網(wǎng)絡(luò)平臺逐漸成為人們分享和獲取信息的主要途徑。用戶發(fā)布在社交網(wǎng)絡(luò)平臺的這些信息大多帶有明顯的情感色彩。通過對這些帶有主觀性情感色彩的信息進(jìn)行情感分析,有助于推動(dòng)輿情分析、個(gè)性化推薦和突發(fā)事件預(yù)防等領(lǐng)域的研究,因此微博情感分析具有重要的應(yīng)用價(jià)值。本文重點(diǎn)圍繞微博中的圖文進(jìn)行情感分析研究,主要研究內(nèi)容有:(1)現(xiàn)有的微博情感分析方法較少注意到用戶情感表達(dá)的差異和微博內(nèi)容中除文字之外的特征,導(dǎo)致微博的情感分析效果難盡人意,為此,提出了融合內(nèi)容特征與用戶特征的文本情感分析方法。構(gòu)建文本情感分類模型TSCCUF,將對情感具有很好指示作用的內(nèi)容特征、用戶特征與微博句子進(jìn)行融合。實(shí)驗(yàn)結(jié)果表明,內(nèi)容特征與用戶特征的融合,增強(qiáng)了模型捕捉情感語義的能力,相較于未進(jìn)行特征融合的BLSTM、MCNN等模型,TSCCUF模型各項(xiàng)性能都有較大的提高。(2)針對使用CNN構(gòu)建的圖片情感分類模型容易出現(xiàn)過擬合或收斂速度慢的問題,提出了基于參數(shù)遷移與微調(diào)的圖片情感分類模型TFCNN;針對單模態(tài)文本或圖片的情感分析方法準(zhǔn)確率不高的問題,設(shè)計(jì)了圖文融合的微博情感分析方法。在... 

【文章來源】:桂林電子科技大學(xué)廣西壯族自治區(qū)

【文章頁數(shù)】:60 頁

【學(xué)位級別】:碩士

【部分圖文】:

基于多特征融合的微博情感分析研究


新浪微博示例

流程圖,文本,流程,文本表示


圖 2-1 文本情感分類流程理數(shù)據(jù)包含著大量的噪聲,這些噪聲數(shù)據(jù)會對文本情感分析要對這些文本數(shù)據(jù)進(jìn)行預(yù)處理操作,包括去噪、分詞、較常用的文本表示方法有:one-hot、TF-IDF、詞向量等ot碼是最基本的文本表示方法,可以將一個(gè)語句轉(zhuǎn)換為一首先對詞庫中的每個(gè)詞語進(jìn)行編號,然后將句子中含有的 1,其他位置均為 0,向量的長度即為詞表的長度。例如中國”,“我愛爸爸媽媽”,“我愛學(xué)習(xí)”。首先獲取語號:1 我;2 愛;3 中國;4 爸爸;5 媽媽; 6 學(xué)習(xí)特征向量為:我愛中國 [1,1,1,0,0,0]

模型結(jié)構(gòu)


公式 2-1 計(jì)算得到的基本都是“的”、“是”等要用到逆文檔頻率(Inverse Document Frequency停用詞的權(quán)值參數(shù)很小甚至為 0,通過公式 2-2,t 為包含該詞的文檔數(shù)。得到 TF 和 IDF 之numnTF t1TIDF logTF IDF TF*IDF生成詞向量的模型 CBOW 和 Skip-gram 模型。如圖 2-2 所示,從左到右分別為輸入層、投影某個(gè)目標(biāo)詞前后 n 個(gè)詞語的詞向量,輸出為該后的各 n 個(gè)詞預(yù)測tw 的概率。

【參考文獻(xiàn)】:
期刊論文
[1]一種融合性格線索的微博情感分類[J]. 賈莉,江濤,馬寧,孟家豪.  云南大學(xué)學(xué)報(bào)(自然科學(xué)版). 2020(05)



本文編號:3304802

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3304802.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶90e5d***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請E-mail郵箱bigeng88@qq.com