天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

面向熱點話題型微博的情感分析研究

發(fā)布時間:2022-01-04 02:07
  在信息技術高速發(fā)展的今天,用戶需要面對大量的數(shù)據(jù),海量數(shù)據(jù)中蘊含用戶所需要的信息。微博作為一種新興的互聯(lián)網(wǎng)應用,正在高速地發(fā)展,由于用戶眾多,在微博上人們大量參與討論的話題往往成為熱點話題,用戶針對話題發(fā)表的微博信息往往帶有主觀意味,本文以此為研究的出發(fā)點,為了獲取在微博下用戶對話題的輿情信息,對熱點話題類微博的情感分析任務進行了研究,具體的研究包括以下幾個方面:首先,分析了熱點話題型微博的特點,討論了有監(jiān)督方法下,微博主客觀分類、情感極性判別問題上分類器的選用以及特征的選擇。通過實驗發(fā)現(xiàn)在SVM分類器下,微博主客觀分類問題通過結(jié)合文本特征與非文本特征,文本特征采用2選擇,并利用微博的表情符,可以獲得最優(yōu)的性能。微博極性判別問題下結(jié)合詞匯級特征、語句級特征和表情符特征可以取得最好的性能。實驗結(jié)果證明了方法的有效性。其次,針對目前熱點話題類微博下情感分析任務面臨標注語料不足的問題。采用了半監(jiān)督的策略,使用直推式支撐向量機(TSVM)的方法,結(jié)合大量未標注數(shù)據(jù),在與有監(jiān)督方法相同的特征組合下,微博主客觀分類和情感極性判別的性能得到進一步提升,證明了方法的有效性。再次,研究了熱點話題下微博評... 

【文章來源】:哈爾濱工業(yè)大學黑龍江省 211工程院校 985工程院校

【文章頁數(shù)】:70 頁

【學位級別】:碩士

【文章目錄】:
摘要
Abstract
第1章 緒論
    1.1 課題背景及研究的目的和意義
    1.2 情感分析國內(nèi)外研究現(xiàn)狀
        1.2.1 情感分析相關定義
        1.2.2 情感分析的國內(nèi)外研究現(xiàn)狀
        1.2.3 相關評測
    1.3 微博情感分析與國內(nèi)外研究現(xiàn)狀
        1.3.1 微博情感分析的任務
        1.3.2 微博情感分析的國內(nèi)外研究現(xiàn)狀
    1.4 本文的主要內(nèi)容及章節(jié)安排
第2章 有監(jiān)督的微博主客觀分析與極性判別
    2.1 引言
    2.2 相關任務的定義
        2.2.1 微博主客觀的定義
        2.2.2 微博極性判別的定義
    2.3 微博語料的相關工作
        2.3.1 微博語料的簡介
        2.3.2 微博語料的標注
        2.3.3 微博語料的特點
    2.4 其他相關資源的介紹與準備
    2.5 分類器的基本原理
        2.5.1 分類器的基本原理
        2.5.2 分類器的選取
    2.6 有監(jiān)督的主客觀識別及特征選取
        2.6.1 文本特征對分類的影響
        2.6.2 文本特征的實驗結(jié)果
        2.6.3 表情符特征對分類的影響
        2.6.4 引入表情符特征的實驗結(jié)果
    2.7 有監(jiān)督的極性判別及特征選取
    2.8 本章小結(jié)
第3章 半監(jiān)督的微博主客觀分析與極性判別
    3.1 引言
    3.2 半監(jiān)督的簡介
        3.2.1 半監(jiān)督的三種假設
        3.2.2 半監(jiān)督的主要方法
    3.3 TSVM 基本原理
        3.3.1 TSVM 相關介紹
        3.3.2 本文使用的 TSVM
    3.4 基于 TSVM 的微博主客觀分類
    3.5 基于 TSVM 的微博極性判別
    3.6 本章小結(jié)
第4章 微博評價對象的抽取與合并
    4.1 引言
    4.2 話題型微博評價對象的抽取工作
        4.2.1 微博評價對象抽取方法概述
        4.2.2 本文采用的微博評價對象抽取方法
        4.2.3 改進的抽取算法
    4.3 基于聚類的評價對象合并
        4.3.1 相似度的度量
        4.3.2 聚類方法的采用
        4.3.3 評價對象的歸并算法
        4.3.4 實驗與分析
    4.4 本章小結(jié)
第5章 熱點話題微博情感分析系統(tǒng)設計與實現(xiàn)
    5.1 引言
    5.2 微博數(shù)據(jù)獲取子系統(tǒng)
    5.3 熱點話題微博情感分析子系統(tǒng)
        5.3.1 微博信息預處理模塊
        5.3.2 特征提取模塊
        5.3.3 微博主客觀分類模塊
        5.3.4 微博極性判別模塊
        5.3.5 微博評價對象抽取模塊
        5.3.6 微博評價對象聚類模塊
    5.4 結(jié)果數(shù)據(jù)存儲子系統(tǒng)
    5.5 結(jié)果可視化子系統(tǒng)
        5.5.1 微博輿情統(tǒng)計模塊
        5.5.2 微博信息查詢模塊
    5.6 系統(tǒng)展示
    5.7 本章小結(jié)
結(jié)論
參考文獻
致謝


【參考文獻】:
期刊論文
[1]樸素貝葉斯在文本分類中的應用[J]. 熊志斌,劉冬.  軟件導刊. 2013(02)
[2]中文微博情感分析中主客觀句分類方法[J]. 楊武,宋靜靜,唐繼強.  重慶理工大學學報(自然科學). 2013(01)
[3]基于層次結(jié)構的多策略中文微博情感分析和特征抽取[J]. 謝麗星,周明,孫茂松.  中文信息學報. 2012(01)
[4]基于淺層句法特征的評價對象抽取研究[J]. 徐冰,趙鐵軍,王山雨,鄭德權.  自動化學報. 2011(10)
[5]評價對象抽取及其傾向性分析[J]. 劉鴻宇,趙妍妍,秦兵,劉挺.  中文信息學報. 2010(01)
[6]半監(jiān)督學習研究進展[J]. 梁吉業(yè),高嘉偉,常瑜.  山西大學學報(自然科學版). 2009(04)
[7]層次聚類算法的改進及分析[J]. 郭曉娟,劉曉霞,李曉玲.  計算機應用與軟件. 2008(06)
[8]聚類算法研究[J]. 孫吉貴,劉杰,趙連宇.  軟件學報. 2008(01)
[9]基于監(jiān)督學習的中文情感分類技術比較研究[J]. 唐慧豐,譚松波,程學旗.  中文信息學報. 2007(06)
[10]情感詞匯本體的構造[J]. 徐琳宏,林鴻飛,潘宇,任惠,陳建美.  情報學報. 2008 (02)



本文編號:3567438

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/guanlilunwen/ydhl/3567438.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶57aba***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com