天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 碩博論文 > 信息類碩士論文 >

在線新聞文本的讀者情緒預(yù)測方法研究

發(fā)布時間:2017-08-12 07:10

  本文關(guān)鍵詞:在線新聞文本的讀者情緒預(yù)測方法研究


  更多相關(guān)文章: 情感分析 讀者情緒預(yù)測 在線新聞 多標(biāo)簽分類 LDA主題模型


【摘要】:隨著互聯(lián)網(wǎng)的快速發(fā)展與Web 2.0時代的到來,在線新聞作為主要的網(wǎng)絡(luò)信息載體,已經(jīng)成為人們獲取新聞資訊的主要渠道。其內(nèi)容與形式也不斷創(chuàng)新,允許用戶通過情緒投票直接抒發(fā)自己對新聞事件的情緒。了解用戶對新聞事件的態(tài)度和情緒變化,可以輔助在線新聞服務(wù)商理解用戶偏好,同時有助于實現(xiàn)網(wǎng)絡(luò)輿情分析和監(jiān)控。因此,如何準(zhǔn)確地對用戶的情緒進行預(yù)測,具有重要的理論意義和應(yīng)用價值。本文分析并總結(jié)了讀者情緒預(yù)測在國內(nèi)外的研究現(xiàn)狀,結(jié)合目前機器學(xué)習(xí)領(lǐng)域高度關(guān)注的LDA主題模型及多標(biāo)簽分類技術(shù),對新聞文本引發(fā)的讀者情緒自動判別和預(yù)測進行了深入研究,主要工作包括:第一,首次提出將讀者情緒預(yù)測作為多標(biāo)簽分類問題。由于現(xiàn)有讀者情緒預(yù)測方法大多將讀者情緒預(yù)測作為單標(biāo)簽分類任務(wù),這與人類直覺及對讀者情緒進行大規(guī)模統(tǒng)計結(jié)果不符。本文在對讀者情緒投票數(shù)據(jù)進行詳細統(tǒng)計分析的基礎(chǔ)上,驗證了使用多標(biāo)簽分類方法解決讀者情緒預(yù)測問題的正確性。第二,提出一種讀者情緒自動標(biāo)注方法。本文設(shè)計了一種讀者情緒多標(biāo)簽標(biāo)注算法,該算法創(chuàng)新性地利用讀者情緒投票數(shù)據(jù),采用基于閾值的方法,實現(xiàn)了讀者情緒的自動標(biāo)注。避免了傳統(tǒng)手工標(biāo)注方法工作量大、標(biāo)注結(jié)果不準(zhǔn)確等問題。第三,提出一種多標(biāo)簽監(jiān)督的情緒-主題模型。在深入分析LDA主題模型的基礎(chǔ)上,增加一層隱含的讀者情緒,并利用讀者情緒反饋信息對模型進行監(jiān)督。與傳統(tǒng)模型相比,該模型能夠更加有效地利用文本語義信息,取得了更加準(zhǔn)確的情緒預(yù)測結(jié)果。本文在真實的新浪社會新聞數(shù)據(jù)集上進行了大量的對比實驗,結(jié)合多標(biāo)簽分類常用評測指標(biāo),對實驗結(jié)果進行評測。實驗結(jié)果表明較已有的讀者情緒預(yù)測方法,本文提出的多標(biāo)簽監(jiān)督的情緒-主題模型能夠更準(zhǔn)確地預(yù)測讀者情緒。
【關(guān)鍵詞】:情感分析 讀者情緒預(yù)測 在線新聞 多標(biāo)簽分類 LDA主題模型
【學(xué)位授予單位】:南開大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2015
【分類號】:TP391.1
【目錄】:
  • 摘要5-6
  • Abstract6-10
  • 第一章 緒論10-17
  • 第一節(jié) 研究目的與意義10-11
  • 第二節(jié) 研究現(xiàn)狀和主要研究工作11-15
  • 1.2.1 情緒分析研究現(xiàn)狀11-14
  • 1.2.2 主要研究工作14-15
  • 第三節(jié) 論文組織結(jié)構(gòu)15-17
  • 第二章 相關(guān)技術(shù)研究17-25
  • 第一節(jié) 多標(biāo)簽分類技術(shù)17-21
  • 2.1.1 問題轉(zhuǎn)化法17-20
  • 2.1.2 算法適應(yīng)法20-21
  • 第二節(jié) 主題模型技術(shù)21-23
  • 2.2.1 LDA主題模型21-22
  • 2.2.2 Labeled LDA主題模型22-23
  • 第三節(jié) 本章小結(jié)23-25
  • 第三章 在線新聞讀者情緒預(yù)測設(shè)計方案25-38
  • 第一節(jié) 總體實現(xiàn)路線25-26
  • 第二節(jié) 數(shù)據(jù)采集26-29
  • 3.2.1 網(wǎng)絡(luò)爬蟲26-27
  • 3.2.2 新浪新聞網(wǎng)站結(jié)構(gòu)分析27-28
  • 3.2.3 新浪新聞爬蟲設(shè)計28-29
  • 第三節(jié) 多標(biāo)簽讀者情緒語料庫構(gòu)建29-33
  • 3.3.1 數(shù)據(jù)預(yù)處理30-31
  • 3.3.2 讀者情緒數(shù)據(jù)統(tǒng)計分析31-32
  • 3.3.3 讀者情緒多標(biāo)簽處理方法32-33
  • 第四節(jié) 文本表示模型設(shè)計33-35
  • 第五節(jié) 多標(biāo)簽監(jiān)督的情緒-主題模型設(shè)計35-37
  • 第六節(jié) 本章小結(jié)37-38
  • 第四章 多標(biāo)簽監(jiān)督的情緒-主題模型實現(xiàn)38-53
  • 第一節(jié) 問題描述38-39
  • 第二節(jié) 多標(biāo)簽監(jiān)督的情緒-主題模型39-45
  • 4.2.1 讀者情緒預(yù)測模型分析39-43
  • 4.2.2 多標(biāo)簽監(jiān)督的情緒-主題模型構(gòu)建43-45
  • 第三節(jié) 參數(shù)估計45-52
  • 4.3.1 EM算法45-47
  • 4.3.2 Gibbs采樣47-48
  • 4.3.3 ML-sETM模型參數(shù)估計48-51
  • 4.3.4 ML-sETM模型預(yù)測51-52
  • 第四節(jié) 本章小結(jié)52-53
  • 第五章 實驗結(jié)果及分析53-62
  • 第一節(jié) 實驗環(huán)境53
  • 第二節(jié) 實驗數(shù)據(jù)53-55
  • 第三節(jié) 評測方法55-56
  • 第四節(jié) 實驗設(shè)計及結(jié)果分析56-61
  • 5.4.1 ML-sETM模型性能比較56-58
  • 5.4.2 ML-sETM模型參數(shù)的影響58-61
  • 第五節(jié) 本章小結(jié)61-62
  • 第六章 總結(jié)與展望62-64
  • 第一節(jié) 總結(jié)62-63
  • 第二節(jié) 展望63-64
  • 參考文獻64-68
  • 致謝68-69
  • 個人簡歷及在學(xué)期間研究成果69

【相似文獻】

中國期刊全文數(shù)據(jù)庫 前10條

1 林茜卡;傅秀芬;滕少華;李云;;協(xié)同標(biāo)簽系統(tǒng)的應(yīng)用研究[J];暨南大學(xué)學(xué)報(自然科學(xué)與醫(yī)學(xué)版);2009年01期

2 吳超;周波;;基于復(fù)雜網(wǎng)絡(luò)的社會化標(biāo)簽分析[J];浙江大學(xué)學(xué)報(工學(xué)版);2010年11期

3 吳金成;曹嬌;趙文棟;張磊;;標(biāo)簽集中式發(fā)布訂閱機制性能分析[J];指揮控制與仿真;2010年06期

4 李曉燕;陳剛;壽黎但;董金祥;;一種面向協(xié)作標(biāo)簽系統(tǒng)的圖片檢索聚類方法[J];中國圖象圖形學(xué)報;2010年11期

5 袁柳;張龍波;;基于概率主題模型的標(biāo)簽預(yù)測[J];計算機科學(xué);2011年07期

6 張斌;張引;高克寧;郭朋偉;孫達明;;融合關(guān)系與內(nèi)容分析的社會標(biāo)簽推薦[J];軟件學(xué)報;2012年03期

7 王永剛;嚴寒冰;許俊峰;胡建斌;陳鐘;;垃圾標(biāo)簽的抵御方法研究[J];計算機研究與發(fā)展;2013年10期

8 汪祥;賈焰;周斌;陳儒華;韓毅;;基于交互關(guān)系的微博用戶標(biāo)簽預(yù)測[J];計算機工程與科學(xué);2013年10期

9 顧亦然;陳敏;;一種三部圖網(wǎng)絡(luò)中標(biāo)簽時間加權(quán)的推薦方法[J];計算機科學(xué);2012年08期

10 趙亞楠;董晶;董佳梁;;基于社會化標(biāo)注的博客標(biāo)簽推薦方法[J];計算機工程與設(shè)計;2012年12期

中國重要會議論文全文數(shù)據(jù)庫 前6條

1 朱廣飛;董超;王衡;汪國平;;照片標(biāo)簽的智能化管理[A];第四屆和諧人機環(huán)境聯(lián)合學(xué)術(shù)會議論文集[C];2008年

2 房冠南;袁彩霞;王小捷;李江;宋占江;;面向?qū)υ捳Z料的標(biāo)簽推薦[A];中國計算語言學(xué)研究前沿進展(2009-2011)[C];2011年

3 梅放;林鴻飛;;基于社會化標(biāo)簽的移動音樂檢索[A];第五屆全國信息檢索學(xué)術(shù)會議論文集[C];2009年

4 李靜;林鴻飛;;基于用戶情感標(biāo)簽的音樂檢索算法[A];第六屆全國信息檢索學(xué)術(shù)會議論文集[C];2010年

5 駱雄武;萬小軍;楊建武;吳於茜;;基于后綴樹的Web檢索結(jié)果聚類標(biāo)簽生成方法[A];第四屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議論文集(上)[C];2008年

6 王波;唐常杰;段磊;尹佳;左R,

本文編號:660332


資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/660332.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶59b11***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com