天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

微博中的熱點(diǎn)話(huà)題分析

發(fā)布時(shí)間:2021-03-30 12:07
  互聯(lián)網(wǎng)與通信技術(shù)的快速發(fā)展為我們帶來(lái)了許多新型的信息獲取方式,微博便是其中之一。微博因其操作簡(jiǎn)捷、內(nèi)容短小隨意、實(shí)時(shí)性強(qiáng)而吸引了越來(lái)越多的用戶(hù)。海量信息為人們帶來(lái)巨大信息量的同時(shí),也帶來(lái)了信息爆炸的負(fù)面影響。如何迅速有效掌握信息,了解輿論導(dǎo)向,成為了近年來(lái)的熱點(diǎn)研究方向之一。由于微博自身的特殊性,如內(nèi)容簡(jiǎn)短包含信息量少,語(yǔ)言隨意,干擾內(nèi)容多等,傳統(tǒng)的話(huà)題分析方法并不能很好的應(yīng)用于微博。因此,本文的工作主要集中在針對(duì)微博熱點(diǎn)話(huà)題抽取的研究,具體又分為兩個(gè)方面:如何有效提取熱點(diǎn)話(huà)題關(guān)鍵詞;二.話(huà)題關(guān)鍵詞的聚類(lèi)方法研究。文中引入了WAF模型對(duì)文本進(jìn)行建模,提出了基于該模型的話(huà)題關(guān)鍵詞挑選方法及聚類(lèi)方法。后續(xù)的對(duì)比實(shí)驗(yàn)證明了方法的有效性。此外,本文的工作還包括兩個(gè)自然語(yǔ)言處理領(lǐng)域的評(píng)測(cè)COAE和TAC,介紹了評(píng)測(cè)任務(wù)、采用的方法及評(píng)測(cè)結(jié)果。 

【文章來(lái)源】:北京郵電大學(xué)北京市 211工程院校 教育部直屬院校

【文章頁(yè)數(shù)】:58 頁(yè)

【學(xué)位級(jí)別】:碩士

【文章目錄】:
摘要
ABSTRACT
第一章 引言
    1.1 課題研究背景
    1.2 研究?jī)?nèi)容及安排
第二章 自然語(yǔ)言處理基礎(chǔ)及短文本處理技術(shù)研究
    2.1 自然語(yǔ)言處理的基本概念
    2.2 自然語(yǔ)言處理的幾個(gè)典型研究?jī)?nèi)容
        2.2.1 自動(dòng)翻譯
        2.2.2 自動(dòng)問(wèn)答
        2.2.3 自動(dòng)摘要
        2.2.4 詞義消歧
    2.3 自然語(yǔ)言處理中文本的基本處理
        2.3.1 分詞
        2.3.2 文本模型
        2.3.3 特征挑選
        2.3.4 文本相似度計(jì)算
    2.4 文本聚類(lèi)基礎(chǔ)方法
        2.4.1 扁平聚類(lèi)
        2.4.2 層次聚類(lèi)
        2.4.3 扁平聚類(lèi)與層次聚類(lèi)的比較
    2.5 短文本處理技術(shù)研究
        2.5.1 利用其他信息來(lái)源來(lái)擴(kuò)充短文本
        2.5.2 利用針對(duì)短文本的相似度計(jì)算方法
        2.5.3 利用針對(duì)短文本的分類(lèi)方法
        2.5.4 利用針對(duì)短文本的聚類(lèi)方法
    2.6 本章小結(jié)
第三章 基于WAF模型的話(huà)題關(guān)鍵詞挑選
    3.1 WAF模型簡(jiǎn)介
        3.1.1 詞語(yǔ)間的激活力定義
        3.1.2 詞語(yǔ)間的親和度定義
    3.2 運(yùn)用WAF模型進(jìn)行話(huà)題關(guān)鍵詞挑選
        3.2.1 利用話(huà)題關(guān)鍵詞與非話(huà)題關(guān)鍵詞在WAF中的差異挑選
        3.2.2 利用WAF圖的特性挑選話(huà)題關(guān)鍵詞
    3.3 幾種挑選話(huà)題關(guān)鍵詞方法的實(shí)驗(yàn)結(jié)果對(duì)比
        3.3.1 微博語(yǔ)料的預(yù)處理
        3.3.2 實(shí)驗(yàn)結(jié)果對(duì)比
    3.4 本章小結(jié)
第四章 話(huà)題關(guān)鍵詞的聚類(lèi)方法研究
    4.1 基于話(huà)題關(guān)鍵詞共現(xiàn)的熱點(diǎn)話(huà)題聚類(lèi)
    4.2 基于WAF有向圖的熱點(diǎn)話(huà)題聚類(lèi)
        4.2.1 常見(jiàn)的基于圖的聚類(lèi)
        4.2.2 利用有向圖路徑的熱點(diǎn)話(huà)題聚類(lèi)
    4.3 幾種熱點(diǎn)話(huà)題聚類(lèi)方法的實(shí)驗(yàn)結(jié)果對(duì)比
    4.4 本章小結(jié)
第五章 COAE情感傾向性評(píng)測(cè)及TAC SLOT FILLING評(píng)測(cè)
    5.1 COAE中文情感傾向性評(píng)測(cè)
        5.1.1 任務(wù)設(shè)置
        5.1.2 任務(wù)四的評(píng)測(cè)方式和評(píng)測(cè)指標(biāo)
        5.1.3 任務(wù)四采用的方法
    5.2 TAC評(píng)測(cè)SLOT FILLING任務(wù)
        5.2.1 任務(wù)介紹
        5.2.2 方法介紹
        5.2.3 Slot Filling在面向校園對(duì)象搜索引擎(COSE)中的應(yīng)用
    5.3 本章小結(jié)
第六章 總結(jié)與展望
    6.1 論文工作總結(jié)
    6.2 下一步工作展望
參考文獻(xiàn)
致謝
攻讀學(xué)位期間發(fā)表的學(xué)術(shù)論文


【參考文獻(xiàn)】:
期刊論文
[1]聚類(lèi)K-means算法的應(yīng)用研究[J]. 石云平.  國(guó)外電子測(cè)量技術(shù). 2009(08)
[2]概率潛在語(yǔ)義模型綜述[J]. 陳曉明.  現(xiàn)代商貿(mào)工業(yè). 2007(07)
[3]統(tǒng)計(jì)詞義消歧的研究進(jìn)展[J]. 盧志茂,劉挺,李生.  電子學(xué)報(bào). 2006(02)
[4]特征選擇方法綜述[J]. 王娟,慈林林,姚康澤.  計(jì)算機(jī)工程與科學(xué). 2005(12)
[5]中文信息檢索引擎中的分詞與檢索技術(shù)[J]. 吳棟,滕育平.  計(jì)算機(jī)應(yīng)用. 2004(07)
[6]自動(dòng)摘要方法綜述[J]. 譚種,陳躍新.  情報(bào)學(xué)報(bào). 2008 (01)



本文編號(hào):3109479

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/guanlilunwen/ydhl/3109479.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶(hù)eef91***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com