天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 社科論文 > 新聞傳播論文 >

面向時間序列的微博話題演化模型研究

發(fā)布時間:2021-07-20 13:31
  互聯(lián)網(wǎng)已經(jīng)滲透到國民生活的各個方面,新型媒體也逐漸成為信息發(fā)布與傳播的主要平臺,網(wǎng)絡(luò)輿情已成為整個社會輿情中的重要組成部分。而正因?yàn)榫W(wǎng)絡(luò)具有虛擬性和開放性,使得網(wǎng)絡(luò)輿情的傳播存在反復(fù)波動的特點(diǎn),特別是熱點(diǎn)事件在長期的演化過程中,出現(xiàn)多個高峰,其內(nèi)容焦點(diǎn)很可能隨時間的變化發(fā)生了動態(tài)遷移,出現(xiàn)階段性漸變的特點(diǎn)。及時發(fā)現(xiàn)網(wǎng)絡(luò)熱點(diǎn)話題焦點(diǎn)的遷移,并動態(tài)跟蹤話題的演變趨勢,可以提供更完整的事件動態(tài)演化軌跡,幫助網(wǎng)民更直觀清晰地掌握新聞事件的來龍去脈,對于分析網(wǎng)絡(luò)輿情態(tài)勢具有重要意義,也是網(wǎng)絡(luò)輿情分析的重要內(nèi)容。論文首先分析了話題演化的意義,對目前話題演化模型現(xiàn)狀進(jìn)行了深入的探討與研究;然后根據(jù)本文要研究的微博文本數(shù)據(jù)的特點(diǎn),提出本文的話題演化框架。話題事件在話題發(fā)展的每一階段都有不同的話題焦點(diǎn),所以可以通過時間片來切分話題,通過分析不同時間片話題焦點(diǎn)關(guān)注度和內(nèi)容變化了解話題的演化規(guī)律。論文分析了焦點(diǎn)特征詞與噪聲詞的分布特點(diǎn),構(gòu)造焦點(diǎn)詞提取公式,建立焦點(diǎn)特征詞集合;使用Skip-gram模型在文本集上訓(xùn)練詞向量模型并保存,將每一時間片的微博文本輸入BTM得到候選主題,直接在BTM主題維上結(jié)合焦點(diǎn)特... 

【文章來源】:西安電子科技大學(xué)陜西省 211工程院校 教育部直屬院校

【文章頁數(shù)】:73 頁

【學(xué)位級別】:碩士

【部分圖文】:

面向時間序列的微博話題演化模型研究


文檔的向量空間表示模型

示意圖,主題,拓?fù)浣Y(jié)構(gòu),示意圖


圖 2.2 LDA 隱含主題拓?fù)浣Y(jié)構(gòu)示意圖隨著近年來社交媒體的出現(xiàn),主題模型被用于社交媒體內(nèi)容分析的各種任務(wù)中。然而,由于沒有針對短文本的特定的主題模型,一些研究者直接采用傳統(tǒng)的主題模型進(jìn)行分析,或者在傳統(tǒng)的模型上進(jìn)行改進(jìn)用于短文本建模。還有一些研究者嘗試著將段文文融合成長文本,然后用傳統(tǒng)的模型對其建模。BTM 主題模型[39]主要是針對短文本進(jìn)行建模的主題模型,與傳統(tǒng)主題模型構(gòu)建文檔主題層模型的方法不同,BTM 模型通過將文檔轉(zhuǎn)化為詞組,對文檔預(yù)處理后,會出現(xiàn)任意的兩個詞組,例如“高校電腦中病毒”,可以組成“高校電腦”、“高校中”、“高校病毒”、“電腦中”、“電腦病毒”、“中病毒”等 6 個詞對;通過直接對整個語料庫中詞對的建模學(xué)習(xí)得到文檔的主題分布,在克服短文本稀疏問題的同時考慮了詞與詞之間的語義聯(lián)系。該模型在主題學(xué)習(xí)的過程中不需要借助任何外部資源,這也是目前對短文本建模的一種通用的主題模型。BTM 模型的主要思想是對整個語料庫中抽取的詞對進(jìn)行建模學(xué)習(xí),用于解決單個文檔的稀疏性問題。具體來看,其中每個詞對都是從一個特定的主題中獨(dú)立抽取出

模型圖,模型,潛在主題,對詞


圖 2.3 BTM 模型驟,詞對 (,)ijb ww的聯(lián)合分布為:iZjZZjZZiPbPwzPwz||( ) (|)(|) iZjZi jZZPB||(,)( ) 直接對詞對模式進(jìn)行建模,而不是單個詞語。不難發(fā)語更能揭示主題,從而提高主題的學(xué)習(xí)。而且,詞對掘潛在主題。向量向量表示詞語的一種表示形式。one-hot 編碼是一種

【參考文獻(xiàn)】:
期刊論文
[1]基于詞向量的微博話題發(fā)現(xiàn)方法[J]. 李帥彬,李亞星,馮旭鵬,劉利軍,黃青松.  計算機(jī)應(yīng)用與軟件. 2017(12)
[2]基于微博文本的詞對主題演化模型[J]. 史慶偉,劉雨詩,張豐田.  計算機(jī)應(yīng)用. 2017(05)
[3]基于改進(jìn)的OLDA模型話題檢測及演化分析[J]. 余本功,張衛(wèi)春,王龍飛.  情報雜志. 2017(02)
[4]基于BTM的微博輿情熱點(diǎn)發(fā)現(xiàn)[J]. 王亞民,胡悅.  情報雜志. 2016(11)
[5]基于DTM的國內(nèi)外情報學(xué)研究主題熱度演化對比研究[J]. 齊亞雙,祝娜,翟羽佳.  圖書情報工作. 2016(16)
[6]面向社交媒體文本的話題檢測與追蹤技術(shù)研究綜述[J]. 彭敏,官宸宇,朱佳暉,謝倩倩,黃佳佳,黃濟(jì)民,楊紹雄,高望,應(yīng)稱.  武漢大學(xué)學(xué)報(理學(xué)版). 2016(03)
[7]短文本理解研究[J]. 王仲遠(yuǎn),程健鵬,王海勛,文繼榮.  計算機(jī)研究與發(fā)展. 2016(02)
[8]基于DTM-LPA的突發(fā)事件話題演化方法研究——以H7N9微博為例[J]. 吳小蘭,章成志.  圖書與情報. 2015(03)
[9]基于詞向量的微博事件追蹤方法[J]. 張佳明,席耀一,王波,唐浩浩,李天彩.  計算機(jī)工程與應(yīng)用. 2016(17)
[10]基于Wikipedia的短文本語義相關(guān)度計算方法[J]. 王榮波,諶志群,周建政,李治,高飛.  計算機(jī)應(yīng)用與軟件. 2015(01)

博士論文
[1]面向熱點(diǎn)新聞話題的文本處理技術(shù)研究[D]. 方瑩.北京理工大學(xué) 2015
[2]文本分類中文本表示模型和特征選擇算法研究[D]. 楊杰明.吉林大學(xué) 2013
[3]中文新聞話題動態(tài)演化及其關(guān)鍵技術(shù)研究[D]. 趙旭劍.中國科學(xué)技術(shù)大學(xué) 2012

碩士論文
[1]基于BTM的短文本聚類[D]. 湯秋蓮.安徽大學(xué) 2014



本文編號:3292918

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/xinwenchuanbolunwen/3292918.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶15aec***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com