天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于主題模型的事件演化分析系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)

發(fā)布時(shí)間:2021-06-08 07:36
  隨著互聯(lián)網(wǎng)及多媒體技術(shù)的不斷發(fā)展,新聞媒體成為人們了解事件發(fā)展的重要工具,新聞作為事件的載體,具有真實(shí)性、時(shí)效性、開(kāi)放性、變動(dòng)性等特征,如何從媒體發(fā)布的新聞中挖掘出事件發(fā)展各階段信息,準(zhǔn)確分析事件演化脈絡(luò)及演化熱度指數(shù),有利于人們?nèi)媪私庑侣勈录?且有助于政府及新聞媒體引導(dǎo)和控制新聞事件的發(fā)展方向。目前,對(duì)于事件演化分析的研究主要存在以下問(wèn)題:(1)新聞事件表達(dá)不全面;(2)不能有效分析事件演化方向;(3)缺少完整的事件演化分析可視化系統(tǒng)。本文以新華網(wǎng)新聞為研究數(shù)據(jù),以新聞事件的演化脈絡(luò)和演化熱度指數(shù)為研究?jī)?nèi)容,在總結(jié)和分析國(guó)內(nèi)外現(xiàn)狀、梳理相關(guān)原理技術(shù)的基礎(chǔ)上,首先改進(jìn)文本表達(dá)方式,利用特征向量、語(yǔ)義向量、主題向量多角度表達(dá)新聞文本,其次基于改進(jìn)的Single-Pass聚類算法實(shí)現(xiàn)新事件檢測(cè)、事件話題類別標(biāo)注,并通過(guò)隱式狄利克雷分布主題模型分析事件演化過(guò)程,同時(shí),根據(jù)研究?jī)?nèi)容搭建事件演化分析系統(tǒng)。具體研究?jī)?nèi)容如下:(1)提出了多向量融合的文本量化表達(dá)方式。基于TF-IDF特征選取算法生成特征向量,利用主題模型生成的文檔-主題矩陣作為主題向量,針對(duì)詞嵌入模型生成的詞向量稀疏性問(wèn)題,引入S... 

【文章來(lái)源】:電子科技大學(xué)四川省 211工程院校 985工程院校 教育部直屬院校

【文章頁(yè)數(shù)】:86 頁(yè)

【學(xué)位級(jí)別】:碩士

【部分圖文】:

基于主題模型的事件演化分析系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)


事件演化分析流程圖

主題,詞語(yǔ),隨機(jī)選擇,兒童


電子科技大學(xué)碩士學(xué)位論文8個(gè)主題包含多個(gè)單詞。文檔的構(gòu)成過(guò)程,首先挑選一個(gè)主題,再?gòu)闹黝}中挑選一個(gè)詞,如此重復(fù)多次,便構(gòu)成了完整的文檔?梢岳斫鉃,文檔的主題決定了文檔和語(yǔ)料庫(kù)的含義,主題模型的任務(wù)就是從文檔中揭示出這些主題。LDA主題模型的提出者Blei等人[28]給出一個(gè)簡(jiǎn)單的例子,事先給定幾個(gè)主題,通過(guò)學(xué)習(xí)訓(xùn)練,獲取每個(gè)主題對(duì)應(yīng)的詞語(yǔ)。如下圖2-1所示:圖2-1主題對(duì)應(yīng)的詞語(yǔ)以隨機(jī)概率挑尋藝術(shù)、預(yù)算、兒童、教育”中某一主題,然后隨機(jī)選擇該主題下對(duì)應(yīng)的詞語(yǔ),反復(fù)執(zhí)行兩次選取過(guò)程,最終生成如下圖2-2所示的文章(取文章部分展示,不同主題單詞對(duì)應(yīng)不同顏色):圖2-2主題詞生成的文章

主題詞,主題


電子科技大學(xué)碩士學(xué)位論文8個(gè)主題包含多個(gè)單詞。文檔的構(gòu)成過(guò)程,首先挑選一個(gè)主題,再?gòu)闹黝}中挑選一個(gè)詞,如此重復(fù)多次,便構(gòu)成了完整的文檔。可以理解為,文檔的主題決定了文檔和語(yǔ)料庫(kù)的含義,主題模型的任務(wù)就是從文檔中揭示出這些主題。LDA主題模型的提出者Blei等人[28]給出一個(gè)簡(jiǎn)單的例子,事先給定幾個(gè)主題,通過(guò)學(xué)習(xí)訓(xùn)練,獲取每個(gè)主題對(duì)應(yīng)的詞語(yǔ)。如下圖2-1所示:圖2-1主題對(duì)應(yīng)的詞語(yǔ)以隨機(jī)概率挑尋藝術(shù)、預(yù)算、兒童、教育”中某一主題,然后隨機(jī)選擇該主題下對(duì)應(yīng)的詞語(yǔ),反復(fù)執(zhí)行兩次選取過(guò)程,最終生成如下圖2-2所示的文章(取文章部分展示,不同主題單詞對(duì)應(yīng)不同顏色):圖2-2主題詞生成的文章

【參考文獻(xiàn)】:
期刊論文
[1]一種基于社交事件關(guān)聯(lián)的故事脈絡(luò)生成方法[J]. 李瑩瑩,馬帥,蔣浩誼,劉喆,胡春明,李雄.  計(jì)算機(jī)研究與發(fā)展. 2018(09)
[2]面向動(dòng)態(tài)主題數(shù)的話題演化分析[J]. 方瑩,黃河燕,辛欣,魏驍馳,莊琨.  中文信息學(xué)報(bào). 2014(03)
[3]一種新聞事件演化建模方法[J]. 張輝,李國(guó)輝,孫博良,賈立.  國(guó)防科技大學(xué)學(xué)報(bào). 2013(04)
[4]基于增量型聚類的自動(dòng)話題檢測(cè)研究[J]. 張小明,李舟軍,巢文涵.  軟件學(xué)報(bào). 2012(06)
[5]基于多向量和實(shí)體模糊匹配的話題關(guān)聯(lián)識(shí)別[J]. 張曉艷,王挺,陳火旺.  中文信息學(xué)報(bào). 2008(01)
[6]話題檢測(cè)與跟蹤的評(píng)測(cè)及研究綜述[J]. 洪宇,張宇,劉挺,李生.  中文信息學(xué)報(bào). 2007(06)



本文編號(hào):3217970

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3217970.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶f3147***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com