天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 社科論文 > 新聞傳播論文 >

面向多來源新聞的領(lǐng)域事件分析

發(fā)布時間:2020-08-10 16:01
【摘要】:突發(fā)公共事件對人民生命健康和財產(chǎn)安全、正常生活生產(chǎn)帶來嚴重威脅,突發(fā)公共事件的防范與快速處置已成為國家科技發(fā)展的重點領(lǐng)域。在網(wǎng)絡環(huán)境下,網(wǎng)絡空間與現(xiàn)實世界虛實映照,現(xiàn)實世界中所發(fā)生的事件會通過網(wǎng)絡空間中不同來源不同媒體數(shù)據(jù)從不同側(cè)面來反映與表達。通過分析網(wǎng)絡空間中的媒體數(shù)據(jù)及時感知現(xiàn)實世界中的事件,已成為當前人們有效應對突發(fā)事件的一大技術(shù)手段。本文聚焦在多源新聞媒體數(shù)據(jù)的實時分析上,在深入研究事件的表示模型的基礎(chǔ)上,通過匯聚網(wǎng)絡空間中不同來源的新聞媒體數(shù)據(jù)進行實時分析,進而實現(xiàn)事件的識別,主要工作包括:(1)本文結(jié)合公共安全的領(lǐng)域特點設計了領(lǐng)域事件模型,有效刻畫突發(fā)公共事件的分類主題、時空特性以及主題致災因子與應急主體之間的互動關(guān)系,有效支持后續(xù)的事件識別與多維搜索。(2)本文重點研究多源新聞結(jié)構(gòu)化分析與事件檢測技術(shù)。針對多源新聞的轉(zhuǎn)載問題,采用哈希的方式實現(xiàn)新聞轉(zhuǎn)載判別,減少冗余計算;針對開放域新聞的主題多樣性問題,采用領(lǐng)域模型規(guī)則觸發(fā)并校驗的方式實現(xiàn)分類主題標引,縮減了計算規(guī)模的同時提升準確率;針對事件的要素約束性,結(jié)合領(lǐng)域事件模型對各個要素進行抽取,采用啟發(fā)式規(guī)則進行時空要素提取,并在時空約束下結(jié)合多特征相似性策略以事件為粒度對新聞進行聚合。通過相關(guān)實驗表明了本文所提方法的有效性。(3)本文結(jié)合分布式實時計算的需求設計并搭建了原型系統(tǒng),通過食品安全領(lǐng)域的測試驗證,表明系統(tǒng)結(jié)果運行良好,可基本滿足實際應用需求。
【學位授予單位】:浙江大學
【學位級別】:碩士
【學位授予年份】:2015
【分類號】:G212;TP391.1
【圖文】:

本體模型,簡單事件,新聞事件,新聞


浙江大學碩±學位論文邐第2章國內(nèi)外研巧現(xiàn)狀逡逑系(Instance-of)邋,邋F邋(Function)表示函數(shù),定義了屬性和屬性值的映射關(guān)系,逡逑A(Axiom)代表公理,是被公認的推理規(guī)貝。桑慑澹ǎ桑睿螅簦幔睿悖澹┐韺嵗,是抽象的類逡逑概念的具體個體。逡逑文獻"欵出了簡單事件本體模型(SimpleEventModel,SEM)。作者的用意逡逑是用最少的語義模塊來表達事件,達到最大的通用性。作者將語義模塊分成H個逡逑層次,核屯、概念層,類型系統(tǒng)層和屬性約束層,如圖11所示。事件是核屯概念逡逑之一,它包含所有其他核也概念如參與者、地點和時間。每個核屯、概念都關(guān)聯(lián)著逡逑類型信息。針對某些核屯、概念和類型,屬性約束層做了一定的限制。簡單事件模逡逑型突出了簡潔通用的特點,但對內(nèi)容維度只細化到時空和參與者,表現(xiàn)力略顯不逡逑足。逡逑

海量數(shù)據(jù),平臺


邐第5章面向分布式實時計算的原型系統(tǒng)設計與實現(xiàn)逡逑整個系統(tǒng)是一個從互聯(lián)網(wǎng)采集到最終用戶呈現(xiàn)的流程。系統(tǒng)部署情況如圖5.2逡逑所示。系統(tǒng)分別采用一臺機器進行數(shù)據(jù)采集,原始數(shù)據(jù)存儲和前端網(wǎng)頁服務。采逡逑用5臺機器運行支持MapReduce分布式批量處理的D-Ocean數(shù)據(jù)管理平臺。采用逡逑4臺機器作為Storm部署環(huán)境,其中1臺作為控制節(jié)點部署Nimbus服務,其余3逡逑臺作為工作節(jié)點部署Zookeeper服務和Supervisor服務。逡逑Storm逡逑、1逡逑P邋1邐^作..I逡逑i4fr邋^£r逡逑U^132邐U^55邐,邋UDgMeS出m邐UDMS-133 ̄U5邐!逡逑^邐Mon^oDB邐——*邋??-邋——邋——-邋-邋邋邋邋逡逑氣Red邋is邐、逡逑洗K邐I'邐爭入1邋I邐?邋Q逡逑敬邋web邋I邋巧^邐[〉哉^逡逑MsfeJJ邐I邐W逡逑.UDMS-156-160邐'邐UDMS-151逡逑_邋 ̄50Tea7邋—邐MySQL逡逑圖5.2系統(tǒng)貨施平臺部署逡逑5.2.2海量數(shù)據(jù)氋效存儲與管理逡逑從圖5.1可看出,在構(gòu)建的系統(tǒng)中涉及多種數(shù)據(jù)庫,這些數(shù)據(jù)庫具有不同的逡逑作用。UDMS-155上搭建了邋MongoDB數(shù)據(jù)庫,用于存儲爬蟲爬下來的網(wǎng)頁信息。逡逑不同于字段為粒度關(guān)系型數(shù)據(jù)庫,MongoDB是一種文檔數(shù)據(jù)庫,每條數(shù)據(jù)是逡逑用類化ON格式的完整文檔,如圖5.3所示。同時在同一臺機器上還部署了邋Redis逡逑數(shù)據(jù)庫

本體模型,簡單事件,新聞事件,新聞


浙江大學碩±學位論文邐第2章國內(nèi)外研巧現(xiàn)狀逡逑系(Instance-of)邋,邋F邋(Function)表示函數(shù),定義了屬性和屬性值的映射關(guān)系,逡逑A(Axiom)代表公理,是被公認的推理規(guī)貝。桑慑澹ǎ桑睿螅簦幔睿悖澹┐韺嵗,是抽象的類逡逑概念的具體個體。逡逑文獻"欵出了簡單事件本體模型(SimpleEventModel,SEM)。作者的用意逡逑是用最少的語義模塊來表達事件,達到最大的通用性。作者將語義模塊分成H個逡逑層次,核屯、概念層,類型系統(tǒng)層和屬性約束層,如圖11所示。事件是核屯概念逡逑之一,它包含所有其他核也概念如參與者、地點和時間。每個核屯、概念都關(guān)聯(lián)著逡逑類型信息。針對某些核屯、概念和類型,屬性約束層做了一定的限制。簡單事件模逡逑型突出了簡潔通用的特點,但對內(nèi)容維度只細化到時空和參與者,表現(xiàn)力略顯不逡逑足。逡逑

【參考文獻】

相關(guān)期刊論文 前3條

1 蔡偃武;高大啟;阮彤;蔣銳權(quán);;面向大規(guī)模數(shù)據(jù)的在線新事件檢測[J];計算機工程;2014年10期

2 夏彥;何琳;潘運來;歐陽辰晨;;基于規(guī)則與統(tǒng)計相結(jié)合的互聯(lián)網(wǎng)突發(fā)事件識別研究[J];現(xiàn)代圖書情報技術(shù);2010年10期

3 陳偉;張成;王燦;卜佳俊;陳純;陳宏;;新聞數(shù)據(jù)流的在線事件檢測[J];浙江大學學報(工學版);2011年06期

相關(guān)博士學位論文 前1條

1 高田;基于領(lǐng)域知識的旅游突發(fā)事件狀態(tài)評估與演化研究[D];北京郵電大學;2011年



本文編號:2788311

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/xinwenchuanbolunwen/2788311.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶e9222***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com