基于關鍵詞關聯(lián)語義鏈網(wǎng)絡的Web事件演化研究
本文關鍵詞:基于關鍵詞關聯(lián)語義鏈網(wǎng)絡的Web事件演化研究 出處:《上海大學》2016年博士論文 論文類型:學位論文
更多相關文章: Web事件 關鍵詞關聯(lián)語義鏈網(wǎng)絡 事件演化分析
【摘要】:在現(xiàn)代社會中,各種熱點和突發(fā)事件頻發(fā),尤其是在中國社會的高速信息化以及國內(nèi)外各種復雜因素的影響下,社會中的熱點和突發(fā)事件更是此起彼伏。Web的到來,一方面,加深了熱點和突發(fā)事件對現(xiàn)實社會的影響力。Web打破了傳統(tǒng)信息傳播的時間和地域界限,更多的人可以通過Web近乎實時的了解世界上任何地方發(fā)生的事件,從而一個事件的影響力較之從前會被Web極大的加深。甚至很多事件的元素都發(fā)起自Web并在其中得到廣泛報道,進而影響到現(xiàn)實社會中相應的人或組織。由于其的強大的影響力,因此對Web事件的研究勢在必行。另一方面,Web也為熱點和突發(fā)事件的研究提供了可能。通過Web,更多的人可以更加容易的關注、了解并參與到熱點和突發(fā)事件中來,他們在Web中的“足跡”(即,Web上大量的網(wǎng)頁信息)為Web事件的研究提供了豐富的原始資料,其體量與覆蓋面都是采用調(diào)查與訪問得到的數(shù)據(jù)所不能比擬的。因此,本文欲借助于Web上大量的網(wǎng)頁信息,對Web事件進行研究。為了捕捉和整合散落在各個網(wǎng)頁中的Web事件的語義信息,本文首先構(gòu)建了關鍵詞關聯(lián)語義鏈網(wǎng)絡作為Web事件整體的、統(tǒng)一的語義表示模型,該模型為本文的研究提供了一個重要的理論與計算基礎。進而,本文從“靜態(tài)”和“動態(tài)”兩個方面對Web事件的演化進行研究。一方面,在關鍵詞關聯(lián)語義鏈網(wǎng)絡的基礎上,本文研究了Web事件某一時刻的演化狀態(tài),即子話題的挖掘以及不同網(wǎng)站對這些子話題的偏好挖掘。具體包括:1)基于關鍵詞關聯(lián)語義鏈網(wǎng)絡,提出了文本圖語義表示方法,以提高對網(wǎng)頁的語義捕捉能力。進而,提出了面向文本圖表示的子話題挖掘模型,以挖掘到Web事件的不同子話題,從而把握Web事件當前時刻的演化狀態(tài);2)基于網(wǎng)站-網(wǎng)頁-關鍵詞三層關聯(lián)語義鏈網(wǎng)絡,挖掘網(wǎng)站對Web事件子話題的偏好。為此,本文提出了兩種不同的思路:一種是顯式的利用三層網(wǎng)絡,采用社區(qū)劃分的思想來挖掘網(wǎng)站偏好;另一種是隱式的利用三層網(wǎng)絡,采用概率圖模型的方法來挖掘網(wǎng)站偏好。另一方面,基于關鍵詞關聯(lián)語義鏈網(wǎng)絡,研究了Web事件的演化動力。具體包括:1)基于關鍵詞關聯(lián)語義鏈網(wǎng)絡,通過關鍵詞權(quán)重分布的熵定義并度量了Web事件的不確定性,其中關鍵詞的權(quán)重的計算提出了三種不同的策略:第一種僅考慮關鍵詞的統(tǒng)計特性;第二種考慮關鍵詞的統(tǒng)計特性與局部網(wǎng)絡結(jié)構(gòu)特性;第三種考慮關鍵詞的統(tǒng)計特性與全局網(wǎng)絡結(jié)構(gòu)特性。然后,基于關鍵詞的不確定性的層次性,構(gòu)建Web事件的語義金字塔模型。最后,將構(gòu)建的Web事件的語義金字塔模型應用到不同功能的網(wǎng)頁推薦中。2)基于關鍵詞關聯(lián)語義鏈網(wǎng)絡的不確定性以及完美無標度分布,定義并量化了Web事件的不確定性空間,包括兩個極端狀態(tài):最確定狀態(tài)(事件關鍵詞關聯(lián)語義鏈網(wǎng)絡的完美無標度分布)和最不確定狀態(tài)(事件關鍵詞關聯(lián)語義鏈網(wǎng)絡的熵)。進而,定義并度量了Web事件演化內(nèi)部力,即Web事件當前所處的不確定性空間中的位置。3)基于社會模式理論與人類關聯(lián)記憶理論,對Web事件所在的社會環(huán)境進行建模,從而解釋并量化了社會環(huán)境對Web事件演化的影響。然后,將Web事件與社會環(huán)境的交互模擬為兩個過程:一個激活過程和一個反饋過程。最后,基于對交互過程的模擬,提出了社會環(huán)境影響力的度量方法,即Web事件演化外部力的計算。實驗證實兩種定義的演化動力都與真實的Web事件演化有著較強的相關性。本文的研究不僅可以用于提供新的面向事件的Web服務,以輔助用戶更加容易的了解事件的演化信息;同時也可以輔助國家應急管理部門對Web事件進行及時、準確的研判,以減小Web事件引起的恐慌以及造成的生命財產(chǎn)損失。
[Abstract]:In modern society, a variety of hot and frequent emergencies, especially in the information society and the impact of high-speed China abroad all kinds of complex factors, and the focus of social emergencies is as one falls, another rises the arrival of.Web, on the one hand, deepened the influence of.Web on social hot and unexpected events breaking the time and the traditional boundaries of information dissemination, more and more people can use Web near real-time understanding of any place in the world events, and an event influence than before Web will be greatly deepened. Even many event elements are initiated from Web and widely reported in them, and then influence the people or the organization in the realistic society. Because of its powerful influence, so the research on Web events is imperative. On the other hand, Web is also a research hotspot and unexpected events can provide. Web, more people can more easily understand and participate in the focus of attention, and in the event of an emergency, their footprint in Web "" (i.e., Web on the number of pages of information) provides rich material for the study of Web events, and the amount of coverage is obtained by the investigation and visit the data can not be compared. Therefore, this paper wants to use a lot of information on the Web page, to study the events of Web. In order to capture the semantic information integration and scattered in every page in the Web event, this paper constructs the semantic link network associated keywords as Web events overall, unified semantic representation model. This model provides an important theoretical and computational basis for this research. Then, this article from the "static" and "dynamic" two aspects of Web event evolution are studied. On the one hand, the keywords associated semantic chain network Based on the network, this thesis studies the evolution of Web events at a certain time, the mining sub topic and different site preferences for these sub topic mining. Including: 1) keywords associated semantic link network based on text and image semantic representation method is proposed to improve the semantic web capture ability. Then, the text oriented graph sub topic mining model, to dig into the different sub Web event topic, so as to grasp the evolution of Web events at the moment; 2) - three - page website keywords related semantic link network based on the excavation site of the Web event sub topic preference. Therefore, this paper puts forward two different ideas: one is the three layer network utilization, using community partition of the mining site preference; the other is a three layer network using implicit method, using probabilistic graphical models to other mining site preferences. On the one hand, the semantic link network based on related keywords, study the dynamic evolution of Web events. Including: 1) keywords associated semantic link network based on the entropy weight of keywords distribution and measure Web uncertainties, the calculation of the weight of keywords and put forward three different strategies: first consider only keywords statistical characteristics; second keywords and taken account of the statistical characteristics of local network structure; third keywords and taken account of the statistical characteristics of global network structure. Then the level of uncertainty based on keywords, semantic model construction Pyramid Web event. Finally, the application of semantic model of Pyramid built Web into different events the function of web page recommendation.2) scale-free distribution based on the keywords associated semantic link network uncertainty and perfect, define and quantify the uncertainty of the Web event The qualitative space, including two extremes: the most determined state (perfect event keyword associated semantic link network scale-free distribution) and the uncertainty (event keywords associated semantic link network entropy). Furthermore, the definition and measure the Web event evolution of internal force, the uncertainty of the event space Web the position of.3) Social Theory and human associative memory model based on the theory of modeling of the Web event where the social environment, so as to explain and quantify the effects of social environment on the evolution of Web events. Then, the interaction model of Web events and social environment into two processes: an activation process and a feedback process. Finally, simulation of the interaction process based on the proposed method to measure the influence of social environment, computing Web event evolution of external force. Experiments prove that the two definitions are dynamic evolution and real Web events There is a strong correlation. This study not only can be used to provide event for the new Web service, the evolution of the information easier to assist the user to understand events; at the same time also can assist the national emergency management departments of Web events are timely, accurate judgments, to reduce the Web incident caused panic and the life and property caused by the the loss.
【學位授予單位】:上海大學
【學位級別】:博士
【學位授予年份】:2016
【分類號】:TP391.1;TP393.092
【相似文獻】
相關期刊論文 前10條
1 ;規(guī)范關鍵詞選擇的決定(試行)[J];液晶與顯示;2008年01期
2 ;規(guī)范關鍵詞選擇的決定(試行)[J];液晶與顯示;2009年01期
3 ;規(guī)范關鍵詞選擇的決定(試行)[J];液晶與顯示;2009年02期
4 ;規(guī)范關鍵詞選擇的決定(試行)[J];液晶與顯示;2009年03期
5 ;規(guī)范關鍵詞選擇的決定(試行)[J];液晶與顯示;2010年02期
6 ;規(guī)范關鍵詞選擇的決定(試行)[J];液晶與顯示;2010年03期
7 ;規(guī)范關鍵詞選擇的決定(試行)[J];真空科學與技術(shù)學報;2004年01期
8 ;規(guī)范關鍵詞選擇的決定(試行)[J];液晶與顯示;2008年02期
9 ;規(guī)范關鍵詞選擇的決定(試行)[J];液晶與顯示;2008年03期
10 ;規(guī)范關鍵詞選擇的決定(試行)[J];液晶與顯示;2008年04期
相關會議論文 前5條
1 ;規(guī)范關鍵詞選擇的決定(試行)[A];薄膜技術(shù)學術(shù)研討會論文集[C];2003年
2 ;規(guī)范關鍵詞選擇的決定(試行)[A];中國真空學會2006年學術(shù)年會論文集[C];2006年
3 ;規(guī)范關鍵詞選擇的決定(試行)[A];全國薄膜技術(shù)學術(shù)研討會論文集[C];2006年
4 ;規(guī)范關鍵詞選擇的決定(試行)[A];中國真空學會第六屆全國會員大會暨學術(shù)會議論文集[C];2004年
5 李春久;;醫(yī)學論文關鍵詞和CUJA主題詞使用對比分析[A];外向型文獻庫的數(shù)據(jù)質(zhì)量控制——首屆CUJA系統(tǒng)學術(shù)討論會論文集[C];1990年
相關博士學位論文 前2條
1 宣俊宇;基于關鍵詞關聯(lián)語義鏈網(wǎng)絡的Web事件演化研究[D];上海大學;2016年
2 丁卓冶;面向主題的關鍵詞抽取方法研究[D];復旦大學;2013年
相關碩士學位論文 前10條
1 郭建波;基于詞共現(xiàn)的關鍵詞抽取算法研究[D];合肥工業(yè)大學;2015年
2 劉亞妮;搜索競價廣告關鍵詞優(yōu)化算法與實驗[D];電子科技大學;2011年
3 呂晨;搜索競價廣告關鍵詞優(yōu)化問題研究[D];山東科技大學;2010年
4 熱依萊木·帕爾哈提;文本關鍵詞提取技術(shù)及其應用研究[D];新疆大學;2014年
5 王惠勇;多策略關鍵詞抽取及快速文本主題分類研究[D];東北大學;2012年
6 王良芳;文本挖掘關鍵詞提取算法的研究[D];浙江工業(yè)大學;2013年
7 王文姝;基于模糊理論的關鍵詞識別算法研究[D];哈爾濱工程大學;2010年
8 溫安國;基于詞語網(wǎng)絡的關鍵詞自動提取方法及在中文網(wǎng)頁分類中的應用研究[D];復旦大學;2009年
9 彭浩;基于領域關鍵詞自動擴展的變量主題Hopfield聚焦爬蟲的研究[D];中南大學;2008年
10 譚志強;面向SEO的網(wǎng)絡編輯助手研究與實現(xiàn)[D];西安工程大學;2011年
,本文編號:1415913
本文鏈接:http://sikaile.net/shoufeilunwen/xxkjbs/1415913.html