基于知識圖譜的社交網(wǎng)絡(luò)話題演化及預(yù)測
發(fā)布時間:2021-07-11 05:52
互聯(lián)網(wǎng)已經(jīng)成為人們獲取信息的一個主要渠道,社交網(wǎng)絡(luò)中的話題可以在互聯(lián)網(wǎng)上瞬間傳播,由于這些話題涉及一系列的概念、要素等特征,并且話題之間也具有復(fù)雜的聯(lián)系,需要構(gòu)建高效合理的話題模型,以實現(xiàn)話題的建模、存儲和管理,并為分析與預(yù)警應(yīng)用提供支撐。知識圖譜是具有語義處理能力的知識庫,在知識提取、知識融合以及知識推理領(lǐng)域備受關(guān)注。首先以微軟概念圖譜為研究對象,將其看作復(fù)雜網(wǎng)絡(luò)系統(tǒng),采用相關(guān)理論進行分析。復(fù)雜網(wǎng)絡(luò)理論是對復(fù)雜系統(tǒng)的一種抽象描述和分析工具,可以探明微軟概念圖譜的固有特征,深刻理解其本質(zhì)。復(fù)雜網(wǎng)絡(luò)理論側(cè)重于研究復(fù)雜系統(tǒng)各因子的相互作用或關(guān)系,文中主要用以分析微軟概念圖譜最大連通子網(wǎng)的節(jié)點度分布、網(wǎng)絡(luò)平均最短距離、聚類系數(shù)和度相關(guān)性等復(fù)雜網(wǎng)絡(luò)特性。隨后將概念圖譜引入短文本二分類問題,實現(xiàn)了一種基于概念圖譜的短文本語義擴展表示方法,首先,計算文本特征詞與概念圖譜中各概念的關(guān)聯(lián)度,選取關(guān)聯(lián)度高的概念構(gòu)成當前文本的概念詞典。然后,將概念詞典加入特征詞集合得到短文本的語義擴展表示。對來自Twitter的短文本進行了擴展前與擴展后的分類實驗,結(jié)果顯示,概念化語義擴展表示可以提高短文本的分類效果,以...
【文章來源】:北京物資學(xué)院北京市
【文章頁數(shù)】:81 頁
【學(xué)位級別】:碩士
【部分圖文】:
概念圖譜最大連通子網(wǎng)度分布
第 2 章 概念圖譜分析表 2-7 部分度值與聚類系數(shù)度值 聚類系數(shù) 節(jié)點 度值 364 343 3.22E-5 assume 2 204 130 6.04E-5 mercedes benz cars 2 202 331 7.96E-5 audi cars 2 174 283 8.20E-5 4d sedan 2 159 164 1.34E-4 brown bread product 2 … … … …
圖 2-7 4 個端點的度值分布圖 2-8 4 個階段的度值分布圖 2-7 和圖 2-8 中可看出,如果度值超過 1 000 算作高度值節(jié)點,則所有的高度節(jié)點的聚類系數(shù)均在極小范圍(0,0 16 )內(nèi),若度值超過 100 即算作高度節(jié)點,則高度節(jié)點的聚類系數(shù)大多處在范圍(0,0 3 )內(nèi)。而在端點處,基本 99.2%的節(jié)點其度值在 10 以內(nèi)。由此可知,低度值節(jié)點的聚類系數(shù)大,而高度值節(jié)點的聚類系數(shù)普遍偏小。(4) 度相關(guān)性反應(yīng)了節(jié)點與鄰接節(jié)點之間的關(guān)系,由節(jié)點的所有鄰居節(jié)點的平均度值與節(jié)點自身度值的函數(shù)關(guān)系進行度量:
【參考文獻】:
期刊論文
[1]基于復(fù)雜網(wǎng)絡(luò)視角的高速鐵路網(wǎng)絡(luò)特性分析[J]. 葉堃暉,袁欣. 資源開發(fā)與市場. 2018(01)
[2]結(jié)合可視圖的多狀態(tài)交通流時間序列特性分析[J]. 邢雪,于德新,田秀娟,王世廣. 物理學(xué)報. 2017(23)
[3]城市群城際鐵路站點空間網(wǎng)絡(luò)研究[J]. 鄧良凱,石亞靈,張弘,王亞風(fēng). 城市發(fā)展研究. 2017(08)
[4]我國網(wǎng)絡(luò)輿情研究現(xiàn)狀述評[J]. 劉亞男. 情報雜志. 2017(05)
[5]Spark平臺下的短文本特征擴展與分類研究[J]. 王雯,趙衎衎,李翠平,陳紅,孫輝. 計算機科學(xué)與探索. 2017(05)
[6]面向網(wǎng)絡(luò)大數(shù)據(jù)的知識融合方法綜述[J]. 林海倫,王元卓,賈巖濤,張鵬,王偉平. 計算機學(xué)報. 2017(01)
[7]知識圖譜技術(shù)綜述[J]. 徐增林,盛泳潘,賀麗榮,王雅芳. 電子科技大學(xué)學(xué)報. 2016(04)
[8]近十年國內(nèi)知識圖譜研究脈絡(luò)及主題分析[J]. 李明鑫,王松. 圖書情報知識. 2016(04)
[9]知識圖譜構(gòu)建技術(shù)綜述[J]. 劉嶠,李楊,段宏,劉瑤,秦志光. 計算機研究與發(fā)展. 2016(03)
[10]基于轉(zhuǎn)發(fā)關(guān)系的微博話題演化算法[J]. 徐偉,趙斌,吉根林. 計算機科學(xué). 2016(02)
碩士論文
[1]公安網(wǎng)絡(luò)輿情分析系統(tǒng)的研究[D]. 王磊.北京交通大學(xué) 2008
本文編號:3277472
【文章來源】:北京物資學(xué)院北京市
【文章頁數(shù)】:81 頁
【學(xué)位級別】:碩士
【部分圖文】:
概念圖譜最大連通子網(wǎng)度分布
第 2 章 概念圖譜分析表 2-7 部分度值與聚類系數(shù)度值 聚類系數(shù) 節(jié)點 度值 364 343 3.22E-5 assume 2 204 130 6.04E-5 mercedes benz cars 2 202 331 7.96E-5 audi cars 2 174 283 8.20E-5 4d sedan 2 159 164 1.34E-4 brown bread product 2 … … … …
圖 2-7 4 個端點的度值分布圖 2-8 4 個階段的度值分布圖 2-7 和圖 2-8 中可看出,如果度值超過 1 000 算作高度值節(jié)點,則所有的高度節(jié)點的聚類系數(shù)均在極小范圍(0,0 16 )內(nèi),若度值超過 100 即算作高度節(jié)點,則高度節(jié)點的聚類系數(shù)大多處在范圍(0,0 3 )內(nèi)。而在端點處,基本 99.2%的節(jié)點其度值在 10 以內(nèi)。由此可知,低度值節(jié)點的聚類系數(shù)大,而高度值節(jié)點的聚類系數(shù)普遍偏小。(4) 度相關(guān)性反應(yīng)了節(jié)點與鄰接節(jié)點之間的關(guān)系,由節(jié)點的所有鄰居節(jié)點的平均度值與節(jié)點自身度值的函數(shù)關(guān)系進行度量:
【參考文獻】:
期刊論文
[1]基于復(fù)雜網(wǎng)絡(luò)視角的高速鐵路網(wǎng)絡(luò)特性分析[J]. 葉堃暉,袁欣. 資源開發(fā)與市場. 2018(01)
[2]結(jié)合可視圖的多狀態(tài)交通流時間序列特性分析[J]. 邢雪,于德新,田秀娟,王世廣. 物理學(xué)報. 2017(23)
[3]城市群城際鐵路站點空間網(wǎng)絡(luò)研究[J]. 鄧良凱,石亞靈,張弘,王亞風(fēng). 城市發(fā)展研究. 2017(08)
[4]我國網(wǎng)絡(luò)輿情研究現(xiàn)狀述評[J]. 劉亞男. 情報雜志. 2017(05)
[5]Spark平臺下的短文本特征擴展與分類研究[J]. 王雯,趙衎衎,李翠平,陳紅,孫輝. 計算機科學(xué)與探索. 2017(05)
[6]面向網(wǎng)絡(luò)大數(shù)據(jù)的知識融合方法綜述[J]. 林海倫,王元卓,賈巖濤,張鵬,王偉平. 計算機學(xué)報. 2017(01)
[7]知識圖譜技術(shù)綜述[J]. 徐增林,盛泳潘,賀麗榮,王雅芳. 電子科技大學(xué)學(xué)報. 2016(04)
[8]近十年國內(nèi)知識圖譜研究脈絡(luò)及主題分析[J]. 李明鑫,王松. 圖書情報知識. 2016(04)
[9]知識圖譜構(gòu)建技術(shù)綜述[J]. 劉嶠,李楊,段宏,劉瑤,秦志光. 計算機研究與發(fā)展. 2016(03)
[10]基于轉(zhuǎn)發(fā)關(guān)系的微博話題演化算法[J]. 徐偉,趙斌,吉根林. 計算機科學(xué). 2016(02)
碩士論文
[1]公安網(wǎng)絡(luò)輿情分析系統(tǒng)的研究[D]. 王磊.北京交通大學(xué) 2008
本文編號:3277472
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3277472.html
最近更新
教材專著