基于GN算法的社會(huì)網(wǎng)絡(luò)輿情分析技術(shù)研究
發(fā)布時(shí)間:2021-01-29 01:28
目前各界對(duì)于社會(huì)網(wǎng)絡(luò)輿情的分析備受關(guān)注,對(duì)于網(wǎng)絡(luò)輿情分析技術(shù)也是多元化的,其中常用的社會(huì)網(wǎng)絡(luò)發(fā)現(xiàn)聚類方法有GN算法(Girvan-Newman Algorithm)。GN算法的優(yōu)點(diǎn)是發(fā)現(xiàn)社區(qū)的準(zhǔn)確度高,算法結(jié)構(gòu)簡(jiǎn)單,魯棒性強(qiáng)。但是GN算法仍然存在問(wèn)題,該算法在發(fā)現(xiàn)社區(qū)結(jié)構(gòu)時(shí)的時(shí)間復(fù)雜度高,計(jì)算效率慢。針對(duì)該問(wèn)題本文提出對(duì)現(xiàn)有的GN算法進(jìn)行并行化改進(jìn),以此來(lái)提高對(duì)社會(huì)網(wǎng)絡(luò)輿情分析時(shí)發(fā)現(xiàn)社團(tuán)的速度,使得在實(shí)際應(yīng)用中能夠快速準(zhǔn)確的發(fā)現(xiàn)社團(tuán),確定社團(tuán)結(jié)構(gòu)。本文首先對(duì)傳統(tǒng)GN算法的計(jì)算過(guò)程進(jìn)行分析,發(fā)現(xiàn)算法在計(jì)算邊介數(shù)值時(shí)是串行進(jìn)行的,即算法在循環(huán)過(guò)程中一次只計(jì)算網(wǎng)絡(luò)中一個(gè)節(jié)點(diǎn)的廣度遍歷圖所生成的節(jié)點(diǎn)與邊之間的關(guān)系結(jié)構(gòu)。該結(jié)構(gòu)為接下來(lái)在掃描點(diǎn)到點(diǎn)之間的最短路徑時(shí)所記錄的邊介數(shù)值提供了先驗(yàn)條件。通過(guò)對(duì)并行化計(jì)算理論的研究與GN算法相結(jié)合,得出GN算法的可并行性。其次,建立算法的并行計(jì)算模型,描述輿情網(wǎng)絡(luò)中各個(gè)節(jié)點(diǎn)之間的關(guān)系,分析節(jié)點(diǎn)與邊的聯(lián)系,并基于此模型設(shè)計(jì)出并行化的GN算法。再次,引入Hadoop平臺(tái),通過(guò)Hadoop下的MapReduce并行機(jī)制與算法進(jìn)行結(jié)合,使其在多機(jī)的模型下分別計(jì)算網(wǎng)絡(luò)...
【文章來(lái)源】:華北水利水電大學(xué)河南省
【文章頁(yè)數(shù)】:51 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 研究背景
1.2 研究目的和意義
1.3 研究?jī)?nèi)容
1.4 技術(shù)路線
2 社會(huì)網(wǎng)絡(luò)輿情分析理論及相關(guān)技術(shù)介紹
2.1 社會(huì)網(wǎng)絡(luò)輿情分析概述
2.1.1 社會(huì)網(wǎng)絡(luò)輿情分析技術(shù)
2.1.2 社會(huì)網(wǎng)絡(luò)原理
2.1.3 社會(huì)網(wǎng)絡(luò)輿情分析的意義
2.2 社團(tuán)發(fā)現(xiàn)的基本概念
2.2.1 不同的社團(tuán)類型
2.2.2 分裂的層次聚類技術(shù)
2.3 Hadoop概述
2.3.1 Hadoop的整體框架
2.4 NodeXL可視化
2.5 本章小結(jié)
3 社會(huì)網(wǎng)絡(luò)輿情分析技術(shù)研究
3.1 傳統(tǒng)的GN算法
3.2 模塊度Q值的計(jì)算
3.3 社會(huì)網(wǎng)絡(luò)輿情分析的特征
3.4 基于并行計(jì)算的GN算法的社會(huì)網(wǎng)絡(luò)輿情研究
3.4.1 并行計(jì)算概述
3.4.2 基于GN算法的社會(huì)網(wǎng)絡(luò)輿情分析
3.4.3 GN算法并行化研究與分析
3.5 本章小結(jié)
4 并行化的GN算法及實(shí)現(xiàn)
4.1 GN算法的并行設(shè)計(jì)
4.1.1 按網(wǎng)絡(luò)中頂點(diǎn)之間的邊分割
4.1.2 MapReduce機(jī)制與算法的結(jié)合
4.2 實(shí)驗(yàn)關(guān)鍵步驟
4.2.1 MapReduce機(jī)制下的GN算法的改進(jìn)及應(yīng)用
4.2.2 數(shù)據(jù)源的組成及結(jié)構(gòu)
4.2.3 Map類的設(shè)計(jì)
4.2.4 Reduce類的設(shè)計(jì)
4.3 本章小結(jié)
5 實(shí)驗(yàn)結(jié)果及結(jié)論
5.1 實(shí)驗(yàn)室實(shí)例分析
5.2 實(shí)驗(yàn)結(jié)果分析
5.3 本章小結(jié)
6 總結(jié)與展望
6.1 本文總結(jié)
6.2 研究展望
致謝
參考文獻(xiàn)
本文編號(hào):3006034
【文章來(lái)源】:華北水利水電大學(xué)河南省
【文章頁(yè)數(shù)】:51 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 研究背景
1.2 研究目的和意義
1.3 研究?jī)?nèi)容
1.4 技術(shù)路線
2 社會(huì)網(wǎng)絡(luò)輿情分析理論及相關(guān)技術(shù)介紹
2.1 社會(huì)網(wǎng)絡(luò)輿情分析概述
2.1.1 社會(huì)網(wǎng)絡(luò)輿情分析技術(shù)
2.1.2 社會(huì)網(wǎng)絡(luò)原理
2.1.3 社會(huì)網(wǎng)絡(luò)輿情分析的意義
2.2 社團(tuán)發(fā)現(xiàn)的基本概念
2.2.1 不同的社團(tuán)類型
2.2.2 分裂的層次聚類技術(shù)
2.3 Hadoop概述
2.3.1 Hadoop的整體框架
2.4 NodeXL可視化
2.5 本章小結(jié)
3 社會(huì)網(wǎng)絡(luò)輿情分析技術(shù)研究
3.1 傳統(tǒng)的GN算法
3.2 模塊度Q值的計(jì)算
3.3 社會(huì)網(wǎng)絡(luò)輿情分析的特征
3.4 基于并行計(jì)算的GN算法的社會(huì)網(wǎng)絡(luò)輿情研究
3.4.1 并行計(jì)算概述
3.4.2 基于GN算法的社會(huì)網(wǎng)絡(luò)輿情分析
3.4.3 GN算法并行化研究與分析
3.5 本章小結(jié)
4 并行化的GN算法及實(shí)現(xiàn)
4.1 GN算法的并行設(shè)計(jì)
4.1.1 按網(wǎng)絡(luò)中頂點(diǎn)之間的邊分割
4.1.2 MapReduce機(jī)制與算法的結(jié)合
4.2 實(shí)驗(yàn)關(guān)鍵步驟
4.2.1 MapReduce機(jī)制下的GN算法的改進(jìn)及應(yīng)用
4.2.2 數(shù)據(jù)源的組成及結(jié)構(gòu)
4.2.3 Map類的設(shè)計(jì)
4.2.4 Reduce類的設(shè)計(jì)
4.3 本章小結(jié)
5 實(shí)驗(yàn)結(jié)果及結(jié)論
5.1 實(shí)驗(yàn)室實(shí)例分析
5.2 實(shí)驗(yàn)結(jié)果分析
5.3 本章小結(jié)
6 總結(jié)與展望
6.1 本文總結(jié)
6.2 研究展望
致謝
參考文獻(xiàn)
本文編號(hào):3006034
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/3006034.html
最近更新
教材專著