基于融合粒子群與k-means算法在微博輿情監(jiān)測方面的應(yīng)用
發(fā)布時間:2023-10-06 08:14
在互聯(lián)網(wǎng)運(yùn)用越來越普及的今天,社交網(wǎng)絡(luò)積累了大批的網(wǎng)民用戶,尤其是微博憑借著內(nèi)容豐富、文字簡略、發(fā)布快速等方面的優(yōu)勢,受到大量網(wǎng)民的喜愛,占據(jù)了主流媒體的位置。微博每天都會產(chǎn)生海量的數(shù)據(jù),這些數(shù)據(jù)包含巨量的信息,如何挖掘出這些信息并找到所需的部分有著重大的現(xiàn)實價值和作用。本文采用數(shù)據(jù)挖掘技術(shù)處理微博數(shù)據(jù),找到民眾關(guān)注的熱點話題,對網(wǎng)絡(luò)上的言論進(jìn)行跟蹤監(jiān)控,從而創(chuàng)造文明健康的網(wǎng)絡(luò)環(huán)境,獲取有效信息,為商業(yè)價值、信息傳播和社會學(xué)研究提供依據(jù),將網(wǎng)絡(luò)輿論朝向進(jìn)行積極健康的引導(dǎo)發(fā)展,為實現(xiàn)社會和諧提供更為有力的保障。本文以新浪微博的數(shù)據(jù)作為研究對象。首先是要將數(shù)據(jù)執(zhí)行可視化操作,這樣能基本確定數(shù)據(jù)的分布特性,以便于完成數(shù)據(jù)預(yù)處理。因為新浪微博的數(shù)據(jù)十分龐雜,且其中大部分是高于三維的數(shù)據(jù),所以對很難對微博進(jìn)行直觀判斷。本文通過k-means算法將數(shù)據(jù)執(zhí)行聚類分析,但是因為k-means算法較為容易受到初始中心點的影響,存在對數(shù)據(jù)執(zhí)行迭代求解的過程中,遇到局部最優(yōu)解的問題。為了解決這些問題,本文在計算過程中加入了粒子群(PSO)算法,改進(jìn)后的算法,減少了參數(shù)設(shè)置,可以加速算法收斂速度,提高聚類效果...
【文章頁數(shù)】:62 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 論文研究的目的和意義
1.2 相關(guān)內(nèi)容研究現(xiàn)狀
1.2.1 輿情監(jiān)測研究現(xiàn)狀
1.2.2 微博特征的研究現(xiàn)狀
1.2.3 聚類算法的研究現(xiàn)狀
1.3 本文的主要工作及論文的組織結(jié)構(gòu)
1.4 論文章節(jié)安排
第2章 相關(guān)理論基礎(chǔ)
2.1 數(shù)據(jù)挖掘
2.1.1 數(shù)據(jù)挖掘概述
2.1.2 數(shù)據(jù)挖掘的實現(xiàn)過程和技術(shù)分類
2.2 聚類分析
2.2.1 聚類分析概述
2.2.2 不同的聚類類型
2.2.3 主要的聚類算法
2.2.4 聚類評價的比較
2.3 微博相關(guān)知識
2.3.1 微博定義及用戶特點
2.3.2 微博挖掘的相關(guān)原理
2.4 k-means算法
2.4.1 算法思想
2.4.2 算法的特點
2.5 粒子群優(yōu)化算法
2.5.1 算法的原理
2.5.2 算法流程
第3章 基于融合粒子群的k-means算法
3.1 相關(guān)工作分析
3.2 基于融合粒子群優(yōu)化的k-means算法
3.2.1 粒子群編碼方案及適度評價
3.2.2 粒子群算法的參數(shù)設(shè)置
3.2.3 粒子變異操作
3.2.4 改進(jìn)算法的描述
3.3 實驗
第4章 系統(tǒng)設(shè)計與實現(xiàn)
4.1 功能需求分析
4.2 系統(tǒng)概述
4.2.1 開發(fā)環(huán)境
4.2.2 系統(tǒng)框架
4.3 系統(tǒng)設(shè)計
4.3.1 微博模擬登陸
4.3.2 信息采集
4.3.3 分詞
4.3.4 主題詞抽取
4.3.5 文本聚類
4.4 系統(tǒng)實現(xiàn)
4.4.1 系統(tǒng)界面
4.4.2 對微博信息的采集
4.4.3 微博數(shù)據(jù)分析
結(jié)論
參考文獻(xiàn)
致謝
本文編號:3851472
【文章頁數(shù)】:62 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 論文研究的目的和意義
1.2 相關(guān)內(nèi)容研究現(xiàn)狀
1.2.1 輿情監(jiān)測研究現(xiàn)狀
1.2.2 微博特征的研究現(xiàn)狀
1.2.3 聚類算法的研究現(xiàn)狀
1.3 本文的主要工作及論文的組織結(jié)構(gòu)
1.4 論文章節(jié)安排
第2章 相關(guān)理論基礎(chǔ)
2.1 數(shù)據(jù)挖掘
2.1.1 數(shù)據(jù)挖掘概述
2.1.2 數(shù)據(jù)挖掘的實現(xiàn)過程和技術(shù)分類
2.2 聚類分析
2.2.1 聚類分析概述
2.2.2 不同的聚類類型
2.2.3 主要的聚類算法
2.2.4 聚類評價的比較
2.3 微博相關(guān)知識
2.3.1 微博定義及用戶特點
2.3.2 微博挖掘的相關(guān)原理
2.4 k-means算法
2.4.1 算法思想
2.4.2 算法的特點
2.5 粒子群優(yōu)化算法
2.5.1 算法的原理
2.5.2 算法流程
第3章 基于融合粒子群的k-means算法
3.1 相關(guān)工作分析
3.2 基于融合粒子群優(yōu)化的k-means算法
3.2.1 粒子群編碼方案及適度評價
3.2.2 粒子群算法的參數(shù)設(shè)置
3.2.3 粒子變異操作
3.2.4 改進(jìn)算法的描述
3.3 實驗
第4章 系統(tǒng)設(shè)計與實現(xiàn)
4.1 功能需求分析
4.2 系統(tǒng)概述
4.2.1 開發(fā)環(huán)境
4.2.2 系統(tǒng)框架
4.3 系統(tǒng)設(shè)計
4.3.1 微博模擬登陸
4.3.2 信息采集
4.3.3 分詞
4.3.4 主題詞抽取
4.3.5 文本聚類
4.4 系統(tǒng)實現(xiàn)
4.4.1 系統(tǒng)界面
4.4.2 對微博信息的采集
4.4.3 微博數(shù)據(jù)分析
結(jié)論
參考文獻(xiàn)
致謝
本文編號:3851472
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3851472.html
最近更新
教材專著