基于融合粒子群與k-means算法在微博輿情監(jiān)測方面的應用
發(fā)布時間:2023-10-06 08:14
在互聯(lián)網(wǎng)運用越來越普及的今天,社交網(wǎng)絡積累了大批的網(wǎng)民用戶,尤其是微博憑借著內容豐富、文字簡略、發(fā)布快速等方面的優(yōu)勢,受到大量網(wǎng)民的喜愛,占據(jù)了主流媒體的位置。微博每天都會產生海量的數(shù)據(jù),這些數(shù)據(jù)包含巨量的信息,如何挖掘出這些信息并找到所需的部分有著重大的現(xiàn)實價值和作用。本文采用數(shù)據(jù)挖掘技術處理微博數(shù)據(jù),找到民眾關注的熱點話題,對網(wǎng)絡上的言論進行跟蹤監(jiān)控,從而創(chuàng)造文明健康的網(wǎng)絡環(huán)境,獲取有效信息,為商業(yè)價值、信息傳播和社會學研究提供依據(jù),將網(wǎng)絡輿論朝向進行積極健康的引導發(fā)展,為實現(xiàn)社會和諧提供更為有力的保障。本文以新浪微博的數(shù)據(jù)作為研究對象。首先是要將數(shù)據(jù)執(zhí)行可視化操作,這樣能基本確定數(shù)據(jù)的分布特性,以便于完成數(shù)據(jù)預處理。因為新浪微博的數(shù)據(jù)十分龐雜,且其中大部分是高于三維的數(shù)據(jù),所以對很難對微博進行直觀判斷。本文通過k-means算法將數(shù)據(jù)執(zhí)行聚類分析,但是因為k-means算法較為容易受到初始中心點的影響,存在對數(shù)據(jù)執(zhí)行迭代求解的過程中,遇到局部最優(yōu)解的問題。為了解決這些問題,本文在計算過程中加入了粒子群(PSO)算法,改進后的算法,減少了參數(shù)設置,可以加速算法收斂速度,提高聚類效果...
【文章頁數(shù)】:62 頁
【學位級別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 論文研究的目的和意義
1.2 相關內容研究現(xiàn)狀
1.2.1 輿情監(jiān)測研究現(xiàn)狀
1.2.2 微博特征的研究現(xiàn)狀
1.2.3 聚類算法的研究現(xiàn)狀
1.3 本文的主要工作及論文的組織結構
1.4 論文章節(jié)安排
第2章 相關理論基礎
2.1 數(shù)據(jù)挖掘
2.1.1 數(shù)據(jù)挖掘概述
2.1.2 數(shù)據(jù)挖掘的實現(xiàn)過程和技術分類
2.2 聚類分析
2.2.1 聚類分析概述
2.2.2 不同的聚類類型
2.2.3 主要的聚類算法
2.2.4 聚類評價的比較
2.3 微博相關知識
2.3.1 微博定義及用戶特點
2.3.2 微博挖掘的相關原理
2.4 k-means算法
2.4.1 算法思想
2.4.2 算法的特點
2.5 粒子群優(yōu)化算法
2.5.1 算法的原理
2.5.2 算法流程
第3章 基于融合粒子群的k-means算法
3.1 相關工作分析
3.2 基于融合粒子群優(yōu)化的k-means算法
3.2.1 粒子群編碼方案及適度評價
3.2.2 粒子群算法的參數(shù)設置
3.2.3 粒子變異操作
3.2.4 改進算法的描述
3.3 實驗
第4章 系統(tǒng)設計與實現(xiàn)
4.1 功能需求分析
4.2 系統(tǒng)概述
4.2.1 開發(fā)環(huán)境
4.2.2 系統(tǒng)框架
4.3 系統(tǒng)設計
4.3.1 微博模擬登陸
4.3.2 信息采集
4.3.3 分詞
4.3.4 主題詞抽取
4.3.5 文本聚類
4.4 系統(tǒng)實現(xiàn)
4.4.1 系統(tǒng)界面
4.4.2 對微博信息的采集
4.4.3 微博數(shù)據(jù)分析
結論
參考文獻
致謝
本文編號:3851472
【文章頁數(shù)】:62 頁
【學位級別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 論文研究的目的和意義
1.2 相關內容研究現(xiàn)狀
1.2.1 輿情監(jiān)測研究現(xiàn)狀
1.2.2 微博特征的研究現(xiàn)狀
1.2.3 聚類算法的研究現(xiàn)狀
1.3 本文的主要工作及論文的組織結構
1.4 論文章節(jié)安排
第2章 相關理論基礎
2.1 數(shù)據(jù)挖掘
2.1.1 數(shù)據(jù)挖掘概述
2.1.2 數(shù)據(jù)挖掘的實現(xiàn)過程和技術分類
2.2 聚類分析
2.2.1 聚類分析概述
2.2.2 不同的聚類類型
2.2.3 主要的聚類算法
2.2.4 聚類評價的比較
2.3 微博相關知識
2.3.1 微博定義及用戶特點
2.3.2 微博挖掘的相關原理
2.4 k-means算法
2.4.1 算法思想
2.4.2 算法的特點
2.5 粒子群優(yōu)化算法
2.5.1 算法的原理
2.5.2 算法流程
第3章 基于融合粒子群的k-means算法
3.1 相關工作分析
3.2 基于融合粒子群優(yōu)化的k-means算法
3.2.1 粒子群編碼方案及適度評價
3.2.2 粒子群算法的參數(shù)設置
3.2.3 粒子變異操作
3.2.4 改進算法的描述
3.3 實驗
第4章 系統(tǒng)設計與實現(xiàn)
4.1 功能需求分析
4.2 系統(tǒng)概述
4.2.1 開發(fā)環(huán)境
4.2.2 系統(tǒng)框架
4.3 系統(tǒng)設計
4.3.1 微博模擬登陸
4.3.2 信息采集
4.3.3 分詞
4.3.4 主題詞抽取
4.3.5 文本聚類
4.4 系統(tǒng)實現(xiàn)
4.4.1 系統(tǒng)界面
4.4.2 對微博信息的采集
4.4.3 微博數(shù)據(jù)分析
結論
參考文獻
致謝
本文編號:3851472
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3851472.html
最近更新
教材專著