新浪微博客戶的數(shù)據(jù)聚類(lèi)分類(lèi)研究
發(fā)布時(shí)間:2017-07-30 18:04
本文關(guān)鍵詞:新浪微博客戶的數(shù)據(jù)聚類(lèi)分類(lèi)研究
更多相關(guān)文章: 新浪微博 客戶的數(shù)據(jù) 聚類(lèi) 分類(lèi)研究
【摘要】:隨著互聯(lián)網(wǎng)技術(shù)的不斷發(fā)展,越來(lái)越的多互聯(lián)網(wǎng)產(chǎn)品進(jìn)入人們的生活,微博便是近年來(lái),在全世界范圍內(nèi)蓬勃發(fā)展。風(fēng)靡全球的微博客憑其140內(nèi)的文字,時(shí)時(shí)刻刻在向世界傳達(dá)著各種信息。目前,在中國(guó),微博已儼然成為了新的新聞發(fā)布渠道,消息中心,社交網(wǎng)絡(luò)中心,以及娛樂(lè)中心。 在我國(guó),新浪微博獨(dú)領(lǐng)風(fēng)騷,在微博運(yùn)營(yíng)領(lǐng)域獨(dú)占鰲頭。然而微博的用戶也獨(dú)具特點(diǎn),他們大多善于接觸新鮮事物,是互聯(lián)網(wǎng)的資深用戶。在微博運(yùn)營(yíng)越來(lái)越商業(yè)化的同時(shí),,如何抓住用戶,如何營(yíng)銷(xiāo)才是用戶不會(huì)反感成為了目前緊要的問(wèn)題。本論文立足于新浪微博運(yùn)營(yíng)商的角度出發(fā),探索微博用戶的挖掘,對(duì)客戶進(jìn)行分類(lèi),以促進(jìn)新浪微博運(yùn)營(yíng)商實(shí)施新的營(yíng)銷(xiāo)策略。 本文分為了理論部分與實(shí)證兩個(gè)主要部分分別為理論部分和實(shí)證部分。理論部分主要介紹了在文章用到的理論知識(shí),首先是對(duì)數(shù)據(jù)挖掘的理解,對(duì)微博使用者的分析,與從商業(yè)角度進(jìn)行的客戶分類(lèi)。接著,本文介紹了文章的主體模型,也就是CRISP-DM模型,這個(gè)模型貫穿在整個(gè)數(shù)據(jù)挖掘?qū)嵶C的過(guò)程中,再次,介紹了數(shù)據(jù)預(yù)處理與數(shù)據(jù)清洗,以及數(shù)據(jù)挖掘算法。在實(shí)證部分,本文使用了SPSS CLEMENTIN12.0軟件進(jìn)行實(shí)證分析。SPSS CLEMENTIN是一款以數(shù)據(jù)流為中心的數(shù)據(jù)挖掘軟件。在這個(gè)部分首先進(jìn)行聚類(lèi)挖掘接著進(jìn)行分類(lèi)挖掘,這樣做的目的是,通過(guò)對(duì)客戶進(jìn)行聚類(lèi),找出微博用戶的大致類(lèi)別,從而應(yīng)用到分類(lèi)挖掘里。 縱覽全文,本論文圍繞新浪微博用戶的挖掘分類(lèi)而展開(kāi),通過(guò)實(shí)證對(duì)比分析不同類(lèi)別新浪微博用戶的特征,并在最后做出總結(jié)和展望。
【關(guān)鍵詞】:新浪微博 客戶的數(shù)據(jù) 聚類(lèi) 分類(lèi)研究
【學(xué)位授予單位】:首都經(jīng)濟(jì)貿(mào)易大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2013
【分類(lèi)號(hào)】:F49;F224;TP311.13
【目錄】:
- 摘要4-5
- Abstract5-9
- 第一章 緒論9-12
- 1.1 研究背景和意義9-10
- 1.1.1 研究背景9-10
- 1.1.2 研究意義10
- 1.2 研究?jī)?nèi)容和目標(biāo)10-11
- 1.2.1 研究?jī)?nèi)容10
- 1.2.2 研究目標(biāo)10-11
- 1.3 國(guó)內(nèi)外研究現(xiàn)狀11
- 1.4 文章結(jié)構(gòu)11-12
- 第二章 數(shù)據(jù)挖掘與分類(lèi)標(biāo)準(zhǔn)12-19
- 2.1 數(shù)據(jù)挖掘概述12-14
- 2.1.1 概念12
- 2.1.2 功能12-13
- 2.1.3 數(shù)據(jù)挖掘項(xiàng)目實(shí)施步驟13-14
- 2.1.4 應(yīng)用與發(fā)展趨勢(shì)14
- 2.2 微博用戶分類(lèi)標(biāo)準(zhǔn)14-15
- 2.2.1 微博用戶群分析14-15
- 2.3 客戶細(xì)分理論15-18
- 2.3.1 微博營(yíng)銷(xiāo)15-16
- 2.3.2 客戶細(xì)分定義16-17
- 2.3.3 客戶細(xì)分的意義17
- 2.3.4 客戶細(xì)分方法17-18
- 2.4 客戶細(xì)分理論下微博用戶分類(lèi)18-19
- 第三章 CRISP DM 模型與數(shù)據(jù) ETL19-27
- 3.1 CRISP DM 模型19-21
- 3.1.1 數(shù)據(jù)挖掘過(guò)程模型19
- 3.1.2 Fayyad 與 SEMMA 模型19-21
- 3.2 CRISP DM 模型21-23
- 3.2.1 CRISP DM 生命周期22-23
- 3.3 數(shù)據(jù)獲取23-24
- 3.4 數(shù)據(jù)驗(yàn)證24-25
- 3.5 數(shù)據(jù) ETL25
- 3.6 數(shù)據(jù)清洗功能25-27
- 第四章 對(duì)新浪微博用戶的分類(lèi)挖掘27-34
- 4.1 聚類(lèi)算法27-29
- 4.1.1 K means 算法28-29
- 4.2 決策樹(shù)算法29-34
- 4.2.1 決策樹(shù)算法原理30
- 4.2.2 ID3 算法30-32
- 4.2.2.1 信息熵定義30-31
- 4.2.2.2 ID3 算法31-32
- 4.2.2.3 ID 算法優(yōu)缺點(diǎn)分析32
- 4.2.3 CART 算法32-34
- 4.2.3.1 CART 算法定義32-33
- 4.2.3.2 Gini 指標(biāo)33
- 4.2.3.3 CART 算法結(jié)構(gòu)33-34
- 第五章 挖掘?qū)嵶C分析34-51
- 5.1 聚類(lèi)挖掘?qū)嵶C分析34-51
- 5.1.1 微博聚類(lèi)挖掘業(yè)務(wù)理解35
- 5.1.2 微博用戶數(shù)據(jù)理解與數(shù)據(jù)準(zhǔn)備35-37
- 5.1.3 建立聚類(lèi)挖掘模型37-42
- 5.1.3.1 建立 k means 模型37-39
- 5.1.3.2 建立多層聚類(lèi)模型39-41
- 5.1.3.3 評(píng)估與部署41-42
- 5.1.4 決策樹(shù)實(shí)證分析42-51
- 5.1.4.1 以下是使用 ID3 算法也 CART 算法建模的實(shí)證過(guò)程分析42
- 5.1.4.2 建立 ID3 挖掘模型42-47
- 5.1.4.3 建立 CART 挖掘模型47-51
- 第六章 總結(jié)和展望51-53
- 6.1 本文內(nèi)容總結(jié)51-52
- 6.2 本文的創(chuàng)新之處52
- 6.3 本文的不足與展望52-53
- 參考文獻(xiàn)53-55
- 致謝55-56
- 攻讀碩士學(xué)位期間發(fā)表的論文56-57
【參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前6條
1 許卓;;微博客的傳播優(yōu)勢(shì)及發(fā)展前景探析[J];今傳媒;2010年01期
2 呂巍,蔣波,陳潔;基于K-means算法的中國(guó)移動(dòng)市場(chǎng)顧客行為細(xì)分策略研究[J];管理學(xué)報(bào);2005年01期
3 張寧,賈自艷,史忠植;數(shù)據(jù)倉(cāng)庫(kù)中ETL技術(shù)的研究[J];計(jì)算機(jī)工程與應(yīng)用;2002年24期
4 王永恒;賈焰;楊樹(shù)強(qiáng);;大規(guī)模文本數(shù)據(jù)庫(kù)中的短文分類(lèi)方法[J];計(jì)算機(jī)工程與應(yīng)用;2006年22期
5 王克龍,王玲,王平立,宋斌;數(shù)據(jù)倉(cāng)庫(kù)中ETL技術(shù)的探討與實(shí)踐[J];計(jì)算機(jī)應(yīng)用與軟件;2005年11期
6 崔爭(zhēng)艷;;基于語(yǔ)義的微博短信息分類(lèi)[J];現(xiàn)代計(jì)算機(jī)(專(zhuān)業(yè)版);2010年08期
本文編號(hào):595456
本文鏈接:http://sikaile.net/guanlilunwen/sjfx/595456.html
最近更新
教材專(zhuān)著