基于聚類技術(shù)的校園網(wǎng)絡(luò)用戶行為數(shù)據(jù)分析研究
發(fā)布時(shí)間:2017-10-16 09:03
本文關(guān)鍵詞:基于聚類技術(shù)的校園網(wǎng)絡(luò)用戶行為數(shù)據(jù)分析研究
更多相關(guān)文章: 校園網(wǎng)絡(luò)用戶 行為分析 數(shù)據(jù)挖掘 興趣度矩陣 相似度計(jì)算 K-means算法
【摘要】:目前,隨著校園網(wǎng)絡(luò)用戶個(gè)性化需求的日益增長(zhǎng),網(wǎng)絡(luò)信息服務(wù)的使用從集中統(tǒng)一型向分布式個(gè)性化演進(jìn),校園網(wǎng)絡(luò)中的用戶有著各自的上網(wǎng)習(xí)慣和興趣,各用戶使用網(wǎng)絡(luò)的時(shí)間、服務(wù)及關(guān)注的內(nèi)容焦點(diǎn)都有差異。校園網(wǎng)絡(luò)服務(wù)也從傳統(tǒng)的網(wǎng)絡(luò)聊天、瀏覽新聞網(wǎng)頁(yè)等方面向更細(xì)致、更個(gè)性化的服務(wù)轉(zhuǎn)變,如網(wǎng)絡(luò)購(gòu)物、網(wǎng)絡(luò)課堂、娛樂(lè)游戲等,這為校園網(wǎng)絡(luò)用戶提供了極大的便利。然而,現(xiàn)階段的個(gè)性化校園網(wǎng)絡(luò)用戶服務(wù)在及時(shí)性、穩(wěn)定性等方面仍無(wú)法滿足實(shí)際應(yīng)用的需求,因此,為校園網(wǎng)用戶提供更加及時(shí)、更高質(zhì)量的網(wǎng)絡(luò)服務(wù),成為網(wǎng)絡(luò)用戶行為的研究方向之一。本文將借助挖掘處理、聚類分析技術(shù)來(lái)研究網(wǎng)絡(luò)用戶的行為,并進(jìn)一步分析網(wǎng)絡(luò)用戶的興趣和需求,以優(yōu)化用戶體驗(yàn)。高等院校內(nèi)的校園網(wǎng)使用者有著比較高的文化教育水平和專業(yè)水平,并且不同的用戶有著不同的網(wǎng)絡(luò)使用習(xí)慣以及更加個(gè)性化的網(wǎng)絡(luò)需求,因此,在校園網(wǎng)中獲取的數(shù)據(jù)相比社會(huì)網(wǎng)絡(luò)數(shù)據(jù)有著更高的可研究性。本文的主要研究工作和創(chuàng)新點(diǎn)概括如下:1.本文梳理了近年來(lái)國(guó)內(nèi)外有關(guān)網(wǎng)絡(luò)用戶行為的分析研究現(xiàn)狀,歸納總結(jié)出校園網(wǎng)絡(luò)用戶行為的概念及特點(diǎn)、數(shù)據(jù)挖掘的流程和方法,并根據(jù)校園網(wǎng)絡(luò)用戶行為分析數(shù)據(jù)的特點(diǎn),選擇了K-means聚類算法進(jìn)行改進(jìn),并用于聚類分析。2.本文在傳統(tǒng)經(jīng)典的K-means聚類算法的基礎(chǔ)上,提出了基于興趣矩陣的相似度計(jì)算方法。該算法通過(guò)構(gòu)造用戶興趣度矩陣的方式改進(jìn)了用戶間相似度的計(jì)算方法,即用戶的上網(wǎng)行為以矩陣的形式表示出來(lái),其中,每個(gè)矩陣有七行,每一行表示日期的記錄,即(周一、周二...周日),每個(gè)矩陣元素表示在某影響條件分類下網(wǎng)絡(luò)使用量占當(dāng)天總使用量的比重值,每一列表示網(wǎng)絡(luò)用戶在同一影響條件分類下,不同日期的網(wǎng)絡(luò)使用量占當(dāng)天總使用量的比重值,進(jìn)而使用聚類技術(shù),對(duì)校園局域網(wǎng)用戶行為進(jìn)行相似度計(jì)算。該算法在一定程度上降低了無(wú)效數(shù)據(jù)的影響,提高了用戶行為相似度聚類的時(shí)效性和有效性,能夠較好的應(yīng)用于校園局域網(wǎng)用戶行為的具體研究中。3.本文提出了對(duì)影響用戶行為的條件進(jìn)行篩選的算法,即根據(jù)用戶行為隨條件變化的波動(dòng)情況來(lái)對(duì)該條件進(jìn)行有效性判定。在校園局域網(wǎng)中,影響用戶行為的可能條件比較多,例如上網(wǎng)的時(shí)間和上網(wǎng)位置等等,因此,能夠科學(xué)的篩選出有效的影響條件是校園局域網(wǎng)用戶行為研究的一個(gè)重要部分。相對(duì)于傳統(tǒng)的人工的篩選方法來(lái)講,該方法減少了人為干預(yù)的主觀隨意性,條件篩選結(jié)果更為嚴(yán)謹(jǐn)。
【關(guān)鍵詞】:校園網(wǎng)絡(luò)用戶 行為分析 數(shù)據(jù)挖掘 興趣度矩陣 相似度計(jì)算 K-means算法
【學(xué)位授予單位】:山東師范大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:TP311.13;TP393.18
【目錄】:
- 摘要6-7
- ABSTRACT7-9
- 第一章 緒論9-13
- 1.1 課題研究背景與意義9-10
- 1.2 國(guó)內(nèi)外研究現(xiàn)狀10-11
- 1.2.1 網(wǎng)絡(luò)用戶行為的國(guó)內(nèi)外研究現(xiàn)狀10
- 1.2.2 聚類算法的相關(guān)研究現(xiàn)狀10-11
- 1.3 本文主要研究?jī)?nèi)容11
- 1.4 論文組織結(jié)構(gòu)11-13
- 第二章 校園網(wǎng)絡(luò)用戶及用戶行為分析概述13-17
- 2.1 校園網(wǎng)絡(luò)用戶13-14
- 2.1.1 校園網(wǎng)絡(luò)用戶的概念及特點(diǎn)13
- 2.1.2 校園網(wǎng)絡(luò)用戶興趣13-14
- 2.1.3 校園網(wǎng)絡(luò)用戶分類14
- 2.2 校園網(wǎng)絡(luò)用戶行為14-16
- 2.2.1 校園網(wǎng)絡(luò)用戶行為概念及特點(diǎn)14-15
- 2.2.2 用戶行為分析數(shù)據(jù)采集15-16
- 2.3 本章小節(jié)16-17
- 第三章 校園網(wǎng)絡(luò)用戶行為分析的挖掘技術(shù)及數(shù)據(jù)處理17-31
- 3.1 數(shù)據(jù)挖掘17-20
- 3.1.1 數(shù)據(jù)挖掘的概念及目的17
- 3.1.2 數(shù)據(jù)挖掘方法17-19
- 3.1.3 數(shù)據(jù)挖掘流程19-20
- 3.2 數(shù)據(jù)預(yù)處理20-23
- 3.2.1 數(shù)據(jù)預(yù)處理的重要意義20
- 3.2.2 數(shù)據(jù)清洗20-22
- 3.2.3 數(shù)據(jù)規(guī)約22
- 3.2.4 數(shù)據(jù)集成和數(shù)據(jù)變換22-23
- 3.3 聚類分析23-25
- 3.3.1 聚類的概念23-24
- 3.3.2 聚類分析算法特點(diǎn)24
- 3.3.3 聚類分析算法分類24-25
- 3.4 K-means聚類算法25-30
- 3.4.1 K-means算法基本概述25-26
- 3.4.2 K-means算法的基本原理和思想26-27
- 3.4.3 K-means聚類算分析27-28
- 3.4.4 K-means聚類算法的優(yōu)缺點(diǎn)28-30
- 3.5 本章小結(jié)30-31
- 第四章 校園網(wǎng)用戶行為分析的設(shè)計(jì)方案31-35
- 4.1 校園網(wǎng)絡(luò)簡(jiǎn)介31
- 4.2 校園網(wǎng)用戶行為分析的設(shè)計(jì)31-33
- 4.3 H3C及檢測(cè)系統(tǒng)后臺(tái)數(shù)據(jù)庫(kù)概述33
- 4.4 校園網(wǎng)絡(luò)用戶流量使用走勢(shì)33-35
- 第五章 用戶興趣矩陣相似度算法35-41
- 5.1 校園網(wǎng)用戶行為相關(guān)問(wèn)題定義35-37
- 5.1.1 網(wǎng)絡(luò)使用量的表示及相關(guān)概念35-36
- 5.1.2 校園網(wǎng)用戶行為活躍度36-37
- 5.2 興趣矩陣相似度算法(IMSA)37-40
- 5.2.1 網(wǎng)絡(luò)用戶興趣度矩陣的構(gòu)造37-39
- 5.2.2 網(wǎng)絡(luò)用戶行為相似度的計(jì)算39-40
- 5.3 本章小結(jié)40-41
- 第六章 校園網(wǎng)絡(luò)用戶行為的實(shí)驗(yàn)分析41-45
- 6.1 實(shí)驗(yàn)步驟41-42
- 6.2 實(shí)驗(yàn)結(jié)果及分析42-44
- 6.2.1 活躍度臨界值的實(shí)驗(yàn)及影響42
- 6.2.2 異常率的臨界值的實(shí)驗(yàn)及影響42-43
- 6.2.3 基于興趣度矩陣的聚類43-44
- 6.3 本章小結(jié)44-45
- 第七章 總結(jié)與展望45-47
- 7.1 總結(jié)45-46
- 7.2 展望46-47
- 參考文獻(xiàn)47-49
- 攻讀碩士學(xué)位期間的主要成果49-50
- 致謝50
本文編號(hào):1041782
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/1041782.html
最近更新
教材專著