基于數(shù)據(jù)挖掘技術(shù)的高校學(xué)生用戶畫像系統(tǒng)設(shè)計與實現(xiàn)
發(fā)布時間:2022-08-07 20:54
隨著教育信息化的發(fā)展,高校的教學(xué)管理、學(xué)生的校園活動產(chǎn)生了大量的數(shù)據(jù)。這些數(shù)據(jù)不斷產(chǎn)生與積累,形成了龐大的、分散的、復(fù)雜的數(shù)據(jù)集。此外,大學(xué)生人數(shù)不斷增多,給學(xué)校的教育管理帶來前所未有的挑戰(zhàn)。對這個不斷壯大的大學(xué)生群體缺乏科學(xué)的數(shù)據(jù)分析,容易忽視、遺漏一些潛在的問題,如心理健康、消費借貸、沉迷游戲等,進(jìn)而可能引發(fā)重大的問題。從海量數(shù)據(jù)中挖掘出有價值的信息是大數(shù)據(jù)應(yīng)用的共識。用戶畫像通常被認(rèn)為是對用戶屬性、行為、特征的標(biāo)簽化。用戶畫像是高校應(yīng)用大數(shù)據(jù)的核心基礎(chǔ),是高校精細(xì)化管理的前置條件,是智慧校園建設(shè)的重要內(nèi)容。相比以往基于較小樣本的數(shù)據(jù)分析,數(shù)據(jù)時代能夠獲取更多維度的大學(xué)生數(shù)據(jù),較大程度地接近全樣本,可以更精準(zhǔn)地勾勒學(xué)生的數(shù)據(jù)面貌。本文通過收集高校學(xué)生的基本屬性、學(xué)業(yè)屬性、消費習(xí)慣、圖書借閱、上網(wǎng)行為等維度的數(shù)據(jù),對其進(jìn)行數(shù)據(jù)清洗、數(shù)據(jù)集成、數(shù)據(jù)變換、數(shù)據(jù)規(guī)約等預(yù)處理,篩選出用于構(gòu)建學(xué)生用戶畫像的屬性特征,通過數(shù)據(jù)挖掘技術(shù)挖掘數(shù)據(jù)中隱含的知識,從而描繪出客觀、豐富、細(xì)致的學(xué)生用戶畫像。建立高校學(xué)生用戶畫像系統(tǒng)不僅有利于全面展示大學(xué)生群體數(shù)字面貌,還可以輔助學(xué)?茖W(xué)管理與決策,動態(tài)監(jiān)測...
【文章頁數(shù)】:85 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 研究背景與意義
1.2 國內(nèi)外研究現(xiàn)狀
1.3 本文研究工作
1.4 論文組織結(jié)構(gòu)
第二章 相關(guān)技術(shù)介紹
2.1 相似度計算
2.2 回歸分析
2.3 TF-IDF
2.4 聚類分析
2.5 關(guān)聯(lián)分析
第三章 高校學(xué)生用戶畫像系統(tǒng)需求分析
3.1 業(yè)務(wù)需求分析
3.2 系統(tǒng)功能需求分析
3.3 系統(tǒng)非功能需求分析
3.4 系統(tǒng)結(jié)構(gòu)分析
第四章 高校學(xué)生用戶畫像系統(tǒng)設(shè)計
4.1 系統(tǒng)架構(gòu)設(shè)計
4.2 業(yè)務(wù)流程設(shè)計
4.3 系統(tǒng)功能設(shè)計
4.4 數(shù)據(jù)庫設(shè)計
4.4.1 繪制數(shù)據(jù)實體關(guān)系圖
4.4.2 創(chuàng)建數(shù)據(jù)庫表結(jié)構(gòu)
第五章 高校學(xué)生用戶畫像系統(tǒng)實現(xiàn)
5.1 數(shù)據(jù)收集
5.1.1 獲得授權(quán)
5.1.2 數(shù)據(jù)探索
5.1.3 獲取數(shù)據(jù)
5.2 數(shù)據(jù)整理
5.2.1 數(shù)據(jù)預(yù)處理
5.2.2 數(shù)據(jù)分析
5.2.3 特征選擇
5.2.4 圖表化特征
5.2.5 標(biāo)簽化特征
5.3 構(gòu)建用戶畫像
5.3.1 基于數(shù)理統(tǒng)計
5.3.2 基于文本挖掘
5.3.3 基于聚類分析
5.3.4 用戶畫像集成與持久化
5.4 用戶畫像應(yīng)用
5.4.1 系統(tǒng)開發(fā)環(huán)境
5.4.2 系統(tǒng)運行環(huán)境
5.4.3 用戶畫像標(biāo)簽可視化
5.4.4 閱讀分析與推薦
5.4.5 學(xué)業(yè)預(yù)警
第六章 系統(tǒng)測試及應(yīng)用效果分析
6.1 系統(tǒng)測試
6.1.1 測試環(huán)境
6.1.2 功能測試
6.1.3 性能測試
6.2 應(yīng)用效果分析
第七章 總結(jié)與展望
7.1 總結(jié)
7.2 展望
參考文獻(xiàn)
附錄
1.豆瓣圖書API調(diào)用返回參數(shù)列表
2.校園一卡通消費數(shù)據(jù)表結(jié)構(gòu)
攻讀碩士學(xué)位期間取得的研究成果
致謝
附件
【參考文獻(xiàn)】:
期刊論文
[1]統(tǒng)計回歸模型中的主成分分析[J]. 孫婷蔚. 通訊世界. 2019(03)
[2]文本分類中TF-IDF權(quán)重計算方法改進(jìn)[J]. 隗中杰. 軟件導(dǎo)刊. 2018(12)
[3]基于“用戶畫像”的圖書館資源推薦模式設(shè)計與分析[J]. 王慶,趙發(fā)珍. 現(xiàn)代情報. 2018(03)
[4]海量學(xué)術(shù)資源個性化推薦綜述[J]. 劉偉,劉柏嵩,王洋洋. 計算機(jī)工程與應(yīng)用. 2018(03)
[5]國外圖書館領(lǐng)域用戶畫像的研究現(xiàn)狀及啟示[J]. 陳慧香,邵波. 圖書館學(xué)研究. 2017(20)
[6]大數(shù)據(jù)畫像技術(shù)在高校思想政治教育中的應(yīng)用[J]. 徐艷. 學(xué)理論. 2017(07)
[7]基于Spark的交互式數(shù)據(jù)預(yù)處理系統(tǒng)[J]. 張磊,朱鋒,鐘華. 計算機(jī)系統(tǒng)應(yīng)用. 2016(11)
[8]大數(shù)據(jù)研究:未來科技及經(jīng)濟(jì)社會發(fā)展的重大戰(zhàn)略領(lǐng)域——大數(shù)據(jù)的研究現(xiàn)狀與科學(xué)思考[J]. 李國杰,程學(xué)旗. 中國科學(xué)院院刊. 2012(06)
碩士論文
[1]基于聚類的推薦算法研究與應(yīng)用[D]. 李俊.南京郵電大學(xué) 2018
[2]基于大數(shù)據(jù)的校園招聘雇主畫像研究[D]. 張東迅.北京郵電大學(xué) 2018
[3]基于校園大數(shù)據(jù)的學(xué)生行為分析與預(yù)測方法研究[D]. 梁柱.西安理工大學(xué) 2017
[4]基于網(wǎng)絡(luò)日志的用戶行為分析與研究[D]. 周雪.北京郵電大學(xué) 2017
[5]基于大數(shù)據(jù)挖掘的高校學(xué)生行為數(shù)據(jù)分析系統(tǒng)的研究與開發(fā)[D]. 孫楊博.華北電力大學(xué)(北京) 2017
[6]基于校園一卡通系統(tǒng)的數(shù)據(jù)挖掘研究[D]. 王萌.哈爾濱工程大學(xué) 2016
[7]在線社交網(wǎng)絡(luò)數(shù)據(jù)挖掘[D]. 陳召群.清華大學(xué) 2015
[8]基于Kmeans算法的學(xué)生行為分析系統(tǒng)的設(shè)計與實現(xiàn)[D]. 劉國華.河北科技大學(xué) 2014
[9]基于群決策系統(tǒng)的高校創(chuàng)新項目網(wǎng)絡(luò)評估系統(tǒng)的設(shè)計與實現(xiàn)[D]. 戴經(jīng)緯.北京交通大學(xué) 2012
本文編號:3671028
【文章頁數(shù)】:85 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 研究背景與意義
1.2 國內(nèi)外研究現(xiàn)狀
1.3 本文研究工作
1.4 論文組織結(jié)構(gòu)
第二章 相關(guān)技術(shù)介紹
2.1 相似度計算
2.2 回歸分析
2.3 TF-IDF
2.4 聚類分析
2.5 關(guān)聯(lián)分析
第三章 高校學(xué)生用戶畫像系統(tǒng)需求分析
3.1 業(yè)務(wù)需求分析
3.2 系統(tǒng)功能需求分析
3.3 系統(tǒng)非功能需求分析
3.4 系統(tǒng)結(jié)構(gòu)分析
第四章 高校學(xué)生用戶畫像系統(tǒng)設(shè)計
4.1 系統(tǒng)架構(gòu)設(shè)計
4.2 業(yè)務(wù)流程設(shè)計
4.3 系統(tǒng)功能設(shè)計
4.4 數(shù)據(jù)庫設(shè)計
4.4.1 繪制數(shù)據(jù)實體關(guān)系圖
4.4.2 創(chuàng)建數(shù)據(jù)庫表結(jié)構(gòu)
第五章 高校學(xué)生用戶畫像系統(tǒng)實現(xiàn)
5.1 數(shù)據(jù)收集
5.1.1 獲得授權(quán)
5.1.2 數(shù)據(jù)探索
5.1.3 獲取數(shù)據(jù)
5.2 數(shù)據(jù)整理
5.2.1 數(shù)據(jù)預(yù)處理
5.2.2 數(shù)據(jù)分析
5.2.3 特征選擇
5.2.4 圖表化特征
5.2.5 標(biāo)簽化特征
5.3 構(gòu)建用戶畫像
5.3.1 基于數(shù)理統(tǒng)計
5.3.2 基于文本挖掘
5.3.3 基于聚類分析
5.3.4 用戶畫像集成與持久化
5.4 用戶畫像應(yīng)用
5.4.1 系統(tǒng)開發(fā)環(huán)境
5.4.2 系統(tǒng)運行環(huán)境
5.4.3 用戶畫像標(biāo)簽可視化
5.4.4 閱讀分析與推薦
5.4.5 學(xué)業(yè)預(yù)警
第六章 系統(tǒng)測試及應(yīng)用效果分析
6.1 系統(tǒng)測試
6.1.1 測試環(huán)境
6.1.2 功能測試
6.1.3 性能測試
6.2 應(yīng)用效果分析
第七章 總結(jié)與展望
7.1 總結(jié)
7.2 展望
參考文獻(xiàn)
附錄
1.豆瓣圖書API調(diào)用返回參數(shù)列表
2.校園一卡通消費數(shù)據(jù)表結(jié)構(gòu)
攻讀碩士學(xué)位期間取得的研究成果
致謝
附件
【參考文獻(xiàn)】:
期刊論文
[1]統(tǒng)計回歸模型中的主成分分析[J]. 孫婷蔚. 通訊世界. 2019(03)
[2]文本分類中TF-IDF權(quán)重計算方法改進(jìn)[J]. 隗中杰. 軟件導(dǎo)刊. 2018(12)
[3]基于“用戶畫像”的圖書館資源推薦模式設(shè)計與分析[J]. 王慶,趙發(fā)珍. 現(xiàn)代情報. 2018(03)
[4]海量學(xué)術(shù)資源個性化推薦綜述[J]. 劉偉,劉柏嵩,王洋洋. 計算機(jī)工程與應(yīng)用. 2018(03)
[5]國外圖書館領(lǐng)域用戶畫像的研究現(xiàn)狀及啟示[J]. 陳慧香,邵波. 圖書館學(xué)研究. 2017(20)
[6]大數(shù)據(jù)畫像技術(shù)在高校思想政治教育中的應(yīng)用[J]. 徐艷. 學(xué)理論. 2017(07)
[7]基于Spark的交互式數(shù)據(jù)預(yù)處理系統(tǒng)[J]. 張磊,朱鋒,鐘華. 計算機(jī)系統(tǒng)應(yīng)用. 2016(11)
[8]大數(shù)據(jù)研究:未來科技及經(jīng)濟(jì)社會發(fā)展的重大戰(zhàn)略領(lǐng)域——大數(shù)據(jù)的研究現(xiàn)狀與科學(xué)思考[J]. 李國杰,程學(xué)旗. 中國科學(xué)院院刊. 2012(06)
碩士論文
[1]基于聚類的推薦算法研究與應(yīng)用[D]. 李俊.南京郵電大學(xué) 2018
[2]基于大數(shù)據(jù)的校園招聘雇主畫像研究[D]. 張東迅.北京郵電大學(xué) 2018
[3]基于校園大數(shù)據(jù)的學(xué)生行為分析與預(yù)測方法研究[D]. 梁柱.西安理工大學(xué) 2017
[4]基于網(wǎng)絡(luò)日志的用戶行為分析與研究[D]. 周雪.北京郵電大學(xué) 2017
[5]基于大數(shù)據(jù)挖掘的高校學(xué)生行為數(shù)據(jù)分析系統(tǒng)的研究與開發(fā)[D]. 孫楊博.華北電力大學(xué)(北京) 2017
[6]基于校園一卡通系統(tǒng)的數(shù)據(jù)挖掘研究[D]. 王萌.哈爾濱工程大學(xué) 2016
[7]在線社交網(wǎng)絡(luò)數(shù)據(jù)挖掘[D]. 陳召群.清華大學(xué) 2015
[8]基于Kmeans算法的學(xué)生行為分析系統(tǒng)的設(shè)計與實現(xiàn)[D]. 劉國華.河北科技大學(xué) 2014
[9]基于群決策系統(tǒng)的高校創(chuàng)新項目網(wǎng)絡(luò)評估系統(tǒng)的設(shè)計與實現(xiàn)[D]. 戴經(jīng)緯.北京交通大學(xué) 2012
本文編號:3671028
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3671028.html
最近更新
教材專著