MOOC用戶流失率的統(tǒng)計建模和預(yù)測技術(shù)的研究
本文選題:MOOC + 用戶流失率; 參考:《北京郵電大學(xué)》2016年碩士論文
【摘要】:隨著互聯(lián)網(wǎng)的發(fā)展,在線教育蓬勃發(fā)展,形式越來越多。MOOC作為在線教育的一種形式,以其學(xué)習(xí)成本低等優(yōu)點被越來越多的人接受。但是MOOC面臨著一個十分重要的問題:用戶流失率過高。這對MOOC的發(fā)展十分不利。本文使用了 MOOC網(wǎng)站提供39門課程的用戶后臺操作數(shù)據(jù),對MOOC用戶的行為模式進行分析。在此基礎(chǔ)上對用戶流失率進行建模,實現(xiàn)對MOOC用戶是否丟棄課程進行預(yù)測。本論文使用的數(shù)據(jù)集已標(biāo)注好對應(yīng)的預(yù)測結(jié)果(丟棄和不丟棄)。所以對用戶流失率建模是一個有監(jiān)督的二分類問題,可以使用機器學(xué)習(xí)分類理論來對用戶流失率進行建模和預(yù)測。論文在分析數(shù)據(jù)集的基礎(chǔ)上,共提出了三類特征,其中有描述性質(zhì)的特征,也有統(tǒng)計性質(zhì)的特征,這些特征集合可以從多個角度反映MOOC用戶的行為習(xí)慣,最大限度地保留了原數(shù)據(jù)集的信息。接著,論文使用了邏輯回歸、支持向量機、隨機森林、梯度提升樹和AdaBoost分類模型分別對用戶流失率進行建模。結(jié)合數(shù)據(jù)集,論證了這五種分類模型的預(yù)測性能,同時也指出了分類模型存在的不足:單一的分類模型只能反映數(shù)據(jù)集一個維度的信息。針對各分類模型獨自建模所存在的無法全面反映數(shù)據(jù)集的不足,論文首先提出了一種多分類器加權(quán)聯(lián)合考慮的思想,并在此基礎(chǔ)上給出一種基于分類器權(quán)重的改進模型。多分類器加權(quán)模型是一種多分類器組合模型,通過加權(quán)的方式來組合分類模型,以解決單一分類器不能充分反映數(shù)據(jù)集的情況。接下來,論文又討論了一種基于閾值的多分類器與模型,獲得一個預(yù)測度很高的可信集合。最后,融合多分類器加權(quán)模型和可信集合概念,給出一種帶有可信集合的加權(quán)改算法,進一步提高了流失率模型的預(yù)測性能。
[Abstract]:With the development of the Internet, online education is booming, more and more forms of.MOOC as a form of online education are accepted by more and more people with the advantages of low cost of learning. But MOOC is facing a very important problem: the rate of user loss is too high. This is very bad for the development of MOOC. This article uses the MOOC website to provide 3 The users of the 9 courses operate data in the background to analyze the behavior patterns of MOOC users. On this basis, the user churn rate is modeled to predict whether the MOOC users are discarded. The data set used in this paper has been marked with the corresponding prediction results (discarding and discarding). The two classification problem of supervision can be used to model and predict the loss rate of users by machine learning classification theory. On the basis of the analysis of data sets, a total of three types of features are presented, including the characteristics of the description and the characteristics of statistical properties. These feature sets can reflect the behavior habits of MOOC users from multiple angles. Then, the paper uses logical regression, support vector machines, random forests, gradient lifting trees and AdaBoost classification models to model the loss rate of users respectively. The prediction performance of the five classification models is demonstrated by combining data sets, and the shortcomings of the classification models are also pointed out: single The classification model can only reflect the information of one dimension of the data set. In view of the inadequacy of the data sets that can not be fully reflected in the modeling of each classification model, a new idea of weighted joint consideration of multiple classifiers is proposed in this paper, and an improved model based on the weight of classifier is given on this basis. A multi classifier combination model is used to combine the classification model by weighted method so as to solve the case that single classifier can not fully reflect the data set. Then, a multi classifier and model based on threshold is discussed, and a trusted set with high predictability is obtained. Finally, the multiple classifier weighted model and the trusted set are fused. In addition, a weighted modification algorithm with credible sets is proposed to further improve the prediction performance of the churn rate model.
【學(xué)位授予單位】:北京郵電大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:G434;TP181
【相似文獻】
相關(guān)期刊論文 前10條
1 蔣晨;發(fā)展和留住核心用戶——電信業(yè)用戶流失分析[J];郵電企業(yè)管理;2001年13期
2 方蕾;;用戶流失引發(fā)網(wǎng)游頹勢 提升服務(wù)是唯一救命稻草[J];IT時代周刊;2006年05期
3 肖勝;;準(zhǔn)確計算與解讀流失率[J];通信企業(yè)管理;2013年01期
4 馬鳳炯;;以優(yōu)質(zhì)服務(wù)推動郵政企業(yè)持續(xù)發(fā)展[J];中國郵政;2009年09期
5 劉光遠;苑森淼;董立巖;李永麗;;基于進化理論的用戶流失預(yù)測分析[J];吉林大學(xué)學(xué)報(理學(xué)版);2007年02期
6 莊德尚;武艷;;新疆巴州鐵通 建立流失預(yù)警機制 減少用戶流失[J];通信企業(yè)管理;2007年12期
7 賴院根;劉礪利;;基于客戶價值的信息用戶流失預(yù)測研究[J];情報理論與實踐;2011年07期
8 ;為IPOT witter效仿FACEBOOK[J];工業(yè)設(shè)計;2013年08期
9 馬會迎;;移動互聯(lián)網(wǎng)對用戶流失的影響分析——以人人網(wǎng)為例[J];無線互聯(lián)科技;2014年04期
10 宋向東;;IP業(yè)務(wù)推動NTT固話公司走出困境[J];通信世界;2011年05期
相關(guān)會議論文 前4條
1 車平;施剛;;一種基于決策樹的用戶流失預(yù)測分析方法[A];先進制造技術(shù)論壇暨第五屆制造業(yè)自動化與信息化技術(shù)交流會論文集[C];2006年
2 俞宙;莫麗珍;;廣東移動天氣短信用戶流失分析及應(yīng)對[A];第31屆中國氣象學(xué)會年會S10 第四屆氣象服務(wù)發(fā)展論壇——提高水文氣象防災(zāi)減災(zāi)水平,推動氣象服務(wù)社會化發(fā)展[C];2014年
3 崔喬禮;邵淑娟;;國內(nèi)普通高校如何面對和利用“幕課(MOOC)”資源[A];遼寧省高等教育學(xué)會2013年學(xué)術(shù)年會暨第四屆中青年學(xué)者論壇論文摘要集[C];2013年
4 許南陽;馬鐵明;;試探MOOC促進教育國際化背景下的高等教育教學(xué)質(zhì)量保障[A];遼寧省高等教育學(xué)會2013年學(xué)術(shù)年會暨第四屆中青年學(xué)者論壇論文摘要集[C];2013年
相關(guān)重要報紙文章 前10條
1 本報記者 梓莖;用戶流失:一個不容忽視的問題[N];人民郵電;2003年
2 本報記者 席大偉;中電信手機用戶流失緩解 天翼彰顯發(fā)展后勁[N];通信信息報;2009年
3 中興通訊 曾志 楊毅;借助大數(shù)據(jù)盤活“存量市場”[N];通信產(chǎn)業(yè)報;2013年
4 ;用戶流失:帶號轉(zhuǎn)移政策的挑戰(zhàn)[N];人民郵電;2008年
5 ;NTTDoCoMo用戶流失加劇[N];人民郵電;2007年
6 李薇;防用戶流失,AT&T推出“免費通信”[N];新華每日電訊;2007年
7 本報記者 于偉;美國有線和衛(wèi)星電視用戶流失加快寬帶互聯(lián)網(wǎng)替代效應(yīng)凸顯[N];通信信息報;2011年
8 北京商報記者 李立勛;熱錢追捧的MOOC靠什么回應(yīng)質(zhì)疑[N];北京商報;2014年
9 李雷 穆童;焦作聯(lián)通建檔維系防用戶流失[N];人民郵電;2010年
10 本報記者 荊戈;從MOOC課程到一本大眾圖書[N];新華書目報;2014年
相關(guān)碩士學(xué)位論文 前10條
1 劉文彥;MOOC用戶流失率的統(tǒng)計建模和預(yù)測技術(shù)的研究[D];北京郵電大學(xué);2016年
2 張迪;移動游戲用戶流失因素分析[D];南京大學(xué);2016年
3 代曉菊;基于數(shù)據(jù)挖掘的電信LTE用戶上網(wǎng)數(shù)據(jù)的用戶流失算法研究[D];西南交通大學(xué);2016年
4 尹丹丹;移動通信網(wǎng)用戶流失預(yù)測[D];中國科學(xué)技術(shù)大學(xué);2016年
5 孔立佳;雙邊平臺應(yīng)對用戶流失問題的發(fā)展戰(zhàn)略研究[D];浙江師范大學(xué);2016年
6 鄭杰文;基于Spark平臺的通信網(wǎng)用戶流失預(yù)測研究[D];中國科學(xué)技術(shù)大學(xué);2017年
7 王娟;聯(lián)通某地市分公司用戶流失分析及對策研究[D];北京郵電大學(xué);2010年
8 曹潔;A電信分公司移動用戶流失分析與對策研究[D];山東大學(xué);2011年
9 劉道堅;MOOC教學(xué)模式研究[D];華南理工大學(xué);2015年
10 宋文;MOOC在我國高校本土化建設(shè)初探[D];中央民族大學(xué);2015年
,本文編號:1845471
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/1845471.html