基于統(tǒng)計學方法的互聯(lián)網企業(yè)運營指標異常值監(jiān)控及預警模型
發(fā)布時間:2017-12-25 16:26
本文關鍵詞:基于統(tǒng)計學方法的互聯(lián)網企業(yè)運營指標異常值監(jiān)控及預警模型 出處:《華東師范大學》2017年碩士論文 論文類型:學位論文
更多相關文章: 異常檢測 季節(jié)乘積ARIMA 局部異常因子 節(jié)假日模式識別
【摘要】:隨著互聯(lián)網電商的興起,越來越多的人使用互聯(lián)網購物。互聯(lián)網企業(yè)依托強大的計算機技術,每天會收集到龐大的用戶行為數(shù)據(jù)。對于互聯(lián)網企業(yè)運營團隊而言,數(shù)據(jù)爆炸帶來的困擾時刻影響著他們的決斷。本文站在互聯(lián)網企業(yè)運營團隊角度,把時間序列模型和均值-極差等統(tǒng)計技術用于異常值檢測及指標監(jiān)控。不同于金融行業(yè)欺詐模型以及醫(yī)學領域中的異常值甄別,本文主要關注點為企業(yè)級指標每天是否異于過去平均情況,若與過去平均狀況偏差較大則自動報警提示。本文首先使用正態(tài)分布的一元離群點檢驗方法、非參數(shù)分析的箱形圖和非監(jiān)督學習的局部異常因子法對訓練數(shù)據(jù)中的異常值做檢測,然后運用異常值同期均值或增長率趨勢進行插補,接著將配對T檢驗創(chuàng)造性地用于節(jié)假日模式識別,進而將訓練數(shù)據(jù)集分成節(jié)假日和非節(jié)假日。對于非節(jié)假日數(shù)據(jù),通過季節(jié)乘積ARIMA模型、三次指數(shù)平滑進行擬合并計算一期95%預測上下限,結合均值-極差質量監(jiān)控圖得出最終的預測值上下限。對于節(jié)假日數(shù)據(jù),通過研究節(jié)假日真實數(shù)據(jù)與季節(jié)乘積ARIMA模型預測值之差所形成的序列,運用傅立葉譜分析進行擬合。最后將非節(jié)假日時期模型和節(jié)假日時期模型通過示性函數(shù)累加,得出該指標在整個時期的預測模型。若某指標當天數(shù)值超出了預測上下限則顯示異常。實證分析中,本文重點分析某互聯(lián)網旅游企業(yè)轉化率指標。通過配對T檢驗得出該指標在國慶節(jié)前12天至節(jié)后6天具有明顯的節(jié)假日效應,其模式為節(jié)前升高、節(jié)中降低、節(jié)后又升高的"U"型效應。通過異常點檢測技術找出了 5個訓練數(shù)據(jù)集中的異常點,并進行有效地插值,通過業(yè)務實踐證明其插值效果和真實情況非常接近。隨后建立了季節(jié)乘積ARIMA模型和三次指數(shù)平滑模型,通過樣本內(外)均方誤最終選用了季節(jié)乘積ARIMA模型,結合均值-極差質量監(jiān)控圖得到了非節(jié)假日預測模型,樣本外均方誤為7.78E-8。最后對國慶節(jié)影響數(shù)值研究,得到了雙周期傅立葉譜分析模型。運用示性函數(shù)整合兩部分得出最終的監(jiān)控模型。通過實證分析和實際工作應用,異常值識別率在三個月內接近100%,有效地解決了實際工作中的現(xiàn)實問題。
【學位授予單位】:華東師范大學
【學位級別】:碩士
【學位授予年份】:2017
【分類號】:F224;F49
【參考文獻】
相關期刊論文 前5條
1 韓曉龍;;基于Holt-Winters方法對GDP水平預測方法的比較[J];企業(yè)導報;2015年05期
2 徐婷;李選海;郭昶;;ARIMA乘積季節(jié)模型對我國消費者信心指數(shù)的分析[J];科技信息;2012年19期
3 王駿;王士同;鄧趙紅;;聚類分析研究中的若干問題[J];控制與決策;2012年03期
4 張衛(wèi)旭;尉宇;;基于密度的局部離群點檢測算法[J];計算機與數(shù)字工程;2010年10期
5 章曉;;時間序列異常值影響估計的探討[J];山東師范大學學報(自然科學版);2009年01期
相關碩士學位論文 前1條
1 甘宏;季節(jié)時間序列的方法研究及實證分析[D];電子科技大學;2011年
,本文編號:1333570
本文鏈接:http://sikaile.net/shoufeilunwen/benkebiyelunwen/1333570.html