電子商務(wù)環(huán)境中異常數(shù)據(jù)應(yīng)用研究
本文關(guān)鍵詞:電子商務(wù)環(huán)境中異常數(shù)據(jù)應(yīng)用研究,由筆耕文化傳播整理發(fā)布。
【摘要】:異常檢測(cè)作為數(shù)據(jù)挖掘的重要部分,其應(yīng)用不已僅僅是數(shù)據(jù)采集方面,在科學(xué)研究、股票、金融、保險(xiǎn)、電信和Internet等領(lǐng)域都有廣泛的應(yīng)用。網(wǎng)絡(luò)和電子商務(wù)的飛速發(fā)展,使得電子商務(wù)企業(yè)積累了大量的客戶資料,電子商務(wù)企業(yè)迫切需要從大量的數(shù)據(jù)中挖掘出企業(yè)急需的知識(shí)和信息,異常數(shù)據(jù)就是其中重要的一部分,對(duì)這些異常數(shù)據(jù)不夠重視或者視為錯(cuò)誤來(lái)處理,很可能會(huì)遺漏很多重要的信息,這些異常數(shù)據(jù)往往能為企業(yè)帶來(lái)大量的利潤(rùn)。本文圍繞電子商務(wù)環(huán)境下異常檢測(cè)的關(guān)鍵技術(shù)展開(kāi),主要論述異常檢測(cè)在電子商務(wù)領(lǐng)域的應(yīng)用,并以B公司為實(shí)例進(jìn)行實(shí)證研究,進(jìn)行電子商務(wù)環(huán)境下異常檢測(cè)在客戶關(guān)系管理中的應(yīng)用研究。主要包括以下幾點(diǎn): 1.對(duì)異常檢測(cè)的相關(guān)理論進(jìn)行了詳細(xì)的分析。本文對(duì)異常值、異常檢測(cè)進(jìn)行了概念界定,并對(duì)異常檢測(cè)定義和相關(guān)算法的國(guó)內(nèi)外研究現(xiàn)狀進(jìn)行了歸納和總結(jié),在比較各種算法的優(yōu)點(diǎn)和缺點(diǎn)后,最后選取基于距離的異常檢測(cè)算法作為本文實(shí)證部分的算法。 2.構(gòu)建了B網(wǎng)絡(luò)搜索公司的異?蛻魴z測(cè)指標(biāo)體系。設(shè)置了15個(gè)指標(biāo)從過(guò)去價(jià)值、當(dāng)前價(jià)值、潛在價(jià)值、行為日志數(shù)據(jù)、推廣方案數(shù)據(jù)幾個(gè)的方面反映客戶信息,,應(yīng)用因子分析法從指標(biāo)體系中篩選出影響客戶綜合得分的最重要的六個(gè)指標(biāo),這六個(gè)指標(biāo)也是影響客戶異常的最重要指標(biāo)。在分析異?蛻舫霈F(xiàn)異常原因的時(shí)候,結(jié)合實(shí)際證明本研究得到的這六個(gè)指標(biāo)的解釋力足夠。 3.選取了基于距離的異常檢測(cè)算法和因子分析法進(jìn)行實(shí)證分析。依據(jù)設(shè)計(jì)好的指標(biāo)體系,對(duì)B司的50個(gè)客戶進(jìn)行基于距離的異常檢測(cè),得到02、21、23和29四個(gè)異?蛻簟(yīng)用拉依達(dá)準(zhǔn)則對(duì)客戶主因子綜合得分進(jìn)行異常判定,所得結(jié)果與基于距離的異常檢測(cè)算法進(jìn)行對(duì)照,發(fā)現(xiàn)有21和23兩個(gè)客戶是相同的,而其他客戶結(jié)果不一致。 4.針對(duì)各個(gè)異常客戶進(jìn)行甄別和異常原因的分析,并制定相應(yīng)的管理和營(yíng)銷策略。對(duì)基于距離的異常檢測(cè)算法和因子分析法挖掘出的兩個(gè)異?蛻簦Y(jié)合實(shí)際情況進(jìn)行分析,找出導(dǎo)致異常的原因,根據(jù)這些原因制定相應(yīng)的應(yīng)對(duì)策略。對(duì)于兩種算法不一致的02、29個(gè)客戶,最后判定為異常客戶,確定基于距離的異常檢測(cè)解釋力更強(qiáng)。同時(shí),對(duì)得到主因子綜合得分較高的20、24客戶和綜合得分最低的14、16客戶進(jìn)行分析,經(jīng)過(guò)分析證明這四個(gè)客戶不是異常客戶,同時(shí)也給出了一些管理建議。
【關(guān)鍵詞】:電子商務(wù) 數(shù)據(jù)挖掘 異常檢測(cè) 因子分析
【學(xué)位授予單位】:蘭州交通大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2013
【分類號(hào)】:TP311.13
【目錄】:
- 摘要4-5
- Abstract5-9
- 1 緒論9-13
- 1.1 背景與意義9-11
- 1.1.1 背景9-10
- 1.1.2 電子商務(wù)環(huán)境下異常數(shù)據(jù)研究的意義10-11
- 1.2 論文的主要工作11-12
- 1.3 本文的章節(jié)設(shè)置12-13
- 2 異常檢測(cè)概述13-18
- 2.1 異常檢測(cè)的概念界定13-14
- 2.2 產(chǎn)生異常數(shù)據(jù)的原因14-15
- 2.3 異常檢測(cè)的電子商務(wù)應(yīng)用15-18
- 2.3.1 異常檢測(cè)在證券股票分析中的運(yùn)用15-16
- 2.3.2 異常檢測(cè)在電子商務(wù)欺詐中的運(yùn)用16
- 2.3.3 異常檢測(cè)在客戶關(guān)系管理中的運(yùn)用16-18
- 3 異常檢測(cè)算法研究綜述18-23
- 3.1 異常檢測(cè)建模方法18-19
- 3.1.1 對(duì)樣本集都進(jìn)行建模18
- 3.1.2 不依賴先驗(yàn)知識(shí)的建模方法18-19
- 3.1.3 依賴先驗(yàn)知識(shí)的建模方法19
- 3.2 異常檢測(cè)算法19-23
- 3.2.1 基于統(tǒng)計(jì)學(xué)原理的異常檢測(cè)算法19-20
- 3.2.2 基于密度的異常檢測(cè)算法20-21
- 3.2.3 基于距離的異常檢測(cè)算法21-22
- 3.2.4 基于聚類的異常檢測(cè)算法22
- 3.2.5 基于人工神經(jīng)網(wǎng)絡(luò)模型的異常檢測(cè)算法22-23
- 4 電子商務(wù)環(huán)境中算法的選擇與指標(biāo)設(shè)置23-31
- 4.1 異常檢測(cè)算法的選擇23-24
- 4.2 基于距離的異常檢測(cè)算法簡(jiǎn)介24-26
- 4.2.1 距離的度量24-25
- 4.2.2 基于距離的異常檢測(cè)算法的種類及描述25-26
- 4.3 拉依達(dá)準(zhǔn)則(3σ準(zhǔn)則)26-27
- 4.4 電子商務(wù)環(huán)境下異常檢測(cè)指標(biāo)體系的設(shè)計(jì)27-31
- 5 實(shí)證研究31-53
- 5.1 企業(yè)背景介紹31-32
- 5.2 采用基于距離的異常檢測(cè)算法的客戶關(guān)系管理應(yīng)用過(guò)程32-34
- 5.3 計(jì)算分析34-38
- 5.4 因子分析38-47
- 5.5 結(jié)果分析47-53
- 6 總結(jié)與展望53-54
- 6.1 總結(jié)53
- 6.2 展望和不足53-54
- 致謝54-55
- 參考文獻(xiàn)55-58
- 附錄 A 客戶數(shù)據(jù)58-61
- 攻讀學(xué)位期間的研究成果61
【共引文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 范進(jìn);;產(chǎn)業(yè)結(jié)構(gòu)對(duì)產(chǎn)業(yè)集群影響力的實(shí)證分析[J];安徽廣播電視大學(xué)學(xué)報(bào);2006年04期
2 于立紅;杜蕓;;數(shù)據(jù)挖掘中數(shù)據(jù)預(yù)處理方法與技術(shù)[J];安徽電子信息職業(yè)技術(shù)學(xué)院學(xué)報(bào);2009年04期
3 舒堅(jiān);鄭誠(chéng);陳振;;基于關(guān)聯(lián)分類方法的Web使用挖掘研究[J];安徽大學(xué)學(xué)報(bào)(自然科學(xué)版);2006年02期
4 唐超禮;魏圓圓;;基于數(shù)據(jù)挖掘的植保預(yù)測(cè)系統(tǒng)[J];安徽農(nóng)業(yè)科學(xué);2008年12期
5 劉秋生;吳小倩;;基于數(shù)據(jù)挖掘的固定資產(chǎn)投資效益評(píng)價(jià)[J];安徽農(nóng)業(yè)科學(xué);2011年11期
6 張友志;錢萌;程玉勝;;基于關(guān)聯(lián)規(guī)則web日志挖掘方法的研究[J];安慶師范學(xué)院學(xué)報(bào)(自然科學(xué)版);2006年01期
7 吳煥瑞,張紅霞;數(shù)據(jù)庫(kù)技術(shù)的新發(fā)展與新特點(diǎn)[J];保定師范專科學(xué)校學(xué)報(bào);2004年02期
8 高洪歌;趙會(huì)群;;關(guān)聯(lián)規(guī)則挖掘在乒乓球比賽技戰(zhàn)術(shù)分析中的應(yīng)用[J];北方工業(yè)大學(xué)學(xué)報(bào);2006年01期
9 賀巍巍;鄭力;高本河;;供應(yīng)商選擇多層次熵權(quán)綜合評(píng)價(jià)法研究[J];北京交通大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版);2007年03期
10 李燕琴;一種生態(tài)旅游者的識(shí)別與細(xì)分方法——以北京市百花山自然保護(hù)區(qū)為例[J];北京大學(xué)學(xué)報(bào)(自然科學(xué)版);2005年06期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前10條
1 楊青;劉曄;張東旭;劉暢;;快速查找最優(yōu)初始聚類數(shù)K的改進(jìn)K-means算法[A];中國(guó)自動(dòng)化學(xué)會(huì)控制理論專業(yè)委員會(huì)A卷[C];2011年
2 薛魯華;張楠;;聚類分析在Web數(shù)據(jù)挖掘中的應(yīng)用[A];北京市第十三次統(tǒng)計(jì)科學(xué)討論會(huì)論文選編[C];2006年
3 楊雯怡;鄭康鋒;楊義先;;一種自適應(yīng)的網(wǎng)絡(luò)安全防護(hù)方案[A];中國(guó)電子學(xué)會(huì)第十五屆信息論學(xué)術(shù)年會(huì)暨第一屆全國(guó)網(wǎng)絡(luò)編碼學(xué)術(shù)年會(huì)論文集(上冊(cè))[C];2008年
4 張宇;;基于XML的Web數(shù)據(jù)自動(dòng)挖掘[A];科技創(chuàng)新與節(jié)能減排——吉林省第五屆科學(xué)技術(shù)學(xué)術(shù)年會(huì)論文集(上冊(cè))[C];2008年
5 張秋彤;;數(shù)據(jù)挖掘與高校圖書(shū)館個(gè)性化信息服務(wù)[A];第九屆中國(guó)不確定系統(tǒng)年會(huì)、第五屆中國(guó)智能計(jì)算大會(huì)、第十三屆中國(guó)青年信息與管理學(xué)者大會(huì)論文集[C];2011年
6 丁信宙;仇環(huán);蘇曉慶;;基于云理論的缺損數(shù)據(jù)推理和預(yù)測(cè)[A];山東省測(cè)繪學(xué)術(shù)年會(huì)論文集[C];2006年
7 丁琳琳;孟軍;;豬肉價(jià)格風(fēng)險(xiǎn)預(yù)警模型的建立與應(yīng)用[A];畜牧業(yè)環(huán)境、生態(tài)、安全生產(chǎn)與管理——2010年家畜環(huán)境與生態(tài)學(xué)術(shù)研討會(huì)論文集[C];2010年
8 張艷;周國(guó)祥;;Web挖掘在個(gè)性化信息檢索中的應(yīng)用[A];計(jì)算機(jī)技術(shù)與應(yīng)用進(jìn)展·2007——全國(guó)第18屆計(jì)算機(jī)技術(shù)與應(yīng)用(CACIS)學(xué)術(shù)會(huì)議論文集[C];2007年
9 單科華;李郴;習(xí)穎慧;王飛;;煤炭企業(yè)投資決策系統(tǒng)的分析與研究[A];第18屆全國(guó)煤礦自動(dòng)化與信息化學(xué)術(shù)會(huì)議論文集[C];2008年
10 李林博;付忠廣;;基于決策樹(shù)和模糊邏輯的轉(zhuǎn)子振動(dòng)故障診斷系統(tǒng)[A];第十二屆全國(guó)設(shè)備故障診斷學(xué)術(shù)會(huì)議論文集[C];2010年
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 于翔;基于網(wǎng)格的數(shù)據(jù)流聚類方法研究[D];哈爾濱工程大學(xué);2010年
2 祁瑞華;不完整數(shù)據(jù)分類知識(shí)發(fā)現(xiàn)算法研究[D];大連理工大學(xué);2011年
3 郜巒;基于文獻(xiàn)分析的“肺與大腸相表里”證治規(guī)律及其關(guān)系研究[D];北京中醫(yī)藥大學(xué);2011年
4 盧又燃;放射科隨訪數(shù)據(jù)庫(kù)建立與粗糙集方法輔助診斷膠質(zhì)瘤分級(jí)的應(yīng)用分析[D];復(fù)旦大學(xué);2009年
5 金海浩;五行相生間接補(bǔ)法古代應(yīng)用規(guī)律研究[D];南京中醫(yī)藥大學(xué);2011年
6 楊瑞龍;基于短語(yǔ)特征的Web文檔聚類方法研究[D];重慶大學(xué);2010年
7 韓建光;企業(yè)財(cái)務(wù)困境預(yù)測(cè)動(dòng)態(tài)建模研究[D];哈爾濱工業(yè)大學(xué);2011年
8 雷震;隨機(jī)森林及其在遙感影像處理中應(yīng)用研究[D];上海交通大學(xué);2012年
9 劉丹紅;各類疾病住院患者危重度分級(jí)研究[D];中國(guó)人民解放軍第四軍醫(yī)大學(xué);2003年
10 周海燕;空間數(shù)據(jù)挖掘的研究[D];中國(guó)人民解放軍信息工程大學(xué);2003年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 王本超;基于KPCA與SVM的人臉識(shí)別研究[D];大連理工大學(xué);2010年
2 張進(jìn);我國(guó)施工勞動(dòng)生產(chǎn)率管理研究[D];大連理工大學(xué);2010年
3 劉美玲;基于綜合策略支持向量機(jī)的孤立點(diǎn)檢測(cè)技術(shù)[D];大連理工大學(xué);2010年
4 李仁良;決策樹(shù)算法在臨床診斷中的應(yīng)用研究[D];遼寧工程技術(shù)大學(xué);2009年
5 劉芳;改進(jìn)的蟻群聚類算法在森林火災(zāi)預(yù)測(cè)中的應(yīng)用研究[D];遼寧工程技術(shù)大學(xué);2009年
6 劉曉英;知識(shí)關(guān)聯(lián)及其應(yīng)用研究[D];湘潭大學(xué);2010年
7 劉巍;基于聚類的孤立點(diǎn)發(fā)現(xiàn)技術(shù)研究及其在審計(jì)中的應(yīng)用[D];中國(guó)海洋大學(xué);2010年
8 韓成勇;高校學(xué)評(píng)教決策支持系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[D];蘇州大學(xué);2010年
9 方少卿;Web就業(yè)信息抽取系統(tǒng)的實(shí)現(xiàn)研究[D];合肥工業(yè)大學(xué);2010年
10 年愛(ài)華;數(shù)據(jù)挖掘在職校普通話等級(jí)考試成績(jī)分析中的應(yīng)用[D];蘭州大學(xué);2010年
本文關(guān)鍵詞:電子商務(wù)環(huán)境中異常數(shù)據(jù)應(yīng)用研究,由筆耕文化傳播整理發(fā)布。
本文編號(hào):452257
本文鏈接:http://sikaile.net/jingjilunwen/dianzishangwulunwen/452257.html