多種數(shù)據(jù)挖掘技術(shù)對于電子商務(wù)分類問題研究
本文關(guān)鍵詞:多種數(shù)據(jù)挖掘技術(shù)對于電子商務(wù)分類問題研究
更多相關(guān)文章: 數(shù)據(jù)挖掘 電子商務(wù) 分類模型
【摘要】:電子商務(wù)行業(yè)競爭激烈,數(shù)據(jù)的價(jià)值正日益受到市場的重視。然而,相關(guān)統(tǒng)計(jì)工具僅提供統(tǒng)計(jì)信息、統(tǒng)計(jì)模型和假設(shè)檢驗(yàn)結(jié)論,仍缺乏對數(shù)據(jù)空間的細(xì)節(jié)認(rèn)知。而數(shù)據(jù)挖掘技術(shù)正是從數(shù)據(jù)空間和信息論的角度對數(shù)據(jù)進(jìn)行分析,給出宏觀與微觀的數(shù)據(jù)結(jié)構(gòu)特征,并利用這些特征幫助對未分類數(shù)據(jù)進(jìn)行預(yù)測。不同領(lǐng)域的數(shù)據(jù)具有不同的分布特征,且名義屬性、數(shù)值屬性的分類效率是截然不同的,這使得傳統(tǒng)分類器只適用于特定的場合。普適優(yōu)化的分類器模型需要在克服以上困難的同時(shí),利用盡可能多的信息對一個(gè)分類問題進(jìn)行建模,以統(tǒng)一的方法和流程提供數(shù)據(jù)空間的特征知識(shí),提升預(yù)測性能水平。考慮到電子商務(wù)數(shù)據(jù)集的數(shù)據(jù)量一般較大,分類器應(yīng)盡量分散計(jì)算負(fù)擔(dān),以提高訓(xùn)練和預(yù)測計(jì)算速度。同時(shí),電子商務(wù)的數(shù)據(jù)具有分布式,流量大等特點(diǎn),其數(shù)據(jù)需要被有效整合并理解,以促進(jìn)企業(yè)的發(fā)展。本文對數(shù)據(jù)挖掘相關(guān)技術(shù)進(jìn)行了分析,指出現(xiàn)有技術(shù)存在的不足,如對數(shù)據(jù)類型,尺度和結(jié)構(gòu)限制較多,且分類模型并非普適,對大型數(shù)據(jù)運(yùn)算較慢等。本文描述了產(chǎn)生上述不足的原因,在改進(jìn)現(xiàn)有挖掘技術(shù)的基礎(chǔ)上,提出針對電子商務(wù)數(shù)據(jù)分布特點(diǎn)的新模型,并給出實(shí)驗(yàn)結(jié)果和模型的加速性能,通過和現(xiàn)有模型的對比,論證該模型方案的有效性和優(yōu)越性,同時(shí),明確相關(guān)指標(biāo)閥值的重要性。
【關(guān)鍵詞】:數(shù)據(jù)挖掘 電子商務(wù) 分類模型
【學(xué)位授予單位】:復(fù)旦大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2013
【分類號】:TP311.13
【目錄】:
- 摘要5-6
- Abstract6-7
- 第一章 引言7-10
- 1.1 研究背景7-8
- 1.2 本文貢獻(xiàn)8-9
- 1.3 本文結(jié)構(gòu)9-10
- 第二章 預(yù)備知識(shí)及定義10-12
- 2.1 屬性分類10
- 2.2 數(shù)據(jù)預(yù)處理10-11
- 2.3 數(shù)據(jù)分群11-12
- 第三章 數(shù)據(jù)挖掘算法分析12-30
- 3.1 聚類12-16
- 3.1.1 基于中心聚類12-13
- 3.1.2 基于密度聚類及可視化改進(jìn)13-15
- 3.1.3 聚類評價(jià)指標(biāo)15-16
- 3.2 非線性分類器16-30
- 3.2.1 決策樹16-18
- 3.2.2 神經(jīng)網(wǎng)絡(luò)及算法改進(jìn)18-23
- 3.2.3 神經(jīng)網(wǎng)絡(luò)堆疊泛化及算法改進(jìn)23-24
- 3.2.4 高斯過程24-29
- 3.2.5 預(yù)測準(zhǔn)確度定義29-30
- 第四章 電子商務(wù)分類優(yōu)化整合模型設(shè)計(jì)30-43
- 4.1 聚類算法特性分析30-32
- 4.2 非線性分類器特性分析32-34
- 4.3 模型設(shè)計(jì)方案34-41
- 4.3.1 模型設(shè)計(jì)思路34-37
- 4.3.2 模型訓(xùn)練37-39
- 4.3.3 模型預(yù)測39-41
- 4.3.4 模型準(zhǔn)確度定義41
- 4.4 G-KM-NC模型綜述41-43
- 第五章 模型性能分析43-63
- 5.1 實(shí)驗(yàn)1,互聯(lián)網(wǎng)廣告43-53
- 5.1.1 性能基線44
- 5.1.2 分群44-49
- 5.1.3 分群+聚類49-52
- 5.1.4 加速52
- 5.1.5 小結(jié)52-53
- 5.2 實(shí)驗(yàn)2,小額信貸審批53-61
- 5.2.1 性能基線55
- 5.2.2 分群55-57
- 5.2.3 分群+聚類57-59
- 5.2.4 加速59-60
- 5.2.5 小結(jié)60-61
- 5.3 模型性能綜述61-63
- 第六章 總結(jié)63-64
- 參考文獻(xiàn)64-68
- 致謝68-69
- 碩士期間發(fā)表的論文69-70
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 張紅軍;談?wù)剶?shù)據(jù)挖掘技術(shù)及其應(yīng)用[J];廣西梧州師范高等?茖W(xué)校學(xué)報(bào);2003年03期
2 楊雪;淺析數(shù)據(jù)挖掘技術(shù)[J];華南金融電腦;2005年08期
3 李繼嵬;劉書明;李春平;;數(shù)據(jù)挖掘技術(shù)在稅收預(yù)測分析中的應(yīng)用[J];計(jì)算機(jī)系統(tǒng)應(yīng)用;2006年09期
4 劉春明;;數(shù)據(jù)挖掘技術(shù)在金融行業(yè)中的應(yīng)用[J];科技資訊;2006年25期
5 勞飛;朱玉業(yè);;數(shù)據(jù)挖掘技術(shù)在農(nóng)業(yè)中的應(yīng)用[J];安徽農(nóng)業(yè)科學(xué);2007年13期
6 何樹稱;羅嵐;;數(shù)據(jù)挖掘技術(shù)在客戶獲取中的應(yīng)用分析[J];保山師專學(xué)報(bào);2007年02期
7 汪楠;成鷹;崔婀娜;;數(shù)據(jù)挖掘技術(shù)怎么用[J];經(jīng)營與管理;2007年07期
8 馬騁;;數(shù)據(jù)挖掘技術(shù)探討[J];化工之友;2007年17期
9 趙穎;;數(shù)據(jù)挖掘技術(shù)在政府電子政務(wù)中的應(yīng)用[J];軟件導(dǎo)刊;2008年11期
10 徐曉偉;;淺談數(shù)據(jù)挖掘技術(shù)[J];福建電腦;2008年12期
中國重要會(huì)議論文全文數(shù)據(jù)庫 前10條
1 孫義明;曾繼東;;數(shù)據(jù)挖掘技術(shù)及其應(yīng)用[A];全國計(jì)算機(jī)安全學(xué)術(shù)交流會(huì)論文集(第二十二卷)[C];2007年
2 馬洪杰;曲曉飛;;數(shù)據(jù)挖掘技術(shù)和過程的特點(diǎn)[A];面向21世紀(jì)的科技進(jìn)步與社會(huì)經(jīng)濟(jì)發(fā)展(上冊)[C];1999年
3 寧紅梅;安志興;葛亞明;李敬璽;趙坤;鐘華;陳俊杰;崔艷紅;;數(shù)據(jù)挖掘技術(shù)在獸醫(yī)學(xué)中的應(yīng)用[A];Proceedings of 2010 National Vocational Education of Communications and Information Technology Conference (2010 NVCIC)[C];2010年
4 王桂芹;黃道;;數(shù)據(jù)挖掘技術(shù)綜述[A];計(jì)算機(jī)技術(shù)與應(yīng)用進(jìn)展·2007——全國第18屆計(jì)算機(jī)技術(shù)與應(yīng)用(CACIS)學(xué)術(shù)會(huì)議論文集[C];2007年
5 徐寶蓮;李曉奇;;數(shù)據(jù)挖掘技術(shù)在網(wǎng)絡(luò)游戲中的應(yīng)用[A];第十一屆中國不確定系統(tǒng)年會(huì)、第十五屆中國青年信息與管理學(xué)者大會(huì)論文集[C];2013年
6 胡廣芹;陸小左;;數(shù)據(jù)挖掘技術(shù)在中醫(yī)診斷中的應(yīng)用[A];中國中西醫(yī)結(jié)合學(xué)會(huì)診斷專業(yè)委員會(huì)2009’年會(huì)論文集[C];2009年
7 戈欣;吳曉芬;許建榮;;數(shù)據(jù)挖掘技術(shù)在放射科醫(yī)療管理中的潛在作用[A];2009中華醫(yī)學(xué)會(huì)影像技術(shù)分會(huì)第十七次全國學(xué)術(shù)大會(huì)論文集[C];2009年
8 鐵軍;吳智明;;數(shù)據(jù)挖掘技術(shù)在工業(yè)鋁電解生產(chǎn)中的應(yīng)用[A];第十九屆全國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2002年
9 王建華;王菲;黃國建;;數(shù)據(jù)挖掘技術(shù)研究的現(xiàn)狀及展望[A];中國運(yùn)籌學(xué)會(huì)第六屆學(xué)術(shù)交流會(huì)論文集(上卷)[C];2000年
10 肖健華;吳今培;;數(shù)據(jù)挖掘技術(shù)及其應(yīng)用實(shí)例[A];2001年中國智能自動(dòng)化會(huì)議論文集(下冊)[C];2001年
中國重要報(bào)紙全文數(shù)據(jù)庫 前10條
1 記者 呂賢如;大力加強(qiáng)數(shù)據(jù)挖掘技術(shù)研究應(yīng)用[N];光明日報(bào);2006年
2 主持人 李禾;數(shù)據(jù)挖掘技術(shù)如何驅(qū)動(dòng)經(jīng)濟(jì)車輪[N];科技日報(bào);2007年
3 梅靜彥;數(shù)據(jù)挖掘技術(shù)在美國銀行的應(yīng)用[N];金融時(shí)報(bào);2006年
4 鄒廣普;數(shù)據(jù)挖掘技術(shù)在保險(xiǎn)業(yè)中的應(yīng)用[N];中國保險(xiǎn)報(bào);2010年
5 陳曉 山西財(cái)經(jīng)大學(xué)教師;數(shù)據(jù)挖掘技術(shù)在高校教學(xué)管理中的應(yīng)用[N];山西經(jīng)濟(jì)日報(bào);2010年
6 張崇峰;挖掘,再挖掘[N];中國計(jì)算機(jī)報(bào);2003年
7 劉紅巖、何軍;利用數(shù)據(jù)挖掘技術(shù)獲得商業(yè)智能[N];中國計(jì)算機(jī)報(bào);2003年
8 ;IBM公司推出新型數(shù)據(jù)挖掘技術(shù)[N];中國高新技術(shù)產(chǎn)業(yè)導(dǎo)報(bào);2001年
9 劉軍 蘭小紅 龔富強(qiáng);新技術(shù)為老裝備“保駕護(hù)航”[N];大眾科技報(bào);2006年
10 ;軟件產(chǎn)業(yè)人才培養(yǎng)又辟新路[N];中國高新技術(shù)產(chǎn)業(yè)導(dǎo)報(bào);2000年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 姚山;基于數(shù)據(jù)挖掘技術(shù)的造林決策研究[D];北京林業(yè)大學(xué);2008年
2 曹秀英;基于粗集的數(shù)據(jù)挖掘技術(shù)及其應(yīng)用研究[D];哈爾濱工程大學(xué);2003年
3 伍平陽;基于數(shù)據(jù)挖掘技術(shù)的醫(yī)療設(shè)備績效預(yù)測方法的應(yīng)用研究[D];南方醫(yī)科大學(xué);2008年
4 劉剛;數(shù)據(jù)挖掘技術(shù)與分類算法研究[D];中國人民解放軍信息工程大學(xué);2004年
5 王勇;時(shí)序數(shù)據(jù)挖掘技術(shù)及其在水質(zhì)預(yù)測中的應(yīng)用研究[D];廣東工業(yè)大學(xué);2005年
6 毛國君;數(shù)據(jù)挖掘技術(shù)與關(guān)聯(lián)規(guī)則挖掘算法研究[D];北京工業(yè)大學(xué);2003年
7 熊忠陽;面向商業(yè)智能的并行數(shù)據(jù)挖掘技術(shù)及應(yīng)用研究[D];重慶大學(xué);2004年
8 朱恒民;領(lǐng)域知識(shí)制導(dǎo)的數(shù)據(jù)挖掘技術(shù)及其在中藥提取中的應(yīng)用[D];南京航空航天大學(xué);2006年
9 王萍;基于數(shù)據(jù)挖掘技術(shù)的消費(fèi)者行為研究[D];吉林大學(xué);2004年
10 白一鳴;基于數(shù)據(jù)挖掘技術(shù)的模糊推理系統(tǒng)設(shè)計(jì)[D];大連海事大學(xué);2013年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 吳輝;數(shù)據(jù)挖掘技術(shù)的研究與應(yīng)用[D];武漢理工大學(xué);2009年
2 馮璐;基于數(shù)據(jù)挖掘技術(shù)的犯罪規(guī)律分析研究[D];青島大學(xué);2009年
3 郭珉江;數(shù)據(jù)挖掘技術(shù)在疾病診斷相關(guān)分組中的應(yīng)用[D];中南大學(xué);2009年
4 倪泉;基于數(shù)據(jù)挖掘技術(shù)的保險(xiǎn)續(xù)期催交方法研究[D];華東師范大學(xué);2006年
5 張晨希;數(shù)據(jù)挖掘技術(shù)在股票預(yù)測中的應(yīng)用[D];安徽大學(xué);2006年
6 安建華;數(shù)據(jù)挖掘技術(shù)在零售業(yè)中的應(yīng)用研究[D];東北財(cái)經(jīng)大學(xué);2005年
7 沈捷;數(shù)據(jù)挖掘技術(shù)在銀行反洗錢領(lǐng)域中的應(yīng)用研究[D];浙江大學(xué);2007年
8 賈琳;數(shù)據(jù)挖掘技術(shù)及應(yīng)用的研究[D];蘭州理工大學(xué);2003年
9 許惠君;數(shù)據(jù)挖掘技術(shù)及其在徑流預(yù)報(bào)中的研究與應(yīng)用[D];華中科技大學(xué);2006年
10 張颯;數(shù)據(jù)挖掘技術(shù)在銀行監(jiān)管工作中的應(yīng)用[D];吉林大學(xué);2007年
,本文編號:1097380
本文鏈接:http://sikaile.net/jingjilunwen/dianzishangwulunwen/1097380.html