數(shù)據(jù)挖掘在智能手機(jī)銷售數(shù)據(jù)中的應(yīng)用
發(fā)布時間:2021-04-25 23:13
手機(jī)作為目前人們使用最多的電子設(shè)備,一方面既承擔(dān)著網(wǎng)絡(luò)購物的終端作用,另一方面,本身也是消費人群最多的商品之一,現(xiàn)在社會幾乎是人手一部。目前來看,手機(jī)還同時有逐漸取代傳統(tǒng)錢包以及銀行卡的趨勢。每年都有大量的各式各樣的手機(jī)通過線上渠道或者實體店被銷售出去,然而不同的手機(jī)商品銷量卻是大不相同,這其中影響手機(jī)銷量的因素有哪些呢?這是銷售手機(jī)的商家十分關(guān)注的問題,也正是本文要研究的問題。本文首先簡單介紹了網(wǎng)絡(luò)爬蟲,利用網(wǎng)絡(luò)爬蟲從某大型電商網(wǎng)站爬取所有在架銷售手機(jī)的詳細(xì)信息,包括各種參數(shù)配置信息以及銷量,評論數(shù)等等,其次對數(shù)據(jù)進(jìn)行清洗,提取各種字段用于后續(xù)建模分析。通過特征信息度以及Spearman相關(guān)系數(shù)對影響手機(jī)銷量水平的因素進(jìn)行了相關(guān)分析。為了預(yù)測一款特定手機(jī)商品的銷量水平情況,根據(jù)數(shù)據(jù)的特點,文中分別利用決策樹算法,Bagging算法,隨機(jī)森林算法三種機(jī)器學(xué)習(xí)方法進(jìn)行建模分析,并利用交叉驗證以及網(wǎng)格搜索選取隨機(jī)森林模型最優(yōu)的超參數(shù)。最后對各種算法的結(jié)果進(jìn)行比較發(fā)現(xiàn),基于決策樹的集成算法隨機(jī)森林算法要優(yōu)于其它兩種算法。當(dāng)選取合適的超參數(shù)后,隨機(jī)森林算法的結(jié)果明顯好于使用其默認(rèn)參數(shù)的結(jié)果,并...
【文章來源】:北京工業(yè)大學(xué)北京市 211工程院校
【文章頁數(shù)】:52 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 選題背景
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 國內(nèi)研究現(xiàn)狀
1.2.2 國外研究現(xiàn)狀
1.3 論文研究內(nèi)容
第2章 網(wǎng)絡(luò)爬蟲介紹以及數(shù)據(jù)抓取
2.1 網(wǎng)絡(luò)爬蟲介紹以及論文數(shù)據(jù)來源
2.1.1 網(wǎng)絡(luò)爬蟲介紹
2.1.2 論文數(shù)據(jù)
2.2 本文中使用的三個網(wǎng)絡(luò)爬蟲
2.2.1 爬蟲一號介紹
2.2.2 爬蟲二號介紹
2.2.3 爬蟲三號介紹
2.3 本章小結(jié)
第3章 數(shù)據(jù)清洗轉(zhuǎn)換
3.1 數(shù)據(jù)質(zhì)量檢查以及修正
3.2 衍生特征構(gòu)造
3.2.1 手機(jī)支持網(wǎng)絡(luò)類型
3.2.2 評論比率
3.2.3 官方店鋪
3.2.4 累計銷售天數(shù)
3.3 分類變量編碼
3.3.1 二水平分類變量編碼
3.3.2 多水平分類變量編碼
3.4 連續(xù)變量信息提取
3.5 本章小結(jié)
第4章 手機(jī)銷量水平的影響因素分析及預(yù)測建模
4.1 手機(jī)銷量水平的影響因素分析
4.1.1 手機(jī)月平均銷量的分布情況
4.1.2 手機(jī)月平均銷量的影響因素
4.2 預(yù)測建模的相關(guān)算法原理介紹
4.2.1 決策樹算法原理介紹
4.2.2 工具箱sklearn中實現(xiàn)的決策樹算法
4.2.3 集成算法原理介紹
4.2.4 評價標(biāo)準(zhǔn)
4.3 手機(jī)銷量水平的預(yù)測建模
4.3.1 基于決策樹構(gòu)建預(yù)測模型
4.3.2 基于集成算法構(gòu)建預(yù)測模型
4.4 本章小結(jié)
結(jié)論
參考文獻(xiàn)
致謝
【參考文獻(xiàn)】:
期刊論文
[1]基于隨機(jī)森林回歸算法的感應(yīng)電機(jī)驅(qū)動控制[J]. 彭喜英,李博文. 電氣傳動. 2018(06)
[2]基于網(wǎng)絡(luò)爬蟲的京東電商平臺數(shù)據(jù)分析[J]. 魏倩男,賀正楚,陳一鳴. 經(jīng)濟(jì)數(shù)學(xué). 2018(01)
[3]基于Python的電商書籍?dāng)?shù)據(jù)爬蟲研究[J]. 晉振杰,曹少中,項宏峰,王明道,李新佩. 北京印刷學(xué)院學(xué)報. 2018(03)
[4]基于Python的Web信息獲取方法研究[J]. 魏冬梅,何忠秀,唐建梅. 軟件導(dǎo)刊. 2018(01)
[5]基于指數(shù)平滑與回歸分析的手機(jī)銷量預(yù)測研究[J]. 孫威,代明君. 牡丹江師范學(xué)院學(xué)報(自然科學(xué)版). 2017(04)
[6]基于Selenium的Python網(wǎng)絡(luò)爬蟲的實現(xiàn)[J]. 花君林. 電腦編程技巧與維護(hù). 2017(15)
[7]基于爬蟲的低價折扣推薦系統(tǒng)設(shè)計與實現(xiàn)[J]. 鄭志越. 信息與電腦(理論版). 2016(19)
[8]網(wǎng)絡(luò)爬蟲的設(shè)計與實現(xiàn)[J]. 董日壯,郭曙超. 電腦知識與技術(shù). 2014(17)
[9]基于隨機(jī)森林的特征選擇算法[J]. 姚登舉,楊靜,詹曉娟. 吉林大學(xué)學(xué)報(工學(xué)版). 2014(01)
[10]基于品牌手機(jī)未來銷量預(yù)測[J]. 陳紅周,劉碧玉,李學(xué)全. 數(shù)學(xué)理論與應(yīng)用. 2009(03)
碩士論文
[1]手機(jī)銷量影響因素分析及預(yù)測研究[D]. 唐楚.湖南大學(xué) 2017
[2]iPhone在華銷量影響因素研究[D]. 鄭雅微.湖南大學(xué) 2017
[3]基于數(shù)據(jù)挖掘的銷售預(yù)測研究[D]. 杜新武.山東輕工業(yè)學(xué)院 2011
本文編號:3160261
【文章來源】:北京工業(yè)大學(xué)北京市 211工程院校
【文章頁數(shù)】:52 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 選題背景
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 國內(nèi)研究現(xiàn)狀
1.2.2 國外研究現(xiàn)狀
1.3 論文研究內(nèi)容
第2章 網(wǎng)絡(luò)爬蟲介紹以及數(shù)據(jù)抓取
2.1 網(wǎng)絡(luò)爬蟲介紹以及論文數(shù)據(jù)來源
2.1.1 網(wǎng)絡(luò)爬蟲介紹
2.1.2 論文數(shù)據(jù)
2.2 本文中使用的三個網(wǎng)絡(luò)爬蟲
2.2.1 爬蟲一號介紹
2.2.2 爬蟲二號介紹
2.2.3 爬蟲三號介紹
2.3 本章小結(jié)
第3章 數(shù)據(jù)清洗轉(zhuǎn)換
3.1 數(shù)據(jù)質(zhì)量檢查以及修正
3.2 衍生特征構(gòu)造
3.2.1 手機(jī)支持網(wǎng)絡(luò)類型
3.2.2 評論比率
3.2.3 官方店鋪
3.2.4 累計銷售天數(shù)
3.3 分類變量編碼
3.3.1 二水平分類變量編碼
3.3.2 多水平分類變量編碼
3.4 連續(xù)變量信息提取
3.5 本章小結(jié)
第4章 手機(jī)銷量水平的影響因素分析及預(yù)測建模
4.1 手機(jī)銷量水平的影響因素分析
4.1.1 手機(jī)月平均銷量的分布情況
4.1.2 手機(jī)月平均銷量的影響因素
4.2 預(yù)測建模的相關(guān)算法原理介紹
4.2.1 決策樹算法原理介紹
4.2.2 工具箱sklearn中實現(xiàn)的決策樹算法
4.2.3 集成算法原理介紹
4.2.4 評價標(biāo)準(zhǔn)
4.3 手機(jī)銷量水平的預(yù)測建模
4.3.1 基于決策樹構(gòu)建預(yù)測模型
4.3.2 基于集成算法構(gòu)建預(yù)測模型
4.4 本章小結(jié)
結(jié)論
參考文獻(xiàn)
致謝
【參考文獻(xiàn)】:
期刊論文
[1]基于隨機(jī)森林回歸算法的感應(yīng)電機(jī)驅(qū)動控制[J]. 彭喜英,李博文. 電氣傳動. 2018(06)
[2]基于網(wǎng)絡(luò)爬蟲的京東電商平臺數(shù)據(jù)分析[J]. 魏倩男,賀正楚,陳一鳴. 經(jīng)濟(jì)數(shù)學(xué). 2018(01)
[3]基于Python的電商書籍?dāng)?shù)據(jù)爬蟲研究[J]. 晉振杰,曹少中,項宏峰,王明道,李新佩. 北京印刷學(xué)院學(xué)報. 2018(03)
[4]基于Python的Web信息獲取方法研究[J]. 魏冬梅,何忠秀,唐建梅. 軟件導(dǎo)刊. 2018(01)
[5]基于指數(shù)平滑與回歸分析的手機(jī)銷量預(yù)測研究[J]. 孫威,代明君. 牡丹江師范學(xué)院學(xué)報(自然科學(xué)版). 2017(04)
[6]基于Selenium的Python網(wǎng)絡(luò)爬蟲的實現(xiàn)[J]. 花君林. 電腦編程技巧與維護(hù). 2017(15)
[7]基于爬蟲的低價折扣推薦系統(tǒng)設(shè)計與實現(xiàn)[J]. 鄭志越. 信息與電腦(理論版). 2016(19)
[8]網(wǎng)絡(luò)爬蟲的設(shè)計與實現(xiàn)[J]. 董日壯,郭曙超. 電腦知識與技術(shù). 2014(17)
[9]基于隨機(jī)森林的特征選擇算法[J]. 姚登舉,楊靜,詹曉娟. 吉林大學(xué)學(xué)報(工學(xué)版). 2014(01)
[10]基于品牌手機(jī)未來銷量預(yù)測[J]. 陳紅周,劉碧玉,李學(xué)全. 數(shù)學(xué)理論與應(yīng)用. 2009(03)
碩士論文
[1]手機(jī)銷量影響因素分析及預(yù)測研究[D]. 唐楚.湖南大學(xué) 2017
[2]iPhone在華銷量影響因素研究[D]. 鄭雅微.湖南大學(xué) 2017
[3]基于數(shù)據(jù)挖掘的銷售預(yù)測研究[D]. 杜新武.山東輕工業(yè)學(xué)院 2011
本文編號:3160261
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3160261.html
最近更新
教材專著