基于Hadoop的數(shù)據(jù)挖掘算法在葡萄酒信息數(shù)據(jù)分析系統(tǒng)中的應(yīng)用
本文選題:Hadoop 切入點(diǎn):數(shù)據(jù)挖據(jù)算法 出處:《計(jì)算機(jī)應(yīng)用》2017年S1期 論文類型:期刊論文
【摘要】:針對寧夏賀蘭山東麓葡萄酒莊在銷售自產(chǎn)葡萄酒的過程中存在葡萄酒信息數(shù)據(jù)分析不準(zhǔn)確、銷售渠道窄、銷售信息更新慢、銷量不高等問題,提出了一種基于Hadoop分布式框架的數(shù)據(jù)挖掘算法,對極大量的葡萄酒信息數(shù)據(jù)分析系統(tǒng)的數(shù)據(jù)進(jìn)行采集、分析,并根據(jù)分析結(jié)果為用戶推薦適合其口味的葡萄酒飲品。該系統(tǒng)以寧夏賀蘭山東麓葡萄酒莊為實(shí)驗(yàn)基地,自主開發(fā)葡萄酒信息數(shù)據(jù)分析系統(tǒng),并利用數(shù)據(jù)挖據(jù)算法中的聚類算法K-means算法和分類算法中的C4.5算法進(jìn)行數(shù)據(jù)挖據(jù);其中針對聚類算法中的K-means算法和分類算法中的C4.5算法實(shí)現(xiàn)分布式研究,實(shí)現(xiàn)了基于Map Reduce的分布式聚類和分類算法,并且在此基礎(chǔ)上對其各自的缺點(diǎn)進(jìn)行相應(yīng)的改進(jìn)。實(shí)驗(yàn)證明了基于Hadoop框架的數(shù)據(jù)挖掘算法在算法的穩(wěn)定性和準(zhǔn)確率上均有很好的提升,并且可以對葡萄酒信息數(shù)據(jù)分析系統(tǒng)的海量數(shù)據(jù)進(jìn)行很好的處理。
[Abstract]:In view of the problems of inaccurate analysis of wine information data, narrow sales channels, slow updating of sales information and low sales volume in the process of selling wine from the eastern foothills of Helan Mountain in Ningxia, the wine farms have some problems, such as inaccurate analysis of wine information data, narrow sales channels, and so on. A data mining algorithm based on Hadoop distributed framework is proposed to collect and analyze the data of a large number of wine information data analysis system. Based on the results of the analysis, the authors recommend the wine drinks suitable for their taste. The system takes the eastern foothills of Helan Mountain in Ningxia as the experimental base and independently develops the wine information and data analysis system. The data mining algorithm is based on the clustering algorithm (K-means) and the classification algorithm (C4.5), in which the K-means algorithm and the C4.5 algorithm of the clustering algorithm are used to realize the distributed research. The distributed clustering and classification algorithm based on Map Reduce is implemented. On the basis of this, the corresponding improvement is made on their respective shortcomings. The experiment proves that the data mining algorithm based on Hadoop framework has a good improvement in the stability and accuracy of the algorithm. And the wine information data analysis system can do a good deal with the massive data.
【作者單位】: 寧夏大學(xué)信息工程學(xué)院;
【基金】:寧夏大學(xué)研究生創(chuàng)新項(xiàng)目(GIP201625)
【分類號】:F426.82;TP311.13
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 李磊;;黑龍江郵政數(shù)據(jù)分析系統(tǒng)研究[J];林業(yè)科技情報(bào);2011年04期
2 陳起榕;陳新亮;曹世彪;;一種新的數(shù)據(jù)分析系統(tǒng)前端展示方案[J];郵電設(shè)計(jì)技術(shù);2012年10期
3 孟慶超;李永亮;;智能數(shù)據(jù)分析系統(tǒng)研究[J];現(xiàn)代商貿(mào)工業(yè);2008年11期
4 郭靜;;鋼鐵企業(yè)能源數(shù)據(jù)分析系統(tǒng)的構(gòu)建[J];昆明理工大學(xué)學(xué)報(bào)(理工版);2009年05期
5 哈文雷;;基于云計(jì)算的油田數(shù)據(jù)分析系統(tǒng)[J];中國新技術(shù)新產(chǎn)品;2013年17期
6 黃麗麗;陳華輝;;博客數(shù)據(jù)分析系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J];寧波大學(xué)學(xué)報(bào)(理工版);2008年03期
7 田月潔;焦波;謝金洲;;中藥不良反應(yīng)數(shù)據(jù)分析系統(tǒng)的設(shè)計(jì)與應(yīng)用[J];中國藥物警戒;2007年04期
8 毛蘭斌;;基于機(jī)電結(jié)構(gòu)檢測的可靠性數(shù)據(jù)分析系統(tǒng)設(shè)計(jì)[J];中國高新技術(shù)企業(yè);2008年08期
9 毛羽芳;王銳明;;天津市工商行政管理局?jǐn)?shù)據(jù)分析系統(tǒng)的建設(shè)[J];信息系統(tǒng)工程;2010年07期
10 章璐;;人民幣跨境結(jié)算業(yè)務(wù)數(shù)據(jù)分析系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J];中國金融電腦;2013年01期
相關(guān)會議論文 前7條
1 顧紅生;;淺談汽車行業(yè)競品數(shù)據(jù)分析系統(tǒng)解決方案[A];第八屆中國汽車設(shè)計(jì)與研發(fā)高峰論壇論文集[C];2013年
2 辛建峰;辛陽;;數(shù)據(jù)分析系統(tǒng)中的自定義量度方案設(shè)計(jì)實(shí)現(xiàn)[A];2011年通信與信息技術(shù)新進(jìn)展——第八屆中國通信學(xué)會學(xué)術(shù)年會論文集[C];2011年
3 尚屹;朱琦;;國家持久性有機(jī)污染物數(shù)據(jù)分析系統(tǒng)研究[A];2008中國環(huán)境科學(xué)學(xué)會學(xué)術(shù)年會優(yōu)秀論文集(下卷)[C];2008年
4 鄭慧娟;周嘉元;李斌;;水電站生產(chǎn)數(shù)據(jù)分析系統(tǒng)及其現(xiàn)場應(yīng)用[A];中國水力發(fā)電工程學(xué)會信息化專委會2010年學(xué)術(shù)交流會論文集[C];2010年
5 張永忠;趙靜;;基于事件檢測算法的交通數(shù)據(jù)分析系統(tǒng)[A];2008全國第十三屆自動化應(yīng)用技術(shù)學(xué)術(shù)交流會論文集[C];2008年
6 王治國;王薇;訾凱;任鵬;;臨床檢驗(yàn)方法確認(rèn)與性能驗(yàn)證數(shù)據(jù)分析系統(tǒng)(MVS)的開發(fā)與應(yīng)用[A];中華醫(yī)學(xué)會第九次全國檢驗(yàn)醫(yī)學(xué)學(xué)術(shù)會議暨中國醫(yī)院協(xié)會臨床檢驗(yàn)管理專業(yè)委員會第六屆全國臨床檢驗(yàn)實(shí)驗(yàn)室管理學(xué)術(shù)會議論文匯編[C];2011年
7 董剛;孫建林;譚耘宇;;建立梅鋼熱軋數(shù)據(jù)分析系統(tǒng)[A];自動化技術(shù)與冶金流程節(jié)能減排——全國冶金自動化信息網(wǎng)2008年會論文集[C];2008年
相關(guān)重要報(bào)紙文章 前8條
1 記者 劉慧敏;開發(fā)區(qū)一企業(yè)研發(fā)成功“消費(fèi)行為數(shù)據(jù)分析系統(tǒng)”[N];寧波日報(bào);2009年
2 別志銘;基于云的大數(shù)據(jù)分析系統(tǒng)[N];網(wǎng)絡(luò)世界;2013年
3 袁毅;蘇州:數(shù)據(jù)分析系統(tǒng)精準(zhǔn)問診城市交通[N];人民公安報(bào)·交通安全周刊;2011年
4 紹興職業(yè)技術(shù)學(xué)院 沈華峰 寧波大學(xué)信息科學(xué)與工程學(xué)院 朱雙東;基于可縮放矢量圖形數(shù)據(jù)分析系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[N];中國計(jì)算機(jī)報(bào);2010年
5 記者 董科;轉(zhuǎn)型客戶服務(wù) 打造全新競爭力[N];期貨日報(bào);2010年
6 江蘇省淮安市漣水地稅局 周躍 黃呂勝 童政;應(yīng)完善稅收數(shù)據(jù)分析系統(tǒng)提升使用效能[N];中國稅務(wù)報(bào);2013年
7 陶利軍;路橋當(dāng)好企業(yè)經(jīng)濟(jì)分析師[N];中國工商報(bào);2007年
8 本報(bào)記者 鞏國強(qiáng);汛潮的“賣點(diǎn)”[N];山西經(jīng)濟(jì)日報(bào);2004年
相關(guān)碩士學(xué)位論文 前10條
1 夷臻;學(xué)生事務(wù)數(shù)據(jù)分析系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];蘇州大學(xué);2015年
2 李永秋;智能化體檢數(shù)據(jù)分析系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[D];山東大學(xué);2014年
3 翟羽佳;萊蕪供電公司經(jīng)營數(shù)據(jù)分析系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];山東大學(xué);2015年
4 張磊磊;高考錄取數(shù)據(jù)分析系統(tǒng)前端界面模塊的設(shè)計(jì)與實(shí)現(xiàn)[D];山東大學(xué);2015年
5 韓繼軍;金卡科技公司業(yè)務(wù)數(shù)據(jù)分析系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[D];大連理工大學(xué);2015年
6 張志祥;某數(shù)據(jù)分析系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];北京郵電大學(xué);2015年
7 龍少杭;基于Storm的實(shí)時(shí)大數(shù)據(jù)分析系統(tǒng)的研究與實(shí)現(xiàn)[D];上海交通大學(xué);2015年
8 余夢然;面向商務(wù)智能的公共交通數(shù)據(jù)分析系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];西安電子科技大學(xué);2014年
9 張鵬宇;中國聯(lián)通ERP用戶感知業(yè)務(wù)監(jiān)控?cái)?shù)據(jù)分析系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];華南理工大學(xué);2015年
10 廖寧平;石化企業(yè)數(shù)據(jù)分析系統(tǒng)的開發(fā)及運(yùn)營管理中的應(yīng)用[D];浙江工業(yè)大學(xué);2014年
,本文編號:1645910
本文鏈接:http://sikaile.net/gongshangguanlilunwen/1645910.html