融合多源異構(gòu)制造數(shù)據(jù)的產(chǎn)品銷(xiāo)售預(yù)測(cè)和投放策略研究
發(fā)布時(shí)間:2021-02-26 00:39
在“互聯(lián)網(wǎng)+”的大背景下,大型制造企業(yè)通過(guò)PC端、移動(dòng)端和線下等多渠道拓展業(yè)務(wù)所產(chǎn)生的數(shù)據(jù)量已從TB級(jí)別達(dá)到了 PB級(jí)別,業(yè)務(wù)類(lèi)型和制造數(shù)據(jù)的繁榮為制造企業(yè)經(jīng)營(yíng)決策帶來(lái)新的機(jī)遇的同時(shí),也對(duì)傳統(tǒng)的數(shù)據(jù)挖掘方法提出了新的挑戰(zhàn)。面對(duì)全域市場(chǎng)范圍內(nèi)800多萬(wàn)客戶的訂單數(shù)據(jù)和銷(xiāo)售數(shù)據(jù)所造成的數(shù)據(jù)空間冗余和構(gòu)成信息復(fù)雜的多源異構(gòu)問(wèn)題,需要研究如何有效整合大量的、不統(tǒng)一的異構(gòu)數(shù)據(jù)源,并解決產(chǎn)品投放過(guò)程中社會(huì)庫(kù)存積壓大和產(chǎn)品失衡發(fā)展的問(wèn)題,為新形式下產(chǎn)品的精準(zhǔn)投放提供決策依據(jù)。本文針對(duì)制造企業(yè)在產(chǎn)品投放經(jīng)營(yíng)過(guò)程中因多源異構(gòu)的訂銷(xiāo)數(shù)據(jù)和業(yè)務(wù)流程映射關(guān)系不清晰所造成的經(jīng)營(yíng)決策不準(zhǔn)確的問(wèn)題,圍繞多源異構(gòu)數(shù)據(jù)的采集、處理和融合、產(chǎn)品投放過(guò)程中的銷(xiāo)售預(yù)測(cè)和試點(diǎn)客戶推薦、產(chǎn)品投放策略模型等數(shù)據(jù)挖掘中的關(guān)鍵問(wèn)題展開(kāi)研究,主要工作和貢獻(xiàn)如下:(1)本文構(gòu)建了多源異構(gòu)環(huán)境下客戶信息采集處理與基于用戶偏好融合方法。通過(guò)各區(qū)域巡點(diǎn)專(zhuān)員經(jīng)線下走訪、采集、整合后上報(bào)的方式和互聯(lián)網(wǎng)請(qǐng)求的方式完成數(shù)據(jù)采集工作,并導(dǎo)入到分布式多源異構(gòu)數(shù)據(jù)庫(kù)中。針對(duì)多源異構(gòu)數(shù)據(jù)表述不統(tǒng)一、字段多冗余和數(shù)值多指標(biāo)等問(wèn)題,提出通過(guò)XML技術(shù)和建立數(shù)據(jù)屬性...
【文章來(lái)源】:浙江理工大學(xué)浙江省
【文章頁(yè)數(shù)】:74 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖1.1主要研宄內(nèi)容框架??(1)基于多源異構(gòu)數(shù)據(jù)環(huán)境的海量客戶信息采集和處理:通過(guò)各區(qū)域巡點(diǎn)專(zhuān)員經(jīng)線下??走訪、采集、整合后上報(bào)的方式,和互聯(lián)網(wǎng)請(qǐng)求各區(qū)域內(nèi)業(yè)務(wù)系統(tǒng)的方式完成全域范圍內(nèi)??
透明和無(wú)差異。因此制造企業(yè)迫切需要把研宄??重心放在多源異構(gòu)數(shù)據(jù)的融合,通過(guò)建立統(tǒng)一的異構(gòu)數(shù)據(jù)轉(zhuǎn)換標(biāo)準(zhǔn)和自動(dòng)轉(zhuǎn)換機(jī)制,消除??異構(gòu)數(shù)據(jù)間的語(yǔ)義鴻溝和維度缺失,實(shí)現(xiàn)多源異構(gòu)數(shù)據(jù)統(tǒng)一化、標(biāo)準(zhǔn)化。??本章節(jié)針對(duì)多源異構(gòu)數(shù)據(jù)環(huán)境下的客戶信息采集和處理進(jìn)行分析介紹,為滿足制造企??業(yè)對(duì)多源異構(gòu)數(shù)據(jù)的集成、存儲(chǔ)和管理提出解決方法,構(gòu)建以大數(shù)據(jù)為中心的全域數(shù)據(jù)智??能一體化平臺(tái),實(shí)現(xiàn)制造數(shù)據(jù)全流程運(yùn)轉(zhuǎn)監(jiān)控,確保處理數(shù)據(jù)的及時(shí)性以提高制造企業(yè)經(jīng)??營(yíng)決策的準(zhǔn)確性[42]。全域數(shù)據(jù)智能?體化平臺(tái)框架如圖2.1所示,典中以實(shí)現(xiàn)數(shù)據(jù)快速盤(pán)??i句、及吋響應(yīng)為丨丨標(biāo),利川數(shù)據(jù)驅(qū)動(dòng)控制信總采集到智能決策各環(huán)V/,對(duì)數(shù)裾迸行分類(lèi)、??分流處理后進(jìn)行集成、介:儲(chǔ)和加工,實(shí)現(xiàn)制造企業(yè)對(duì)全流程制造數(shù)椐的實(shí)時(shí)加丨:U處觀,??同吋為后文針對(duì)制造產(chǎn)品所做的鍆仿預(yù)測(cè)、客戶推薦及精準(zhǔn)投放研究提供數(shù)據(jù)支挖。??f押能決%?!?U購(gòu)、'丨產(chǎn)、銷(xiāo)售…)(1?測(cè)、推薦、投放…)I??:?^???咖伙迚作詢技木?(7?分布式名源w構(gòu)玫船彳.:?)??二::::一二::::::………一——一二??丨丨規(guī)梧(1本]派生]衍笙「預(yù)瞥:??丨:屬性指標(biāo)指標(biāo)關(guān)系體系丨??J????/?V?/?\??V.?v?!?J,1?'??多源異構(gòu)據(jù)?丨, ̄ ̄ ̄7?0?flSil??科學(xué)指標(biāo)系統(tǒng)構(gòu)建?1數(shù)據(jù)副!合 ̄);??與w能融合技術(shù)?|((?^)?(555?(供土商)(業(yè)^程])??i?|供應(yīng)商、分銷(xiāo)商、零售、消費(fèi)者??、???????*——■??---------??(f數(shù)成)冼??ii允構(gòu)化數(shù)椐?1':??PA程]?‘盔以―KC?
[接口和美團(tuán)外賣(mài)OpenAPl接I?I提供的POI信息和零售??類(lèi)信息等。??2.2.3多源數(shù)據(jù)導(dǎo)入??大型制造企業(yè)在建設(shè)大數(shù)據(jù)平臺(tái)的過(guò)程中,由于多源數(shù)據(jù)間的差異比較大,?般都是??將直接經(jīng)過(guò)業(yè)務(wù)系統(tǒng)加工后的數(shù)據(jù)才存儲(chǔ)到數(shù)據(jù)庫(kù)中,而想其他文件類(lèi)型的數(shù)據(jù)一般都是??在文件服務(wù)器的磁盤(pán)上進(jìn)行存儲(chǔ)。為了能夠直接獲取到這些難以直接在數(shù)據(jù)庫(kù)中存儲(chǔ)的數(shù)??據(jù),本文在導(dǎo)入不同數(shù)據(jù)源和數(shù)據(jù)結(jié)構(gòu)的數(shù)據(jù)時(shí)借助不同的數(shù)據(jù)導(dǎo)入工具,將多源數(shù)據(jù)集??中到數(shù)據(jù)倉(cāng)庫(kù)中進(jìn)行統(tǒng)一管理,為后續(xù)數(shù)據(jù)處理做準(zhǔn)備。??如圖2.2所示,對(duì)物流數(shù)據(jù)、監(jiān)控?cái)?shù)據(jù)和氣象數(shù)據(jù)等數(shù)據(jù)導(dǎo)入,主要通過(guò)RocketMQ或??Kafka以消息隊(duì)列的形式進(jìn)行分發(fā)處理,以滿足數(shù)椐實(shí)時(shí)忭耍求;對(duì)客戶數(shù)據(jù)、銷(xiāo)售數(shù)據(jù)??和iP丫l數(shù)據(jù)等實(shí)吋性要求不高的關(guān)系型數(shù)據(jù)導(dǎo)入,主要M過(guò)Sqoop成ETL/等工具直接導(dǎo)??入到丨ladoop的HDFS中;對(duì)文捫數(shù)據(jù)、視頻數(shù)椐和位置數(shù)據(jù)等女全性要求較A的數(shù)據(jù)導(dǎo)??入,主要通過(guò)FTP等文件傳輸協(xié)議傳輸?shù)姆绞綄?dǎo)入到Hive中;對(duì)應(yīng)用數(shù)據(jù)和日志數(shù)據(jù)等??文木類(lèi)型的數(shù)據(jù)導(dǎo)入,主要通過(guò)Flume等工具導(dǎo)入到HBase中。??數(shù)據(jù)倉(cāng)庫(kù)?HDFS?Hive?Hbaso??上:?<>....?:…???!?f?*—*?N?/■?f^f??N?J??導(dǎo)入工具?i?Kafka?Sqoop或ETL?I'TP?Flume??非::二今二:::::〇二:::寺:::_^:::作??!?物流數(shù)據(jù)?客戶數(shù)據(jù)?文檔數(shù)據(jù)??各數(shù)據(jù)源i?監(jiān)控?cái)?shù)據(jù)?銷(xiāo)售數(shù)據(jù)?視頻數(shù)據(jù)??氣象數(shù)據(jù)?訂單數(shù)據(jù)?位置數(shù)據(jù)??il——<>——丄—???
本文編號(hào):3051815
【文章來(lái)源】:浙江理工大學(xué)浙江省
【文章頁(yè)數(shù)】:74 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖1.1主要研宄內(nèi)容框架??(1)基于多源異構(gòu)數(shù)據(jù)環(huán)境的海量客戶信息采集和處理:通過(guò)各區(qū)域巡點(diǎn)專(zhuān)員經(jīng)線下??走訪、采集、整合后上報(bào)的方式,和互聯(lián)網(wǎng)請(qǐng)求各區(qū)域內(nèi)業(yè)務(wù)系統(tǒng)的方式完成全域范圍內(nèi)??
透明和無(wú)差異。因此制造企業(yè)迫切需要把研宄??重心放在多源異構(gòu)數(shù)據(jù)的融合,通過(guò)建立統(tǒng)一的異構(gòu)數(shù)據(jù)轉(zhuǎn)換標(biāo)準(zhǔn)和自動(dòng)轉(zhuǎn)換機(jī)制,消除??異構(gòu)數(shù)據(jù)間的語(yǔ)義鴻溝和維度缺失,實(shí)現(xiàn)多源異構(gòu)數(shù)據(jù)統(tǒng)一化、標(biāo)準(zhǔn)化。??本章節(jié)針對(duì)多源異構(gòu)數(shù)據(jù)環(huán)境下的客戶信息采集和處理進(jìn)行分析介紹,為滿足制造企??業(yè)對(duì)多源異構(gòu)數(shù)據(jù)的集成、存儲(chǔ)和管理提出解決方法,構(gòu)建以大數(shù)據(jù)為中心的全域數(shù)據(jù)智??能一體化平臺(tái),實(shí)現(xiàn)制造數(shù)據(jù)全流程運(yùn)轉(zhuǎn)監(jiān)控,確保處理數(shù)據(jù)的及時(shí)性以提高制造企業(yè)經(jīng)??營(yíng)決策的準(zhǔn)確性[42]。全域數(shù)據(jù)智能?體化平臺(tái)框架如圖2.1所示,典中以實(shí)現(xiàn)數(shù)據(jù)快速盤(pán)??i句、及吋響應(yīng)為丨丨標(biāo),利川數(shù)據(jù)驅(qū)動(dòng)控制信總采集到智能決策各環(huán)V/,對(duì)數(shù)裾迸行分類(lèi)、??分流處理后進(jìn)行集成、介:儲(chǔ)和加工,實(shí)現(xiàn)制造企業(yè)對(duì)全流程制造數(shù)椐的實(shí)時(shí)加丨:U處觀,??同吋為后文針對(duì)制造產(chǎn)品所做的鍆仿預(yù)測(cè)、客戶推薦及精準(zhǔn)投放研究提供數(shù)據(jù)支挖。??f押能決%?!?U購(gòu)、'丨產(chǎn)、銷(xiāo)售…)(1?測(cè)、推薦、投放…)I??:?^???咖伙迚作詢技木?(7?分布式名源w構(gòu)玫船彳.:?)??二::::一二::::::………一——一二??丨丨規(guī)梧(1本]派生]衍笙「預(yù)瞥:??丨:屬性指標(biāo)指標(biāo)關(guān)系體系丨??J????/?V?/?\??V.?v?!?J,1?'??多源異構(gòu)據(jù)?丨, ̄ ̄ ̄7?0?flSil??科學(xué)指標(biāo)系統(tǒng)構(gòu)建?1數(shù)據(jù)副!合 ̄);??與w能融合技術(shù)?|((?^)?(555?(供土商)(業(yè)^程])??i?|供應(yīng)商、分銷(xiāo)商、零售、消費(fèi)者??、???????*——■??---------??(f數(shù)成)冼??ii允構(gòu)化數(shù)椐?1':??PA程]?‘盔以―KC?
[接口和美團(tuán)外賣(mài)OpenAPl接I?I提供的POI信息和零售??類(lèi)信息等。??2.2.3多源數(shù)據(jù)導(dǎo)入??大型制造企業(yè)在建設(shè)大數(shù)據(jù)平臺(tái)的過(guò)程中,由于多源數(shù)據(jù)間的差異比較大,?般都是??將直接經(jīng)過(guò)業(yè)務(wù)系統(tǒng)加工后的數(shù)據(jù)才存儲(chǔ)到數(shù)據(jù)庫(kù)中,而想其他文件類(lèi)型的數(shù)據(jù)一般都是??在文件服務(wù)器的磁盤(pán)上進(jìn)行存儲(chǔ)。為了能夠直接獲取到這些難以直接在數(shù)據(jù)庫(kù)中存儲(chǔ)的數(shù)??據(jù),本文在導(dǎo)入不同數(shù)據(jù)源和數(shù)據(jù)結(jié)構(gòu)的數(shù)據(jù)時(shí)借助不同的數(shù)據(jù)導(dǎo)入工具,將多源數(shù)據(jù)集??中到數(shù)據(jù)倉(cāng)庫(kù)中進(jìn)行統(tǒng)一管理,為后續(xù)數(shù)據(jù)處理做準(zhǔn)備。??如圖2.2所示,對(duì)物流數(shù)據(jù)、監(jiān)控?cái)?shù)據(jù)和氣象數(shù)據(jù)等數(shù)據(jù)導(dǎo)入,主要通過(guò)RocketMQ或??Kafka以消息隊(duì)列的形式進(jìn)行分發(fā)處理,以滿足數(shù)椐實(shí)時(shí)忭耍求;對(duì)客戶數(shù)據(jù)、銷(xiāo)售數(shù)據(jù)??和iP丫l數(shù)據(jù)等實(shí)吋性要求不高的關(guān)系型數(shù)據(jù)導(dǎo)入,主要M過(guò)Sqoop成ETL/等工具直接導(dǎo)??入到丨ladoop的HDFS中;對(duì)文捫數(shù)據(jù)、視頻數(shù)椐和位置數(shù)據(jù)等女全性要求較A的數(shù)據(jù)導(dǎo)??入,主要通過(guò)FTP等文件傳輸協(xié)議傳輸?shù)姆绞綄?dǎo)入到Hive中;對(duì)應(yīng)用數(shù)據(jù)和日志數(shù)據(jù)等??文木類(lèi)型的數(shù)據(jù)導(dǎo)入,主要通過(guò)Flume等工具導(dǎo)入到HBase中。??數(shù)據(jù)倉(cāng)庫(kù)?HDFS?Hive?Hbaso??上:?<>....?:…???!?f?*—*?N?/■?f^f??N?J??導(dǎo)入工具?i?Kafka?Sqoop或ETL?I'TP?Flume??非::二今二:::::〇二:::寺:::_^:::作??!?物流數(shù)據(jù)?客戶數(shù)據(jù)?文檔數(shù)據(jù)??各數(shù)據(jù)源i?監(jiān)控?cái)?shù)據(jù)?銷(xiāo)售數(shù)據(jù)?視頻數(shù)據(jù)??氣象數(shù)據(jù)?訂單數(shù)據(jù)?位置數(shù)據(jù)??il——<>——丄—???
本文編號(hào):3051815
本文鏈接:http://sikaile.net/guanlilunwen/lindaojc/3051815.html
最近更新
教材專(zhuān)著