天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于文本挖掘和集成學(xué)習的外賣訂單出餐時長預(yù)測

發(fā)布時間:2020-08-09 19:38
【摘要】:近年來,隨著人們生活習慣的改變,餐飲外賣愈發(fā)普及。隨之而來的是外賣配送的迅猛增長。目前各大外賣平臺基本上都采用系統(tǒng)自動派單的模式進行訂單與配送員的匹配。外賣配送的系統(tǒng)派單要做到更加合理高效,所要面臨的一個重要問題就是餐飲訂單出餐時長預(yù)測,即在用戶下單并完成訂單支付后預(yù)測出該訂單的餐品出餐所需要的時間。對出餐時長預(yù)測的準確性,直接決定了系統(tǒng)派單決策的準確性以及合理性,對于高峰期配送員的運力配置起到至關(guān)重要的作用。首先,本文介紹了文本挖掘和集成學(xué)習等相關(guān)理論。其次,以本人實習所負責的外賣訂單項目為案例,界定了出餐時長的概念,提出了針對外賣訂單數(shù)據(jù)集的數(shù)據(jù)清洗方法。在此基礎(chǔ)上,基于業(yè)務(wù)經(jīng)驗構(gòu)造基礎(chǔ)特征,同時使用文本挖掘技術(shù)構(gòu)造文本特征,并利用Early Fusion和Late Fusion兩種方法進行特征融合。然后,比較了XGBoost、隨機森林和GBRT三類方法四個基礎(chǔ)模型①的預(yù)測準確性,并確定了四個基礎(chǔ)模型的最終融合方案。最后,本文基于MSE等指標對最終融合得到的模型進行了評估,并給出了實時預(yù)測方案。本文的研究結(jié)果表明,在學(xué)習過程中進行數(shù)據(jù)、特征和算法參數(shù)的擾動之后,對多個集成模型進行加權(quán)融合比單一集成模型具有更好的預(yù)測效果。同時證明了在數(shù)據(jù)量較大、特征維度較高、計算資源相對有限的場景下,模型的加權(quán)融合比Stacking有更高的性價比。基于加權(quán)融合集成學(xué)習的出餐時長預(yù)測模型提高了整個訂單配送系統(tǒng)的效率,提升了配送員和客戶的滿意度。
【學(xué)位授予單位】:浙江工商大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2018
【分類號】:C815
【圖文】:

示意圖,基本的,文本特征提取,示意圖


第一節(jié)文本挖掘理論逡逑用到文本挖掘理論主要包括文本特征提取和文本特征融合兩部文本特征提取逡逑模型的文本特征提取主要有以下兩種:第一種基于深度學(xué)習[2],編碼器(Auto邋Encoder)1491和深度信念網(wǎng)絡(luò)[5()],第二種是基于集成基于深度學(xué)習的文本特征提取逡逑Encoder近年來較為流行。Auto邋Encoder由輸入層、隱含層以及組成。將詞向量進行線性變換并用激活函數(shù)激活之后得到編解碼器作用編碼結(jié)果得到重構(gòu)向量Auto邋Encoder?的優(yōu)后得到的輸出層向量z和原始的輸入層向量盡可能相似,即原先輸入的可視層的差異盡可能小。Auto邋Encoder網(wǎng)絡(luò)的結(jié)

分布圖,時長,數(shù)據(jù)集,異常值


筆者選取了某城市2017年4月11日至2017年8月26日的即時外賣完成訂單逡逑數(shù)據(jù)作為論文的主要研究數(shù)據(jù),該數(shù)據(jù)集共有記錄2083455條。該數(shù)據(jù)集的出逡逑餐時長分布如圖3-1所示。逡逑0.06邋-邋A逡逑0.05-逡逑灥.逡逑U.逡逑丨>逡逑U邋0邐20邐40邐60邐K)邐1D0邐120邐140逡逑Prepare邋FoodlimefmiRUtes)逡逑圖3-1原始數(shù)據(jù)集出餐時長分布圖逡逑從圖3-1可以看出,該數(shù)據(jù)集里的分析變量存在較多異常值。本文通過對逡逑外賣商家和配送員進行調(diào)研發(fā)現(xiàn)實際情況中極少有訂單的出餐時長在60分鐘逡逑以上。但原始數(shù)據(jù)集里有一定比例的訂單出餐時長在60分鐘以上,最大的甚逡逑至達到125分鐘,這顯然是不合常理的。本文下一節(jié)將研究這些異常點的數(shù)據(jù)逡逑清洗方法。逡逑18逡逑

軌跡圖,點擊,軌跡,數(shù)據(jù)清洗


浙江工商大學(xué)碩士論文逡逑(三)配送員等餐過程中離開商家的數(shù)據(jù)清洗規(guī)則逡逑在一些場景下,騎手到達商家后擔心等待出餐的時間會過長,可能離開該商家先去其它的商家取餐或者先送完另一個訂單再來取餐。但是如手離開商家的時間過久,當他再次回到該商家時,餐品早己做好。逡逑

【參考文獻】

相關(guān)期刊論文 前10條

1 張洞明;鄭宏;張力;;基于多特征集成學(xué)習的景區(qū)人群密度估計[J];科學(xué)技術(shù)與工程;2017年05期

2 王健;張俊妮;;統(tǒng)計模型在中文文本挖掘中的應(yīng)用[J];數(shù)理統(tǒng)計與管理;2017年04期

3 余小康;陳嶺;郭敬;蔡雅雅;吳勇;王敬昌;;結(jié)合從句級遠程監(jiān)督與半監(jiān)督集成學(xué)習的關(guān)系抽取方法[J];模式識別與人工智能;2017年01期

4 徐健鋒;湯濤;嚴軍峰;劉真;;基于多機器學(xué)習競爭策略的短時交通流預(yù)測[J];交通運輸系統(tǒng)工程與信息;2016年04期

5 姜芳;李國和;岳翔;;基于語義的文檔特征提取研究方法[J];計算機科學(xué);2016年02期

6 倪志偉;張琛;倪麗萍;;基于螢火蟲群優(yōu)化算法的選擇性集成霧霾天氣預(yù)測方法[J];模式識別與人工智能;2016年02期

7 朱賀軍;馬丁;;海量短文本實時挖掘方法的研究與仿真[J];計算機仿真;2015年12期

8 陳翠平;;基于深度信念網(wǎng)絡(luò)的文本分類算法[J];計算機系統(tǒng)應(yīng)用;2015年02期

9 姜麗華;張宏斌;楊曉蓉;;基于領(lǐng)域本體的文本挖掘研究[J];情報科學(xué);2014年12期

10 劉勘;袁蘊英;;基于自動編碼器的短文本特征提取及聚類研究[J];北京大學(xué)學(xué)報(自然科學(xué)版);2015年02期



本文編號:2787466

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/guanlilunwen/tongjijuecelunwen/2787466.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶d6d0c***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com