基于文本挖掘和集成學(xué)習的外賣訂單出餐時長預(yù)測
【學(xué)位授予單位】:浙江工商大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2018
【分類號】:C815
【圖文】:
第一節(jié)文本挖掘理論逡逑用到文本挖掘理論主要包括文本特征提取和文本特征融合兩部文本特征提取逡逑模型的文本特征提取主要有以下兩種:第一種基于深度學(xué)習[2],編碼器(Auto邋Encoder)1491和深度信念網(wǎng)絡(luò)[5()],第二種是基于集成基于深度學(xué)習的文本特征提取逡逑Encoder近年來較為流行。Auto邋Encoder由輸入層、隱含層以及組成。將詞向量進行線性變換并用激活函數(shù)激活之后得到編解碼器作用編碼結(jié)果得到重構(gòu)向量Auto邋Encoder?的優(yōu)后得到的輸出層向量z和原始的輸入層向量盡可能相似,即原先輸入的可視層的差異盡可能小。Auto邋Encoder網(wǎng)絡(luò)的結(jié)
筆者選取了某城市2017年4月11日至2017年8月26日的即時外賣完成訂單逡逑數(shù)據(jù)作為論文的主要研究數(shù)據(jù),該數(shù)據(jù)集共有記錄2083455條。該數(shù)據(jù)集的出逡逑餐時長分布如圖3-1所示。逡逑0.06邋-邋A逡逑0.05-逡逑灥.逡逑U.逡逑丨>逡逑U邋0邐20邐40邐60邐K)邐1D0邐120邐140逡逑Prepare邋FoodlimefmiRUtes)逡逑圖3-1原始數(shù)據(jù)集出餐時長分布圖逡逑從圖3-1可以看出,該數(shù)據(jù)集里的分析變量存在較多異常值。本文通過對逡逑外賣商家和配送員進行調(diào)研發(fā)現(xiàn)實際情況中極少有訂單的出餐時長在60分鐘逡逑以上。但原始數(shù)據(jù)集里有一定比例的訂單出餐時長在60分鐘以上,最大的甚逡逑至達到125分鐘,這顯然是不合常理的。本文下一節(jié)將研究這些異常點的數(shù)據(jù)逡逑清洗方法。逡逑18逡逑
浙江工商大學(xué)碩士論文逡逑(三)配送員等餐過程中離開商家的數(shù)據(jù)清洗規(guī)則逡逑在一些場景下,騎手到達商家后擔心等待出餐的時間會過長,可能離開該商家先去其它的商家取餐或者先送完另一個訂單再來取餐。但是如手離開商家的時間過久,當他再次回到該商家時,餐品早己做好。逡逑
【參考文獻】
相關(guān)期刊論文 前10條
1 張洞明;鄭宏;張力;;基于多特征集成學(xué)習的景區(qū)人群密度估計[J];科學(xué)技術(shù)與工程;2017年05期
2 王健;張俊妮;;統(tǒng)計模型在中文文本挖掘中的應(yīng)用[J];數(shù)理統(tǒng)計與管理;2017年04期
3 余小康;陳嶺;郭敬;蔡雅雅;吳勇;王敬昌;;結(jié)合從句級遠程監(jiān)督與半監(jiān)督集成學(xué)習的關(guān)系抽取方法[J];模式識別與人工智能;2017年01期
4 徐健鋒;湯濤;嚴軍峰;劉真;;基于多機器學(xué)習競爭策略的短時交通流預(yù)測[J];交通運輸系統(tǒng)工程與信息;2016年04期
5 姜芳;李國和;岳翔;;基于語義的文檔特征提取研究方法[J];計算機科學(xué);2016年02期
6 倪志偉;張琛;倪麗萍;;基于螢火蟲群優(yōu)化算法的選擇性集成霧霾天氣預(yù)測方法[J];模式識別與人工智能;2016年02期
7 朱賀軍;馬丁;;海量短文本實時挖掘方法的研究與仿真[J];計算機仿真;2015年12期
8 陳翠平;;基于深度信念網(wǎng)絡(luò)的文本分類算法[J];計算機系統(tǒng)應(yīng)用;2015年02期
9 姜麗華;張宏斌;楊曉蓉;;基于領(lǐng)域本體的文本挖掘研究[J];情報科學(xué);2014年12期
10 劉勘;袁蘊英;;基于自動編碼器的短文本特征提取及聚類研究[J];北京大學(xué)學(xué)報(自然科學(xué)版);2015年02期
本文編號:2787466
本文鏈接:http://sikaile.net/guanlilunwen/tongjijuecelunwen/2787466.html