天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 交通工程論文 >

基于數(shù)據(jù)挖掘的乘客出行行為研究

發(fā)布時間:2017-09-11 00:04

  本文關(guān)鍵詞:基于數(shù)據(jù)挖掘的乘客出行行為研究


  更多相關(guān)文章: 數(shù)據(jù)挖掘 市民出行 特征工程 隨機(jī)森林 梯度迭代決策樹


【摘要】:隨著城鎮(zhèn)化建設(shè)速度不斷加快,我國城鎮(zhèn)化率從1978年的17.9%上升到2015年的56.1%,城鎮(zhèn)常住人口突破7.7億[1]。市民的出行需求也越來越大,道路交通流量呈現(xiàn)急劇增長,尤其在“北上廣深”這樣的大城市,諸如交通擁擠、市民出行不便等問題正在不斷的增加,這些問題都嚴(yán)重影響到了城市居民的正常工作和生活,制約著城市的健康發(fā)展。公共交通作為城市交通運(yùn)輸重要的一個組成部分,在各城市中得到了很大的發(fā)展,然而在多數(shù)城市的公共交通的人數(shù)出行比占總出行還是偏低,其部分原因是由于公共交通的規(guī)劃和策略制定與市民的出行之間的關(guān)系規(guī)律還存在著不一致。數(shù)據(jù)挖掘是目前智能系統(tǒng)的重要研究內(nèi)容,它能夠從大量的數(shù)據(jù)中挖掘隱藏在其中的規(guī)律和知識。本文基于廣東省部分公交線路的歷史公交卡交易數(shù)據(jù),通過數(shù)據(jù)挖掘的技術(shù)和流程對固定人群在公共交通中的行為模式進(jìn)行挖掘,分析推測乘客的出行習(xí)慣和偏好,最終建立模型預(yù)測人們在未來一周在固定公交線路上的出行情況,這對為廣大乘客提供信息對稱和安全合理的出行環(huán)境具有重要的意義。論文首先對數(shù)據(jù)挖掘技術(shù)理論背景和方法做了總體的介紹和分析,基于所有的數(shù)據(jù),從實(shí)際業(yè)務(wù)的角度,對乘客在固定公交線路上未來的出行行為存在影響行為規(guī)律模式進(jìn)行了一些探究,提出了一套反應(yīng)乘客歷史行為習(xí)慣和偏好的特征工程體系的構(gòu)造方法。依據(jù)所設(shè)計的特征工程特點(diǎn),以及對隨機(jī)森林(random forest)和梯度迭代決策樹(Gradient boosted decision tree)兩種組合學(xué)習(xí)算法的理論分析和應(yīng)用,建立了一個魯棒性較好的市民未來出行預(yù)測模型,并在此基礎(chǔ)上,對兩種算法做了一系列分析和對比研究。
【關(guān)鍵詞】:數(shù)據(jù)挖掘 市民出行 特征工程 隨機(jī)森林 梯度迭代決策樹
【學(xué)位授予單位】:華南理工大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:U491.1;TP311.13
【目錄】:
  • 摘要5-6
  • Abstract6-10
  • 第一章 緒論10-14
  • 1.1 研究背景及意義10-11
  • 1.2 國內(nèi)外研究現(xiàn)狀11-12
  • 1.3 論文的主要研究內(nèi)容和組織結(jié)構(gòu)12-14
  • 第二章 數(shù)據(jù)挖掘理論綜述14-23
  • 2.1 數(shù)據(jù)挖掘技術(shù)的概念14-16
  • 2.2 數(shù)據(jù)挖掘的過程16-19
  • 2.2.1 數(shù)據(jù)的預(yù)處理16-17
  • 2.2.2 數(shù)據(jù)的挖掘階段17
  • 2.2.3 構(gòu)建模型穩(wěn)健型的評估以及結(jié)果的解釋17-19
  • 2.3 數(shù)據(jù)挖掘方法任務(wù)及分析19-22
  • 2.4 本章小結(jié)22-23
  • 第三章 乘客公交卡歷史交易數(shù)據(jù)的預(yù)處理與特征設(shè)計23-32
  • 3.1 原始數(shù)據(jù)23
  • 3.2 交通刷卡群體數(shù)據(jù)的分析和預(yù)處理23-25
  • 3.3 乘客公交歷史交易數(shù)據(jù)的特征提取25-30
  • 3.3.1 基于滑動窗口的特征集抽取26-27
  • 3.3.2 乘客歷史出行行為分析及樣本特征設(shè)計27-30
  • 3.4 本章小結(jié)30-32
  • 第四章 隨機(jī)森林和梯度迭代決策樹算法介紹及其分析32-40
  • 4.1 隨機(jī)森林算法原理及其分析32-36
  • 4.1.1 決策樹算法32-34
  • 4.1.2 算法隨機(jī)性分析及oob估計34-35
  • 4.1.3 算法收斂性證明35-36
  • 4.2 梯度提升決策樹(GRADIENT BOOSTING DECISION TREE)原理及其分析36-39
  • 4.3 本章小結(jié)39-40
  • 第五章 實(shí)驗(yàn)結(jié)果分析40-51
  • 5.1 實(shí)驗(yàn)工具與平臺介紹40
  • 5.2 實(shí)驗(yàn)過程40-41
  • 5.2.1 樣本的構(gòu)造40
  • 5.2.2 模型的評估指標(biāo)40-41
  • 5.2.3 離線評測和線上評測41
  • 5.3 隨機(jī)森林的試驗(yàn)結(jié)果分析41-47
  • 5.3.1 乘客在固定公交線路出行的離線測試結(jié)果分析41-45
  • 5.3.2 乘客在固定公交線路出行的線上預(yù)測結(jié)果分析45-47
  • 5.4 梯度迭代決策樹實(shí)驗(yàn)結(jié)果分析47-49
  • 5.4.1 乘客在固定公交線路出行的離線測試結(jié)果分析47-48
  • 5.4.2 乘客在固定公交線路上出行的線上預(yù)測結(jié)果分析48-49
  • 5.5 隨機(jī)森林和梯度提升決策樹結(jié)果對比分析49-51
  • 第六章 總結(jié)與展望51-53
  • 6.1 工作總結(jié)與創(chuàng)新51
  • 6.2 工作展望51-53
  • 參考文獻(xiàn)53-55
  • 攻讀博士/碩士學(xué)位期間取得的研究成果55-56
  • 致謝56-57
  • 答辯委員會對論文的評定意見57

【相似文獻(xiàn)】

中國期刊全文數(shù)據(jù)庫 前10條

1 烏英格;陳寶平;;數(shù)據(jù)挖掘在客戶關(guān)系管理中的應(yīng)用[J];內(nèi)蒙古科技與經(jīng)濟(jì);2005年24期

2 焦健;王祥;;數(shù)據(jù)挖掘在美國本土安全中的應(yīng)用[J];艦船電子工程;2006年01期

3 楊洋;;Web數(shù)據(jù)挖掘的分析與探討[J];裝備制造技術(shù);2006年05期

4 劉娟;;Web數(shù)據(jù)挖掘及其在個性化網(wǎng)上購物實(shí)現(xiàn)的探討[J];企業(yè)技術(shù)開發(fā);2007年07期

5 李世超;麥范金;;數(shù)據(jù)挖掘在現(xiàn)代企業(yè)經(jīng)營管理中的應(yīng)用[J];桂林航天工業(yè)高等專科學(xué)校學(xué)報;2008年04期

6 崔永君;;數(shù)據(jù)挖掘的系統(tǒng)構(gòu)成與發(fā)展趨勢[J];硅谷;2009年03期

7 侯曉凌;;淺談數(shù)據(jù)挖掘[J];科學(xué)之友(B版);2009年04期

8 張濤;;Web數(shù)據(jù)挖掘現(xiàn)狀分析[J];科學(xué)之友(B版);2009年06期

9 黃雄偉;陳定方;祖巧紅;;Web數(shù)據(jù)挖掘可視化研究與應(yīng)用[J];湖北工業(yè)大學(xué)學(xué)報;2009年04期

10 王巖;;數(shù)據(jù)挖掘領(lǐng)域探索[J];硅谷;2010年05期

中國重要會議論文全文數(shù)據(jù)庫 前10條

1 史東輝;蔡慶生;張春陽;;一種新的數(shù)據(jù)挖掘多策略方法研究[A];第十七屆全國數(shù)據(jù)庫學(xué)術(shù)會議論文集(研究報告篇)[C];2000年

2 張弦;;數(shù)據(jù)挖掘在農(nóng)業(yè)中的應(yīng)用[A];紀(jì)念中國農(nóng)業(yè)工程學(xué)會成立30周年暨中國農(nóng)業(yè)工程學(xué)會2009年學(xué)術(shù)年會(CSAE 2009)論文集[C];2009年

3 魏順平;;教育數(shù)據(jù)挖掘:現(xiàn)狀與趨勢[A];信息化、工業(yè)化融合與服務(wù)創(chuàng)新——第十三屆計算機(jī)模擬與信息技術(shù)學(xué)術(shù)會議論文集[C];2011年

4 關(guān)清平;沉培輝;;概率網(wǎng)絡(luò)在數(shù)據(jù)挖掘上的應(yīng)用[A];科技、工程與經(jīng)濟(jì)社會協(xié)調(diào)發(fā)展——中國科協(xié)第五屆青年學(xué)術(shù)年會論文集[C];2004年

5 丁瑾;;基于Web數(shù)據(jù)挖掘的綜述[A];山西省科學(xué)技術(shù)情報學(xué)會學(xué)術(shù)年會論文集[C];2004年

6 聶茹;田森平;;Web數(shù)據(jù)挖掘及其在電子商務(wù)中的應(yīng)用[A];中南六。▍^(qū))自動化學(xué)會第24屆學(xué)術(shù)年會會議論文集[C];2006年

7 李菊;王軍;;數(shù)據(jù)挖掘在客戶關(guān)系管理的應(yīng)用[A];計算機(jī)技術(shù)與應(yīng)用進(jìn)展·2007——全國第18屆計算機(jī)技術(shù)與應(yīng)用(CACIS)學(xué)術(shù)會議論文集[C];2007年

8 肖陽;李啟賢;;數(shù)據(jù)挖掘在中國鋼鐵行業(yè)中的應(yīng)用[A];中國計量協(xié)會冶金分會2012年會暨能源計量與節(jié)能降耗經(jīng)驗(yàn)交流會論文集[C];2012年

9 楊磊;王貴成;汪勇;張占勝;;SQL Server 2005在數(shù)據(jù)挖掘中的應(yīng)用[A];2009年中國智能自動化會議論文集(第二分冊)[C];2009年

10 謝中;邱玉輝;;面向商務(wù)網(wǎng)站有效性的數(shù)據(jù)挖掘方法[A];第十八屆全國數(shù)據(jù)庫學(xué)術(shù)會議論文集(技術(shù)報告篇)[C];2001年

中國重要報紙全文數(shù)據(jù)庫 前10條

1 本報記者褚寧;數(shù)據(jù)挖掘如“挖金”[N];解放日報;2002年

2 周蓉蓉;數(shù)據(jù)挖掘需要點(diǎn)想像力[N];計算機(jī)世界;2004年

3 □中國電信股份有限公司北京研究院 張舒博 □北京郵電大學(xué)計算機(jī)科學(xué)與技術(shù)學(xué)院 牛琨;走出數(shù)據(jù)挖掘的誤區(qū)[N];人民郵電;2006年

4 《網(wǎng)絡(luò)世界》記者 王瑩;數(shù)據(jù)挖掘保險業(yè)的新藍(lán)海[N];網(wǎng)絡(luò)世界;2012年

5 劉俊麗;基于地理化的網(wǎng)絡(luò)數(shù)據(jù)挖掘與分析提升投資有效性[N];人民郵電;2014年

6 本報記者 連曉東;數(shù)據(jù)挖掘:金融信息化新熱點(diǎn)[N];中國電子報;2002年

7 本報記者 鳳小華 朱仁康;“數(shù)字挖掘軟件”引領(lǐng)中國信息化新浪潮[N];中國電子報;2003年

8 本報記者 史延廷;“成功企業(yè)數(shù)據(jù)挖掘暨數(shù)量化管理論壇”在京舉辦[N];中國旅游報;2002年

9 朱小寧;數(shù)據(jù)挖掘:信息化戰(zhàn)爭的基礎(chǔ)工程[N];解放軍報;2005年

10 本報記者 王小平;從“大集中”走向數(shù)據(jù)挖掘[N];金融時報;2002年

中國博士學(xué)位論文全文數(shù)據(jù)庫 前10條

1 于自強(qiáng);海量流數(shù)據(jù)挖掘相關(guān)問題研究[D];山東大學(xué);2015年

2 張馨;全基因組SNP芯片應(yīng)用于CNV和L0H分析的軟件比對與數(shù)據(jù)挖掘[D];復(fù)旦大學(xué);2011年

3 彭計紅;基于數(shù)據(jù)挖掘的癡呆中醫(yī)證的研究[D];南京中醫(yī)藥大學(xué);2015年

4 李秋虹;基于MapReduce的大規(guī)模數(shù)據(jù)挖掘技術(shù)研究[D];復(fù)旦大學(xué);2013年

5 鄔文帥;基于多目標(biāo)決策的數(shù)據(jù)挖掘方法評估與應(yīng)用[D];電子科技大學(xué);2015年

6 謝邦彥;整合數(shù)據(jù)挖掘與TRIZ理論的質(zhì)量管理方法研究[D];首都經(jīng)濟(jì)貿(mào)易大學(xué);2010年

7 何偉全;云南高校學(xué)生意外傷害因素關(guān)聯(lián)規(guī)則挖掘及風(fēng)險管控體系研究[D];昆明理工大學(xué);2015年

8 段功豪;基于多結(jié)構(gòu)數(shù)據(jù)挖掘的滑坡災(zāi)害預(yù)測模型研究[D];中國地質(zhì)大學(xué);2016年

9 白曉明;基于數(shù)據(jù)挖掘的復(fù)合材料宏—細(xì)觀力學(xué)模型研究[D];哈爾濱工業(yè)大學(xué);2016年

10 藍(lán)永豪(LAM Wing Ho);基于數(shù)據(jù)挖掘技術(shù)分析當(dāng)代中醫(yī)名家痤瘡驗(yàn)方經(jīng)驗(yàn)研究[D];南京中醫(yī)藥大學(xué);2016年

中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條

1 林仁紅;基于數(shù)據(jù)挖掘的機(jī)遇識別與評價研究[D];首都經(jīng)濟(jì)貿(mào)易大學(xué);2007年

2 張彥俊;游戲運(yùn)營中的數(shù)據(jù)挖掘[D];復(fù)旦大學(xué);2011年

3 焦亞召;基于多核函數(shù)FCM算法在數(shù)據(jù)挖掘聚類中的應(yīng)用研究[D];昆明理工大學(xué);2015年

4 王杰鋒;物聯(lián)網(wǎng)能耗數(shù)據(jù)智能分析及其應(yīng)用平臺設(shè)計[D];江南大學(xué);2015年

5 劉學(xué)建;數(shù)據(jù)挖掘在電子商務(wù)推薦系統(tǒng)中的應(yīng)用研究[D];昆明理工大學(xué);2015年

6 戴陽陽;基于數(shù)據(jù)挖掘的金融時間序列預(yù)測研究與應(yīng)用[D];江南大學(xué);2015年

7 石思優(yōu);基于主題模型的醫(yī)療數(shù)據(jù)挖掘研究[D];廣東技術(shù)師范學(xué)院;2015年

8 陳丹;移動互聯(lián)網(wǎng)信令挖掘?qū)崿F(xiàn)智慧營銷的設(shè)計與實(shí)現(xiàn)應(yīng)用研究[D];華南理工大學(xué);2015年

9 陳思;基于數(shù)據(jù)挖掘的大學(xué)生客戶識別模型的研究[D];昆明理工大學(xué);2015年

10 位長帥;基于客戶數(shù)據(jù)挖掘的電信客戶關(guān)系管理研究[D];西南交通大學(xué);2015年

,

本文編號:827405

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/jiaotonggongchenglunwen/827405.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶3f456***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com