天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

共享資源集散點選址與共享服務動態(tài)定價聯(lián)合決策研究

發(fā)布時間:2020-03-27 23:51
【摘要】:在共享經(jīng)濟這一新出現(xiàn)的行業(yè)中,常見的共享資源有共享單車、共享汽車、共享雨傘、共享充電寶等。由于這些共享資源在共享行業(yè)領(lǐng)域內(nèi)發(fā)展很快,而國內(nèi)外對于共享資源集散點選址的研究問題及研究方法比較單一,并且解決問題的前提是要在一定程度上明確共享資源的需求函數(shù)。本文針對這些局限性進行研究,考慮到設(shè)施選址與定價的耦合性,使得研究的問題成為一個復合性問題,即利用增強學習方法解決共享資源需求函數(shù)未知情況下的集散點設(shè)施選址與共享服務動態(tài)定價聯(lián)合決策問題。本文基于設(shè)施選址和動態(tài)定價的理論知識提出了需要研究的問題,并且介紹了增強學習的方法,具體闡述了增強學習系統(tǒng)以及其智能體學習過程,同時描述了增強學習算法步驟并設(shè)計實驗過程。本文的研究目標是使得共享資源運營商獲得最大的收益,其研究問題主要分為兩個方面:(1)共享資源單集散點選址與共享服務動態(tài)定價聯(lián)合決策研究。(2)共享資源多集散點復合選址與共享服務動態(tài)定價聯(lián)合決策研究。在未知需求函數(shù)以及用戶行為特性的情況下,首先具體闡述了共享資源集散點選址與共享服務動態(tài)定價聯(lián)合決策問題;然后根據(jù)問題建立增強學習算法模型,定義了狀態(tài)、行為以及報酬函數(shù);接著根據(jù)增強學習決策目標建立具體的增強學習算法,對算法過程進行闡述;最后設(shè)計實驗過程,設(shè)置實驗參數(shù)并運行實驗,用實例驗證增強學習的效果。實驗中隨著實驗迭代次數(shù)的不斷增加,智能體的學習效果越來越好,學習曲線漸近提升并且學習增長率有了明顯的提高,從而提高了企業(yè)收益。經(jīng)過反復設(shè)計實驗過程,對實驗參數(shù)作出調(diào)整,發(fā)現(xiàn)智能體在與環(huán)境不斷地交互中選擇集散點和動態(tài)定價聯(lián)合決策時的學習曲線經(jīng)過實驗迭代達到了漸進的平穩(wěn)狀態(tài),其中在單集散點選址與動態(tài)定價聯(lián)合決策問題上,報酬提高了40%左右;而在復合選址與動態(tài)定價聯(lián)合決策問題上報酬增長率達到了80%左右。實驗結(jié)果表明多集散點復合選址與動態(tài)定價聯(lián)合決策相對于單集散點選址與動態(tài)定價聯(lián)合決策的報酬增長率更高,同時也說明了企業(yè)在多個集散點選擇中會獲得更大的企業(yè)收益。通過實驗結(jié)果證明了增強學習方法中智能體在學習的過程中對環(huán)境改變的捕捉能力以及適應變化的能力,體現(xiàn)了增強學習方法對于解決共享資源集散點選址與共享服務動態(tài)定價聯(lián)合決策研究問題的適用性,同時也為共享資源的運營商提供了管理的決策建議。
【圖文】:

問題描述,共享資源


因就是因為共享資源運營商只是一味的滿足用戶對共享資源的需求源需求點過多帶來的問題,沒有明確的共享資源集散點,而且在共缺乏有效的決策方案,,以至于企業(yè)的利益虧損嚴重。在國內(nèi)解決共文獻的研究問題和方法較少而且都比較局限,尤其是對于動態(tài)的設(shè)少,研究方法也比較傳統(tǒng),其中最新的研究方法就是利用聚類分析題,而且這種方法在很多的設(shè)施選址文獻中是比較常見的。共享資源管理的社會現(xiàn)象,提出本文需要解決的問題:(1)共享資態(tài)規(guī)劃問題;(2)在共享資源集散點選址中考慮共享服務的動態(tài)定取用共享資源的同時需要支付的共享服務價格。這兩個研究問題合合問題,根據(jù)潛在的需求量以及共享資源的取用距離的因素去確定置以及共享服務的定價聯(lián)合決策,從而提高共享資源運營商的收益

示意圖,增強學習,原理,示意圖


共同組成了一個閉環(huán)的系統(tǒng)結(jié)構(gòu)[47]。如圖2-1 所示。其中各個元素的定義如下:——智能體是一種能根據(jù)自己的思想與環(huán)境交互的實體,就像人類一樣有感官系統(tǒng),能夠在多變的環(huán)境中做出反應;——環(huán)境狀態(tài)指的是在行為選擇中智能體到達的狀態(tài);——行為指的是在智能體根據(jù)貪婪決策選擇狀態(tài)的動作;——報酬指的是智能體在學習過程中獲得的獎賞值。智能體在學習中,根據(jù)貪婪決策(本文中的選擇決策),在某個 t 時刻根據(jù)貪婪決策π(本文以ε—貪婪決策)通過自身行為ai改變環(huán)境狀態(tài)si,從而獲得短期的即時報酬。智能體根據(jù)報酬不斷地調(diào)整決策,在迭代的過程中得到最優(yōu)或者較優(yōu)的控制決策,使得長期的累積報酬或者平均報酬達到最大值[48]。增強學習方法特別適用于在環(huán)境中執(zhí)行一系列動作后提供學習信息(表示為懲罰或者獎勵)的領(lǐng)域[49]。一般來說增強學習有兩種基本模型:有折扣的報酬增強學習模型與平均報酬增強學習模型[50]。圖 2-1 增強學習原理示意圖Figure 2-1 Schematic diagram of reinforcement learning principle增強學習系統(tǒng)中是智能體自主與環(huán)境交互中選擇行為,而不是指定某一行為去執(zhí)行,這突出了增強學習系統(tǒng)的優(yōu)越性,能夠在未知的環(huán)境中尋找最優(yōu)決策。在執(zhí)行選
【學位授予單位】:廣東工業(yè)大學
【學位級別】:碩士
【學位授予年份】:2019
【分類號】:F713.36

【相似文獻】

相關(guān)期刊論文 前10條

1 陳金剛;李岸楊;;移動端考研產(chǎn)品的影響因素提取與分析[J];科學中國人;2017年24期

2 吳榮梅;;電子商務環(huán)境下動態(tài)定價策略分析[J];淮南師范學院學報;2011年04期

3 王鎖紅,糜仲春;網(wǎng)絡零售業(yè)中的動態(tài)定價模式[J];價值工程;2004年03期

4 邢繼萍;;最優(yōu)動態(tài)定價法: 神奇的力量[J];銷售與市場;1998年03期

5 趙天;胡玉生;;基于乘客分類的競爭航班動態(tài)定價研究[J];北京信息科技大學學報(自然科學版);2019年05期

6 譚美容;;短視和策略乘客并存的航空機票定價研究[J];工業(yè)工程與管理;2018年03期

7 王菲菲;李晶;;基于數(shù)據(jù)挖掘的電子商務動態(tài)定價模型[J];中國信息界;2012年02期

8 王金田;唐昊;程文娟;畢翔;;基于強化學習的異步動態(tài)定價算法[J];系統(tǒng)工程學報;2011年05期

9 柳鍵;羅春林;;基于模糊決策與變分法的易逝品動態(tài)定價[J];科技與管理;2009年04期

10 聶佳佳;熊中楷;;廣告影響需求下的新產(chǎn)品競爭性動態(tài)定價策略[J];華東經(jīng)濟管理;2009年07期

相關(guān)會議論文 前10條

1 劉自寬;趙道致;涂奉生;;壟斷產(chǎn)品最優(yōu)動態(tài)定價模型[A];1997年中國控制會議論文集[C];1997年

2 徐家旺;朱云龍;姜波;;閉環(huán)供應鏈運作過程中新/舊產(chǎn)品的動態(tài)定價模型[A];Proceedings of 2010 Chinese Control and Decision Conference[C];2010年

3 全雄文;涂奉生;;制造商-銷售商供應鏈的動態(tài)定價決策[A];第25屆中國控制會議論文集(上冊)[C];2006年

4 張斌;譚國威;;基于收益管理的高速鐵路平行車次動態(tài)定價研究[A];品質(zhì)交通與協(xié)同共治——2019年中國城市交通規(guī)劃年會論文集[C];2019年

5 李為相;楊以成;;電子商務中的動態(tài)定價研究綜述[A];江蘇省系統(tǒng)工程學會第十一屆學術(shù)年會論文集[C];2009年

6 肖會敏;吳楠楠;;數(shù)字化知識商品定價模型探究——以騰訊課堂為例[A];2015年中國管理科學與工程研究報告[C];2015年

7 羅春林;柳鍵;;基于模糊決策與變分法的易逝品動態(tài)定價[A];第三屆(2008)中國管理學年會——信息管理分會場論文集[C];2008年

8 陸慧;王金田;;單個銷售商壟斷電子銷售市場的動態(tài)定價研究[A];全國第20屆計算機技術(shù)與應用學術(shù)會議(CACIS·2009)暨全國第1屆安全關(guān)鍵技術(shù)與應用學術(shù)會議論文集(上冊)[C];2009年

9 李霞;孫利輝;王士虎;;基于服務水平的產(chǎn)品動態(tài)競價研究[A];經(jīng)濟全球化與系統(tǒng)工程——中國系統(tǒng)工程學會第16屆學術(shù)年會論文集[C];2010年

10 黃沛;劉曉峰;楊雄峰;;基于網(wǎng)絡外部性的雙寡頭市場動態(tài)定價策略[A];中國市場學會2006年年會暨第四次全國會員代表大會論文集[C];2006年

相關(guān)重要報紙文章 前10條

1 李雪;動態(tài)定價或加重就醫(yī)負擔[N];廣西日報;2020年

2 趙勇;動態(tài)定價促進航空公司收益水平提升[N];中國民航報;2019年

3 本報記者 龍昊;科技將保障消費金融運行[N];中國經(jīng)濟時報;2017年

4 方欣;航空公司動態(tài)定價迎來決定性時刻[N];中國民航報;2017年

5 本報記者  姜恒;日本:實行動態(tài)定價 藥價逐年走低[N];中國醫(yī)藥報;2006年

6 荷蘭保險行業(yè)IBM 全球企業(yè)咨詢服務部負責人 Koos Quak 全球企業(yè)咨詢服務部財務管理顧問 Gert-Jan van Zuijlen;AI動態(tài)定價助力險企更貼近市場[N];中國銀行保險報;2019年

7 阿里巴巴集團副總裁 數(shù)據(jù)委員會會長 車品覺;全民大數(shù)據(jù):從猜你喜歡到動態(tài)定價[N];北京商報;2015年

8 潘鐸印;“大數(shù)據(jù)殺熟”實為數(shù)據(jù)濫用[N];中國婦女報;2019年

9 本報記者 張勇;“天下沒有解決不了的環(huán)境難題”[N];文匯報;2013年

10 張亮   ;中國股市極具發(fā)展?jié)摿N];證券日報;2004年

相關(guān)博士學位論文 前10條

1 李博;高速鐵路票額分配和動態(tài)定價優(yōu)化研究[D];北京交通大學;2019年

2 宋文波;以旅客需求為導向的高速鐵路票額分配理論和方法研究[D];北京交通大學;2019年

3 孫德杰;多條件下商品動態(tài)定價及庫存控制方法研究[D];燕山大學;2017年

4 羅利;民航客運平行航班動態(tài)定價模型研究[D];西南交通大學;2005年

5 彭志強;面向策略性消費者的動態(tài)定價及應對機制研究[D];重慶大學;2010年

6 李豪;競爭環(huán)境下考慮顧客行為的易逝品動態(tài)定價策略研究[D];重慶大學;2010年

7 徐珂;兩級供應鏈中的動態(tài)定價問題[D];中國科學技術(shù)大學;2010年

8 趙藜;考慮消費者有限理性行為的動態(tài)定價研究[D];上海交通大學;2012年

9 易雪峰;基于顧客行為的戰(zhàn)略規(guī)則研究[D];浙江大學;2002年

10 丑文亞;定制電信產(chǎn)品模塊化設(shè)計及其動態(tài)定價研究[D];湖南大學;2013年

相關(guān)碩士學位論文 前10條

1 楊亞維;共享資源集散點選址與共享服務動態(tài)定價聯(lián)合決策研究[D];廣東工業(yè)大學;2019年

2 譚文揚;基于收益管理的高速鐵路平行車次動態(tài)定價研究[D];北京交通大學;2019年

3 劉飛;基于在線消費行為的動態(tài)定價研究:考慮策略性消費行為和顧客忠誠計劃的影響[D];廈門大學;2018年

4 徐鵬;動態(tài)定價策略在電動汽車公共充電網(wǎng)絡的應用問題研究[D];中國科學技術(shù)大學;2019年

5 李貝貝;考慮策略型消費者的網(wǎng)上商城動態(tài)定價研究[D];大連大學;2019年

6 劉勇;農(nóng)產(chǎn)品電商采購下的供應商動態(tài)定價方法研究[D];合肥工業(yè)大學;2019年

7 胡婉婷;基于收益共享與成本分攤機制的動態(tài)定價與合作努力研究[D];合肥工業(yè)大學;2018年

8 王敏;考慮消費者策略行為的動態(tài)定價及應對機制研究[D];南京理工大學;2018年

9 高子源;基于顧客選擇偏好的待租車輛動態(tài)定價方法研究[D];重慶交通大學;2018年

10 陳福明;考慮消費者預期后悔的多產(chǎn)品動態(tài)定價[D];江蘇科技大學;2018年



本文編號:2603578

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/jingjilunwen/guojimaoyilunwen/2603578.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶4a539***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com