天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

分布式流數(shù)據(jù)分析與實時機器學習理論與應用研究

發(fā)布時間:2021-10-30 03:42
  新的時代正在興起,復雜機器學習算法的發(fā)展以及硬件性能的指數(shù)級增長將加速新一代人工智能系統(tǒng)的發(fā)展,改變?nèi)藗儗χ車澜绲母兄突臃绞?使人工智能可以在持續(xù)和意外變化的對抗環(huán)境中工作,并支持保障人類的安全和福祉。除了智能之外,新一代人工智能系統(tǒng)還需要解決至少三個挑戰(zhàn)。首先,它們必須實時地做出反應,以支持自動駕駛和智能信息檢索等新興應用。其次,這些系統(tǒng)需要不斷地從流數(shù)據(jù)中學習,以應對其環(huán)境的時變性。第三,當這些系統(tǒng)代表人類做出決策時,它們的決定需要具備可解釋性。這些挑戰(zhàn)涉及數(shù)據(jù)、模型、算法和硬件等許多層面,需要把系統(tǒng)、統(tǒng)計和優(yōu)化等知識在機器學習的過程中有機地結(jié)合起來。為此,這項研究工作開展了分布式流數(shù)據(jù)分析與實時機器學習理論與應用研究。研究的策略可以概括為“一個根本,兩個面向,三個層次”:“一個根本”就是在線最優(yōu)化求解。流數(shù)據(jù)以在線方式提供,這意味著整個數(shù)據(jù)集不能立即獲得,而是單個數(shù)據(jù)實例按順序到達。許多傳統(tǒng)優(yōu)化方法不能繼續(xù)在流數(shù)據(jù)環(huán)境下發(fā)揮作用。這項工作通過探索近似算法、自適應學習和基于自然梯度下降的二階優(yōu)化方法,來應對流數(shù)據(jù)環(huán)境中產(chǎn)生的三種約束(即對計算成本、查詢成本的約束和復雜不等式約... 

【文章來源】:廣東工業(yè)大學廣東省

【文章頁數(shù)】:142 頁

【學位級別】:博士

【部分圖文】:

分布式流數(shù)據(jù)分析與實時機器學習理論與應用研究


圖3.1流計算中的資源調(diào)度示意圖??Figure?3.1?Illustration?of?the?resource?allocation?in?data?stream?analytic?system.??

架構(gòu)圖,天河,機器學習,架構(gòu)


>。浚浚幔樱椋妫簦裕椋停辏颍?t?Si8f??\it^rTi?1?>Ttilt%!UI;tit?Ti*??H^SgBSiBBSa^?—??驗戀?I??|?""";??^?i??Tianhe-2?Kylin?Cloud(custon?OpenStack)?Stream?processing??□□□___?界辦015??隱a^-n?;Rn?E^Q-^??IPSb?!?Wm?mmi?mm??g*?i?^;1B^i???|f?——?^?I??v??圖3.3基于天河二號HPC2的資源感知實時機器學習系統(tǒng)架構(gòu)??Figure?3.3?The?execution?model?of?the?optimized?HPC2-ARS?framework.??與HPC2平臺的連接。系統(tǒng)時延估計模型中各種基礎參數(shù)的收集和統(tǒng)計、根據(jù)??HPC2-ARS算法框架所做出的彈性資源調(diào)度決策都需要設計專門的系統(tǒng)模塊來??高效地執(zhí)行。這些獨立的系統(tǒng)模塊黏合了?HPC2-ARS算法框架和天河二號HPC2??平臺.使流處理引擎和優(yōu)化模型無縫連接,進而彌合了物理基礎架構(gòu)和抽象數(shù)學??模型之間的鴻溝。如圖(3.3)所示.HPC2-ARS算法框架首先復用Apache?Storm??的測量組件(MEASURER)和配置讀取組件(CONFIGUREREADER)從HPC2??平臺獲取數(shù)據(jù)流和控制流的各項基礎信息,例如.數(shù)據(jù)流速率A和計算速率^??用戶自定義時延閾值7^^資源數(shù)量約束Amax,當前資源配置.數(shù)據(jù)流元組在??算子拓撲圖中的時延ECO1等等,并將統(tǒng)計結(jié)果發(fā)送給優(yōu)化組件(OPTIMIZER):??優(yōu)化組件實時地執(zhí)行HPC2

平均時延,理論值,資源,時延


f均時延M論{TUms)?平均ih!延輝論fi?{ms}??(c)點fl?分析?(dl情感分析??U50?rc-i-*?它?5??|??V-?I-?roM??愛?40?愛?4?/■〇,+???友?2???J35?5?3.5??。?rc*??、0—^??^?3???20?25?30?35?40?45?2?2.5?3?3.5?4??t:均時延砰論m(ms}?f?均時延0論{lUms}??(e)郵件過濾?(D智能屯網(wǎng)??圖3.6不冋的資源配置下各個流處理用例的平均時延測M值及其理論值對比??Figure?3.6?The?comparison?between?the?measured?average?tuple?sojourn?time?and?the??estimated?ones.??第二組實驗分析時延估計模型的有效性,實驗結(jié)果如圖(3.6)所示.其中??比較了各個用例的平均時延的測量值及其理論值。圖中的橫坐標表示平均時延??的理論值.縱坐標表示平均時延的測量值:圖中的菱形點表示在相應的資源最優(yōu)??55??


本文編號:3465980

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/shoufeilunwen/xxkjbs/3465980.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶ececc***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com