天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 軟件論文 >

面向流式數(shù)據(jù)的演化式預(yù)測(cè)技術(shù)研究

發(fā)布時(shí)間:2022-10-20 18:31
  近年來(lái),隨著信息科技的發(fā)展,數(shù)據(jù)的累積正在飛速的發(fā)展,使得機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘領(lǐng)域也得到了飛速的發(fā)展。然而,越來(lái)越多的數(shù)據(jù)是以流式數(shù)據(jù)出現(xiàn)的。與傳統(tǒng)批數(shù)據(jù)不同,流數(shù)據(jù)具有速度快,數(shù)據(jù)量大,不可再現(xiàn),有序等特點(diǎn),使得傳統(tǒng)的批處理預(yù)測(cè)技術(shù)不太適合這些流數(shù)據(jù)。面對(duì)數(shù)據(jù)流出現(xiàn)的各種特點(diǎn),本文研究的內(nèi)容是面向數(shù)據(jù)流的演化式預(yù)測(cè)技術(shù)。增量學(xué)習(xí)主要是針對(duì)流式數(shù)據(jù)的一種技術(shù),當(dāng)數(shù)據(jù)流源源不斷到來(lái)時(shí),原來(lái)的學(xué)習(xí)模型隨著新數(shù)據(jù)的到來(lái)進(jìn)行調(diào)整,模型參數(shù)也隨之變化。概念漂移是數(shù)據(jù)流的特點(diǎn)之一,這也是現(xiàn)如今數(shù)據(jù)流挖掘領(lǐng)域最大的挑戰(zhàn)之一。當(dāng)數(shù)據(jù)流逐漸發(fā)生概念漂移時(shí),由于數(shù)據(jù)分布發(fā)生變化,其學(xué)習(xí)模型對(duì)于數(shù)據(jù)流的預(yù)測(cè)性能慢慢下降。故需要能夠及時(shí)探測(cè)其是否發(fā)生概念漂移,然后對(duì)模型進(jìn)行調(diào)整和訓(xùn)練,之后再進(jìn)行動(dòng)態(tài)數(shù)據(jù)流的預(yù)測(cè)。本文針對(duì)數(shù)據(jù)流中概念漂移的發(fā)生,概述目前已有的探測(cè)與解決方法。然后針對(duì)該研究所面臨的問(wèn)題,提出本文的研究課題。針對(duì)稠密的數(shù)據(jù)流,本文提出一種基于無(wú)限的,高速的,時(shí)間變化的數(shù)據(jù)流,能夠增量地學(xué)習(xí)數(shù)據(jù)流的競(jìng)爭(zhēng)集成算法。該算法集成兩棵增量模型樹(shù)FIMT-DD,基模型FIMT-DD是一個(gè)時(shí)間變化學(xué)習(xí)數(shù)據(jù)流的算法... 

【文章頁(yè)數(shù)】:74 頁(yè)

【學(xué)位級(jí)別】:碩士

【文章目錄】:
摘要
ABSTRACT
第1章 緒論
    1.1 研究背景及意義
    1.2 國(guó)內(nèi)外研究現(xiàn)狀
        1.2.1 數(shù)據(jù)挖掘的研究現(xiàn)狀
        1.2.2 數(shù)據(jù)流的研究現(xiàn)狀
        1.2.3 面對(duì)概念漂移的研究現(xiàn)狀
    1.3 本文主要研究?jī)?nèi)容
    1.4 本文組織結(jié)構(gòu)
第2章 相關(guān)技術(shù)基礎(chǔ)
    2.1 批處理機(jī)器學(xué)習(xí)
        2.1.1 機(jī)器學(xué)習(xí)基礎(chǔ)
        2.1.2 分類(lèi)和回歸
        2.1.3 決策樹(shù)
        2.1.4 邏輯回歸
    2.2 流處理學(xué)習(xí)
        2.2.1 流數(shù)據(jù)基本概念
        2.2.2 增量支持向量機(jī)
        2.2.3 霍夫丁樹(shù)
        2.2.4 增量模型樹(shù)
        2.2.5 在線bagging和 boosting
    2.3 概念漂移
        2.3.1 概念漂移基礎(chǔ)
        2.3.2 概念漂移探測(cè)
        2.3.3 處理概念漂移
    2.4 最優(yōu)化算法
        2.4.1 梯度下降
        2.4.2 批梯度下降
        2.4.3 在線梯度下降
    2.5 本章小結(jié)
第3章 基于滑動(dòng)窗口的競(jìng)爭(zhēng)集成模型
    3.1 引言
    3.2 問(wèn)題描述與解決思路
        3.2.1 問(wèn)題描述
        3.2.2 解決思路
    3.3 競(jìng)爭(zhēng)集成算法的構(gòu)造
        3.3.1 FIMT-DD樹(shù)
        3.3.2 競(jìng)爭(zhēng)集成算法
    3.4 實(shí)驗(yàn)與分析
        3.4.1 實(shí)驗(yàn)步驟
        3.4.2 實(shí)驗(yàn)結(jié)果與分析
    3.5 本章小結(jié)
第4章 基于稀疏數(shù)據(jù)流的預(yù)測(cè)算法
    4.1 引言
    4.2 稀疏數(shù)據(jù)流算法的引入
        4.2.1 正則化
        4.2.2 截?cái)嗯c梯度截?cái)?br>        4.2.3 前后項(xiàng)分裂算法
        4.2.4 RDA算法
        4.2.5 FTRL算法
    4.3 稀疏數(shù)據(jù)流算法FTRL的改進(jìn)
        4.3.1 概念漂移探測(cè)PHW測(cè)試
        4.3.2 概念漂移FTRL_PHW算法
    4.4 實(shí)驗(yàn)與分析
        4.4.1 超平面仿真數(shù)據(jù)集
        4.4.2 參數(shù)的設(shè)定和評(píng)估指標(biāo)
        4.4.3 實(shí)驗(yàn)結(jié)果
    4.5 基于概念漂移的學(xué)習(xí)率適應(yīng)
    4.6 本章小結(jié)
結(jié)論
參考文獻(xiàn)
附錄A 攻讀學(xué)位期間所發(fā)表的學(xué)術(shù)論文和專(zhuān)利
附錄B 攻讀學(xué)位期間所參與的科研活動(dòng)
致謝


【參考文獻(xiàn)】:
期刊論文
[1]一種基于深度屬性加權(quán)的數(shù)據(jù)流自適應(yīng)集成分類(lèi)算法[J]. 李堯,王志海,孫艷歌,張偉.  山東大學(xué)學(xué)報(bào)(工學(xué)版). 2018(06)
[2]新型含噪數(shù)據(jù)流集成分類(lèi)的算法[J]. 袁泉,郭江帆.  計(jì)算機(jī)應(yīng)用. 2018(06)
[3]基于聚類(lèi)假設(shè)的數(shù)據(jù)流分類(lèi)算法[J]. 李南.  模式識(shí)別與人工智能. 2017(01)
[4]一種基于雙層窗口的概念漂移數(shù)據(jù)流分類(lèi)算法[J]. 朱群,張玉紅,胡學(xué)鋼,李培培.  自動(dòng)化學(xué)報(bào). 2011(09)
[5]IKnnM-DHecoc:一種解決概念漂移問(wèn)題的方法[J]. 辛軼,郭躬德,陳黎飛,畢亞新.  計(jì)算機(jī)研究與發(fā)展. 2011(04)
[6]基于可信多數(shù)投票的快速概念漂移檢測(cè)[J]. 文益民,王耀南,張瑩.  湖南大學(xué)學(xué)報(bào)(自然科學(xué)版). 2010(06)
[7]一種挖掘概念漂移數(shù)據(jù)流的選擇性集成算法[J]. 關(guān)菁華,劉大有.  計(jì)算機(jī)科學(xué). 2010(01)

碩士論文
[1]高維稀疏數(shù)據(jù)的相關(guān)性度量方法研究[D]. 劉帥.首都經(jīng)濟(jì)貿(mào)易大學(xué) 2014



本文編號(hào):3695085

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3695085.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶95037***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com