基于機(jī)器學(xué)習(xí)的時(shí)間序列分析方法研究與應(yīng)用
發(fā)布時(shí)間:2021-08-16 10:07
時(shí)間序列分析是人類(lèi)認(rèn)識(shí)與探索自然規(guī)律的一種普遍方式。為了準(zhǔn)確預(yù)測(cè)時(shí)間序列數(shù)據(jù),機(jī)器學(xué)習(xí)作為人工智能領(lǐng)域研究的基礎(chǔ),對(duì)復(fù)雜時(shí)間序列分析有著絕對(duì)的優(yōu)勢(shì),因此研究機(jī)器學(xué)習(xí)算法對(duì)分析時(shí)間序列有著重要的意義。針對(duì)傳統(tǒng)時(shí)間序列分析方法對(duì)時(shí)間序列預(yù)測(cè)準(zhǔn)確度不高問(wèn)題,提出一種改進(jìn)的SAM-LSTM融合算法。通過(guò)研究目前針對(duì)時(shí)間序列預(yù)測(cè)效果較好且基于機(jī)器學(xué)習(xí)的通用算法支持向量機(jī)(SVM)與循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的方法,發(fā)現(xiàn)SVM主要是對(duì)線性可分?jǐn)?shù)據(jù)進(jìn)行分類(lèi)的方法,RNN雖然對(duì)序列有著保存以往信息能力,但容易發(fā)生梯度消失現(xiàn)象導(dǎo)致預(yù)測(cè)效果不佳。長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)(LSTM)是為了解決RNN無(wú)法處理遠(yuǎn)距離長(zhǎng)序列依賴(lài)問(wèn)題,通過(guò)加入門(mén)結(jié)構(gòu)方式很好地避免了發(fā)生梯度消失問(wèn)題;自注意力機(jī)制(SAM)的目的是幫助模型對(duì)每個(gè)樣本數(shù)據(jù)賦予不同的權(quán)重,提取出影響數(shù)據(jù)分析預(yù)測(cè)的關(guān)鍵信息。構(gòu)建SAM-LSTM融合算法,綜合兩者算法的各自?xún)?yōu)勢(shì),實(shí)驗(yàn)選取電力負(fù)荷需求量數(shù)據(jù)和日最高溫度氣象數(shù)據(jù),對(duì)比SVM算法、RNN算法、LSTM算法以及SAM-LSTM算法對(duì)時(shí)間序列預(yù)測(cè)準(zhǔn)確度及誤差值,評(píng)估指標(biāo)為平均絕對(duì)誤差(MAE),平均絕對(duì)百分比誤...
【文章來(lái)源】:西安科技大學(xué)陜西省
【文章頁(yè)數(shù)】:77 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
研究思路圖
2傳統(tǒng)的時(shí)間序列分析方法11(3)多維度:數(shù)據(jù)產(chǎn)生不單單只有一個(gè)屬性,多屬性共存情況下必然會(huì)有特征的冗余,數(shù)據(jù)間的干擾,在學(xué)習(xí)訓(xùn)練過(guò)程中模型勢(shì)必會(huì)有所影響。如果高維度數(shù)據(jù)未經(jīng)處理降維,就會(huì)增加數(shù)據(jù)整體的復(fù)雜度,這樣許多傳統(tǒng)的機(jī)器學(xué)習(xí)方法預(yù)測(cè)也是效果不佳的。(4)海量性:隨著大數(shù)據(jù)時(shí)代的來(lái)臨,每天都會(huì)產(chǎn)生海量級(jí)的時(shí)間序列數(shù)據(jù),也因此產(chǎn)生了數(shù)據(jù)云的概念。(5)周期性:某個(gè)變量因外部環(huán)境變化如季節(jié)或事件高峰期出現(xiàn)交替現(xiàn)象的規(guī)律等。(6)趨勢(shì)性:某因素按照時(shí)間次序的發(fā)展或者隨自變量改變,整體數(shù)據(jù)變化存在持續(xù)升高、下坡趨勢(shì)或短暫性保持不變的動(dòng)態(tài)平衡趨勢(shì),變動(dòng)幅度略有不等。(7)綜合性:序列構(gòu)成是由多種變化情況線性相加或組合的形式。在進(jìn)行預(yù)測(cè)時(shí)應(yīng)該盡可能剔除掉不相關(guān)干擾數(shù)據(jù),著重體現(xiàn)其變動(dòng)的周期性、趨勢(shì)性等特點(diǎn)。2.1.3時(shí)間序列的種類(lèi)按數(shù)據(jù)的表現(xiàn)形式將時(shí)間序列分為:絕對(duì)數(shù)時(shí)間序列、相對(duì)數(shù)時(shí)間序列、平均數(shù)時(shí)間序列[32]。如圖2.1所示。(1)絕對(duì)數(shù)時(shí)間序列它定義為一系列的同一類(lèi)型的總量指標(biāo)數(shù)據(jù)以時(shí)間發(fā)生的前后次序而排列構(gòu)成的一組序列,表明此序列在多個(gè)時(shí)間段內(nèi)處于絕對(duì)水平,也稱(chēng)為總量指標(biāo)時(shí)間序列。絕對(duì)數(shù)時(shí)間序列由時(shí)點(diǎn)序列和時(shí)期序列構(gòu)成。如下圖2.2和2.3所示。圖2.1絕對(duì)數(shù)時(shí)間序列、相對(duì)數(shù)時(shí)間序列、平均數(shù)時(shí)間序列①時(shí)期序列包含的每個(gè)數(shù)據(jù)對(duì)應(yīng)的是時(shí)期指標(biāo),代表每個(gè)數(shù)據(jù)現(xiàn)象發(fā)生于每個(gè)時(shí)間段中的總量,時(shí)點(diǎn)序列包含的每個(gè)數(shù)據(jù)對(duì)應(yīng)的是時(shí)點(diǎn)指標(biāo),描述其每個(gè)數(shù)據(jù)發(fā)生現(xiàn)象于每個(gè)時(shí)點(diǎn)位置所保持的狀態(tài)和達(dá)到的水平。
西安科技大學(xué)全日制工程碩士學(xué)位論文12②時(shí)間序列中,各數(shù)據(jù)間的時(shí)期序列可以彼此相加,而時(shí)點(diǎn)序列數(shù)據(jù)不具有可加性。③時(shí)期序列它的數(shù)值大小的直接影響因素與數(shù)據(jù)所處的時(shí)間長(zhǎng)短有關(guān),時(shí)點(diǎn)序列它的各個(gè)時(shí)點(diǎn)數(shù)據(jù)的數(shù)值大小和時(shí)點(diǎn)間隔長(zhǎng)短無(wú)直接性的關(guān)系。④時(shí)間序列中,時(shí)期序列數(shù)據(jù)表示對(duì)每個(gè)時(shí)間段所發(fā)生的數(shù)據(jù)量進(jìn)行連續(xù)不間斷的統(tǒng)計(jì),時(shí)點(diǎn)序列數(shù)據(jù)則不要求連續(xù)統(tǒng)計(jì),且它不可能存在連續(xù)發(fā)生的現(xiàn)象。圖2.2時(shí)期序列圖2.3時(shí)點(diǎn)序列(2)相對(duì)數(shù)時(shí)間序列指由同類(lèi)型系列的同一種類(lèi)的相對(duì)數(shù)遵照時(shí)間發(fā)生的前后次序組成的序列,可以體現(xiàn)數(shù)據(jù)現(xiàn)象相對(duì)水平或者是數(shù)量間的一種動(dòng)態(tài)對(duì)比關(guān)系。(3)平均數(shù)時(shí)間序列由一系列同類(lèi)的平均數(shù)按時(shí)間先后順序排列而成的序列,反映現(xiàn)象一般水平發(fā)展變化過(guò)程和趨勢(shì)。本文所采用的數(shù)據(jù)集為絕對(duì)數(shù)時(shí)間序列中的時(shí)點(diǎn)序列,分別為2019年7月1日00:00至2019年9月1日00:00每半小時(shí)采取一次的約3000條澳大利亞電力負(fù)荷需求量數(shù)據(jù)和2018年12月30日至2019年12月28日采取具有代表性的兩個(gè)省會(huì)城市日最高氣溫氣象數(shù)據(jù)(1年365組)。2.2傳統(tǒng)時(shí)間序列分析方法傳統(tǒng)時(shí)間序列分析方法主要包含兩類(lèi):描述性的時(shí)間序列分析和基于數(shù)理統(tǒng)計(jì)的時(shí)間序列分析。描述性的分析方法主要通過(guò)直接對(duì)比觀察數(shù)據(jù)間不同或者繪制圖像來(lái)分析,探尋序列間潛藏的規(guī)律,把這種直觀簡(jiǎn)單的觀測(cè)方法定義為描述性時(shí)間序列方法,它的特點(diǎn)是操作方便、直觀高效等,當(dāng)然此方法也為數(shù)理統(tǒng)計(jì)分析時(shí)序序列的開(kāi)端。后者分析方法是基于數(shù)學(xué)和計(jì)量統(tǒng)計(jì)學(xué)的。而人們對(duì)傳統(tǒng)時(shí)間序列預(yù)測(cè)方法的研究
【參考文獻(xiàn)】:
期刊論文
[1]基于LSTM神經(jīng)網(wǎng)絡(luò)的金融時(shí)間序列預(yù)測(cè)[J]. 歐陽(yáng)紅兵,黃亢,閆洪舉. 中國(guó)管理科學(xué). 2020(04)
[2]基于多目標(biāo)支持向量機(jī)的ADHD分類(lèi)[J]. 杜海鵬,邵立珍,張冬輝. 工程科學(xué)學(xué)報(bào). 2020(04)
[3]基于Wide&Deep-LSTM模型的短期臺(tái)區(qū)負(fù)荷預(yù)測(cè)[J]. 呂海燦,王偉峰,趙兵,張毅,郭秋婷,胡偉. 電網(wǎng)技術(shù). 2020(02)
[4]長(zhǎng)短期記憶網(wǎng)絡(luò)預(yù)測(cè)混沌時(shí)間序列[J]. 熊有成,趙鴻. 中國(guó)科學(xué):物理學(xué) 力學(xué) 天文學(xué). 2019(12)
[5]基于維度加權(quán)的殘差LSTM短期交通流量預(yù)測(cè)[J]. 李月龍,唐德華,姜桂圓,肖志濤,耿磊,張芳,吳駿. 計(jì)算機(jī)工程. 2019(06)
[6]基于LSTM的化肥價(jià)格指數(shù)預(yù)測(cè)[J]. 周楊,周林立,劉磊. 儀表技術(shù). 2019(04)
[7]基于RNN-LSTM的磨礦系統(tǒng)故障診斷技術(shù)[J]. 曲星宇,曾鵬,李俊鵬. 信息與控制. 2019(02)
[8]永磁同步電機(jī)有限控集模型預(yù)測(cè)電流控制預(yù)測(cè)誤差分析[J]. 李鍵,牛峰,黃曉艷,方攸同. 電機(jī)與控制學(xué)報(bào). 2019(04)
[9]基于Keras的LSTM模型在空氣質(zhì)量指數(shù)預(yù)測(cè)的應(yīng)用[J]. 鄭洋洋,白艷萍,侯宇超. 數(shù)學(xué)的實(shí)踐與認(rèn)識(shí). 2019(07)
[10]基于BiRNN的維吾爾語(yǔ)情感韻律短語(yǔ)注意力模型[J]. 帕麗旦·木合塔爾,買(mǎi)買(mǎi)提阿依甫,楊文忠,吾守爾·斯拉木. 電子科技大學(xué)學(xué)報(bào). 2019(01)
博士論文
[1]基于機(jī)器學(xué)習(xí)的時(shí)間序列模型研究及其應(yīng)用[D]. 楊玉軍.電子科技大學(xué) 2018
本文編號(hào):3345471
【文章來(lái)源】:西安科技大學(xué)陜西省
【文章頁(yè)數(shù)】:77 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
研究思路圖
2傳統(tǒng)的時(shí)間序列分析方法11(3)多維度:數(shù)據(jù)產(chǎn)生不單單只有一個(gè)屬性,多屬性共存情況下必然會(huì)有特征的冗余,數(shù)據(jù)間的干擾,在學(xué)習(xí)訓(xùn)練過(guò)程中模型勢(shì)必會(huì)有所影響。如果高維度數(shù)據(jù)未經(jīng)處理降維,就會(huì)增加數(shù)據(jù)整體的復(fù)雜度,這樣許多傳統(tǒng)的機(jī)器學(xué)習(xí)方法預(yù)測(cè)也是效果不佳的。(4)海量性:隨著大數(shù)據(jù)時(shí)代的來(lái)臨,每天都會(huì)產(chǎn)生海量級(jí)的時(shí)間序列數(shù)據(jù),也因此產(chǎn)生了數(shù)據(jù)云的概念。(5)周期性:某個(gè)變量因外部環(huán)境變化如季節(jié)或事件高峰期出現(xiàn)交替現(xiàn)象的規(guī)律等。(6)趨勢(shì)性:某因素按照時(shí)間次序的發(fā)展或者隨自變量改變,整體數(shù)據(jù)變化存在持續(xù)升高、下坡趨勢(shì)或短暫性保持不變的動(dòng)態(tài)平衡趨勢(shì),變動(dòng)幅度略有不等。(7)綜合性:序列構(gòu)成是由多種變化情況線性相加或組合的形式。在進(jìn)行預(yù)測(cè)時(shí)應(yīng)該盡可能剔除掉不相關(guān)干擾數(shù)據(jù),著重體現(xiàn)其變動(dòng)的周期性、趨勢(shì)性等特點(diǎn)。2.1.3時(shí)間序列的種類(lèi)按數(shù)據(jù)的表現(xiàn)形式將時(shí)間序列分為:絕對(duì)數(shù)時(shí)間序列、相對(duì)數(shù)時(shí)間序列、平均數(shù)時(shí)間序列[32]。如圖2.1所示。(1)絕對(duì)數(shù)時(shí)間序列它定義為一系列的同一類(lèi)型的總量指標(biāo)數(shù)據(jù)以時(shí)間發(fā)生的前后次序而排列構(gòu)成的一組序列,表明此序列在多個(gè)時(shí)間段內(nèi)處于絕對(duì)水平,也稱(chēng)為總量指標(biāo)時(shí)間序列。絕對(duì)數(shù)時(shí)間序列由時(shí)點(diǎn)序列和時(shí)期序列構(gòu)成。如下圖2.2和2.3所示。圖2.1絕對(duì)數(shù)時(shí)間序列、相對(duì)數(shù)時(shí)間序列、平均數(shù)時(shí)間序列①時(shí)期序列包含的每個(gè)數(shù)據(jù)對(duì)應(yīng)的是時(shí)期指標(biāo),代表每個(gè)數(shù)據(jù)現(xiàn)象發(fā)生于每個(gè)時(shí)間段中的總量,時(shí)點(diǎn)序列包含的每個(gè)數(shù)據(jù)對(duì)應(yīng)的是時(shí)點(diǎn)指標(biāo),描述其每個(gè)數(shù)據(jù)發(fā)生現(xiàn)象于每個(gè)時(shí)點(diǎn)位置所保持的狀態(tài)和達(dá)到的水平。
西安科技大學(xué)全日制工程碩士學(xué)位論文12②時(shí)間序列中,各數(shù)據(jù)間的時(shí)期序列可以彼此相加,而時(shí)點(diǎn)序列數(shù)據(jù)不具有可加性。③時(shí)期序列它的數(shù)值大小的直接影響因素與數(shù)據(jù)所處的時(shí)間長(zhǎng)短有關(guān),時(shí)點(diǎn)序列它的各個(gè)時(shí)點(diǎn)數(shù)據(jù)的數(shù)值大小和時(shí)點(diǎn)間隔長(zhǎng)短無(wú)直接性的關(guān)系。④時(shí)間序列中,時(shí)期序列數(shù)據(jù)表示對(duì)每個(gè)時(shí)間段所發(fā)生的數(shù)據(jù)量進(jìn)行連續(xù)不間斷的統(tǒng)計(jì),時(shí)點(diǎn)序列數(shù)據(jù)則不要求連續(xù)統(tǒng)計(jì),且它不可能存在連續(xù)發(fā)生的現(xiàn)象。圖2.2時(shí)期序列圖2.3時(shí)點(diǎn)序列(2)相對(duì)數(shù)時(shí)間序列指由同類(lèi)型系列的同一種類(lèi)的相對(duì)數(shù)遵照時(shí)間發(fā)生的前后次序組成的序列,可以體現(xiàn)數(shù)據(jù)現(xiàn)象相對(duì)水平或者是數(shù)量間的一種動(dòng)態(tài)對(duì)比關(guān)系。(3)平均數(shù)時(shí)間序列由一系列同類(lèi)的平均數(shù)按時(shí)間先后順序排列而成的序列,反映現(xiàn)象一般水平發(fā)展變化過(guò)程和趨勢(shì)。本文所采用的數(shù)據(jù)集為絕對(duì)數(shù)時(shí)間序列中的時(shí)點(diǎn)序列,分別為2019年7月1日00:00至2019年9月1日00:00每半小時(shí)采取一次的約3000條澳大利亞電力負(fù)荷需求量數(shù)據(jù)和2018年12月30日至2019年12月28日采取具有代表性的兩個(gè)省會(huì)城市日最高氣溫氣象數(shù)據(jù)(1年365組)。2.2傳統(tǒng)時(shí)間序列分析方法傳統(tǒng)時(shí)間序列分析方法主要包含兩類(lèi):描述性的時(shí)間序列分析和基于數(shù)理統(tǒng)計(jì)的時(shí)間序列分析。描述性的分析方法主要通過(guò)直接對(duì)比觀察數(shù)據(jù)間不同或者繪制圖像來(lái)分析,探尋序列間潛藏的規(guī)律,把這種直觀簡(jiǎn)單的觀測(cè)方法定義為描述性時(shí)間序列方法,它的特點(diǎn)是操作方便、直觀高效等,當(dāng)然此方法也為數(shù)理統(tǒng)計(jì)分析時(shí)序序列的開(kāi)端。后者分析方法是基于數(shù)學(xué)和計(jì)量統(tǒng)計(jì)學(xué)的。而人們對(duì)傳統(tǒng)時(shí)間序列預(yù)測(cè)方法的研究
【參考文獻(xiàn)】:
期刊論文
[1]基于LSTM神經(jīng)網(wǎng)絡(luò)的金融時(shí)間序列預(yù)測(cè)[J]. 歐陽(yáng)紅兵,黃亢,閆洪舉. 中國(guó)管理科學(xué). 2020(04)
[2]基于多目標(biāo)支持向量機(jī)的ADHD分類(lèi)[J]. 杜海鵬,邵立珍,張冬輝. 工程科學(xué)學(xué)報(bào). 2020(04)
[3]基于Wide&Deep-LSTM模型的短期臺(tái)區(qū)負(fù)荷預(yù)測(cè)[J]. 呂海燦,王偉峰,趙兵,張毅,郭秋婷,胡偉. 電網(wǎng)技術(shù). 2020(02)
[4]長(zhǎng)短期記憶網(wǎng)絡(luò)預(yù)測(cè)混沌時(shí)間序列[J]. 熊有成,趙鴻. 中國(guó)科學(xué):物理學(xué) 力學(xué) 天文學(xué). 2019(12)
[5]基于維度加權(quán)的殘差LSTM短期交通流量預(yù)測(cè)[J]. 李月龍,唐德華,姜桂圓,肖志濤,耿磊,張芳,吳駿. 計(jì)算機(jī)工程. 2019(06)
[6]基于LSTM的化肥價(jià)格指數(shù)預(yù)測(cè)[J]. 周楊,周林立,劉磊. 儀表技術(shù). 2019(04)
[7]基于RNN-LSTM的磨礦系統(tǒng)故障診斷技術(shù)[J]. 曲星宇,曾鵬,李俊鵬. 信息與控制. 2019(02)
[8]永磁同步電機(jī)有限控集模型預(yù)測(cè)電流控制預(yù)測(cè)誤差分析[J]. 李鍵,牛峰,黃曉艷,方攸同. 電機(jī)與控制學(xué)報(bào). 2019(04)
[9]基于Keras的LSTM模型在空氣質(zhì)量指數(shù)預(yù)測(cè)的應(yīng)用[J]. 鄭洋洋,白艷萍,侯宇超. 數(shù)學(xué)的實(shí)踐與認(rèn)識(shí). 2019(07)
[10]基于BiRNN的維吾爾語(yǔ)情感韻律短語(yǔ)注意力模型[J]. 帕麗旦·木合塔爾,買(mǎi)買(mǎi)提阿依甫,楊文忠,吾守爾·斯拉木. 電子科技大學(xué)學(xué)報(bào). 2019(01)
博士論文
[1]基于機(jī)器學(xué)習(xí)的時(shí)間序列模型研究及其應(yīng)用[D]. 楊玉軍.電子科技大學(xué) 2018
本文編號(hào):3345471
本文鏈接:http://sikaile.net/shoufeilunwen/benkebiyelunwen/3345471.html
最近更新
教材專(zhuān)著