天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 數(shù)學(xué)論文 >

大規(guī)模多源時(shí)間序列預(yù)處理與隱藏空間映射分析研究

發(fā)布時(shí)間:2020-06-18 01:57
【摘要】:近年來,隨著互聯(lián)網(wǎng)技術(shù)、大數(shù)據(jù)技術(shù)的迅速發(fā)展,數(shù)據(jù)呈現(xiàn)出爆發(fā)式的增長(zhǎng)。對(duì)數(shù)據(jù)進(jìn)行預(yù)處理提升數(shù)據(jù)質(zhì)量是確保數(shù)據(jù)挖掘方法有效性的重要一步。數(shù)據(jù)預(yù)處理通常是指處理包含噪聲數(shù)據(jù)和冗余數(shù)據(jù)的輸入數(shù)據(jù)。傳統(tǒng)的方法基于單一數(shù)據(jù)源進(jìn)行處理或者難以處理含較高噪聲的數(shù)據(jù)。本文首先介紹了時(shí)間序列的基本概念及基本分析方法,結(jié)合具體的研究?jī)?nèi)容,總結(jié)并分析了多源時(shí)間序列的研究方法及研究現(xiàn)狀。之后,主要針對(duì)多源時(shí)間序列的數(shù)據(jù)預(yù)處理算法進(jìn)行研究,研究的問題從簡(jiǎn)單到復(fù)雜,提出的算法也從淺到深。研究了含輔助數(shù)據(jù)源低維多源時(shí)間序列預(yù)處理及數(shù)據(jù)融合問題;不含輔助數(shù)據(jù)源信息的高缺失噪聲低維多源時(shí)間序列缺失數(shù)據(jù)預(yù)處理問題;高維含多種噪聲的多源時(shí)間序列預(yù)處理問題;同時(shí)研究在隱藏空間中直接建立含噪聲多源時(shí)間序列的回歸模型,為系統(tǒng)未來狀態(tài)預(yù)測(cè)作預(yù)處理。取得的主要成果如下:提出了含輔助數(shù)據(jù)源的低維多源時(shí)間序列預(yù)處理框架。在此數(shù)據(jù)預(yù)處理框架中,提出了基于優(yōu)化線性回歸(OLR)、優(yōu)化支持向量機(jī)(OSVM)和精煉支持向量機(jī)(RSVM)的缺失數(shù)據(jù)預(yù)測(cè)模型,結(jié)合輔助數(shù)據(jù)源策略,提升原始數(shù)據(jù)的數(shù)據(jù)質(zhì)量。此外,本文引入了一種基于皮爾遜關(guān)聯(lián)分析的方法融合輔助數(shù)據(jù)源的數(shù)據(jù),提取了與目標(biāo)數(shù)據(jù)源有強(qiáng)關(guān)聯(lián)關(guān)系的輔助信息,本文進(jìn)一步設(shè)計(jì)了一種基于主成分分析法(PCA)的數(shù)據(jù)清洗方法,通過對(duì)融合后的數(shù)據(jù)進(jìn)行預(yù)處理,減少了原始訓(xùn)練集的數(shù)據(jù)維度和噪聲,從而提升了故障診斷的準(zhǔn)確性,而且可進(jìn)一步減少模型的訓(xùn)練時(shí)間。大規(guī)模多源時(shí)間在并行環(huán)境下的實(shí)現(xiàn)驗(yàn)證了所提出方法的有效性及更高的執(zhí)行效率。提出了基于正則化矩陣分解的高缺失噪聲低維多源時(shí)間序列預(yù)處理算法。為提升模型的魯棒性,從整體上提取原始多源時(shí)間序列信息,本文將時(shí)間序列矩陣映射至隱藏空間,并設(shè)計(jì)適用于時(shí)間序列的正則化約束項(xiàng)以提高缺失數(shù)據(jù)預(yù)測(cè)準(zhǔn)確率。對(duì)此,本文提出了可較為精確提取矩陣分解過程中隱藏空間的隱藏因子的方法,通過約束矩陣分解以預(yù)測(cè)多源時(shí)間序列缺失數(shù)據(jù)。該方法利用每條時(shí)間序列的平滑性及傳感器網(wǎng)絡(luò)的跨源信息約束矩陣分解目標(biāo)方程。相應(yīng)地引入了平滑性約束、相關(guān)傳感器約束、不相關(guān)傳感器約束,并建立了五個(gè)相應(yīng)的模型。較好的實(shí)驗(yàn)結(jié)果驗(yàn)證了引入約束之后矩陣分解過程中的隱藏因子提取的有效性。此外,并行環(huán)境下的實(shí)現(xiàn)不僅驗(yàn)證了所提出方法的有效性,更證明了在處理規(guī)模較大數(shù)據(jù)時(shí)的高效性。針對(duì)時(shí)間序列的動(dòng)態(tài)特性,建立動(dòng)態(tài)的矩陣分解模型,以適應(yīng)當(dāng)有新樣本進(jìn)入系統(tǒng)時(shí)的快速更新。此動(dòng)態(tài)模型可確保在新樣本數(shù)據(jù)到來后更新模型時(shí)誤差控制在合理范圍內(nèi),精煉策略可確保動(dòng)態(tài)模型在長(zhǎng)時(shí)間更新后仍保持很好的魯棒性。對(duì)于大規(guī)模數(shù)據(jù)的處理,本文同樣在并行計(jì)算環(huán)境下實(shí)現(xiàn)了動(dòng)態(tài)矩陣分解模型。提出了基于特征選擇及張量分解的高維含多種噪聲時(shí)間序列預(yù)處理算法。為從高維含多種噪聲時(shí)間序列中提取緊湊的精確的表示信息進(jìn)行降噪,以獲得更優(yōu)的高維含多種噪聲時(shí)間序列分類準(zhǔn)確度,本文提出了一個(gè)有監(jiān)督時(shí)序張量分解核框架STT(Supervised Temporal Tensor kernel framework)。STT克服了傳統(tǒng)方法的一些缺陷,例如傳統(tǒng)的方法要求給定訓(xùn)練數(shù)據(jù)的相對(duì)高的完整性,要求原始時(shí)間序列的多個(gè)數(shù)據(jù)源間無時(shí)延,以及對(duì)高信噪比的需求。STT由三步組成:(1)用于特征選擇及提高模型泛化能力的魯棒性池化;(2)有監(jiān)督時(shí)序因子分解,用于提取所選特征的更緊湊的信息表示;(3)用于核生成的張量結(jié)構(gòu)投影。實(shí)驗(yàn)結(jié)果驗(yàn)證了即使當(dāng)多源時(shí)間序列中的噪聲較高時(shí),所提出的方法也可以取得較為優(yōu)良的性能。提出了面向系統(tǒng)未來狀態(tài)評(píng)價(jià)的含噪聲多源時(shí)間序列預(yù)處理框架。為了對(duì)系統(tǒng)未來狀態(tài)預(yù)測(cè)作預(yù)處理,通過預(yù)處理含輔助數(shù)據(jù)源的多源時(shí)間序列,本文提出了不完整時(shí)間序列預(yù)測(cè)框架ISM(Incomplete time series prediction based on Selective tensor modeling and Multi-kernel learning)。ISM由三部分組成:張量構(gòu)建;隱藏因子提取;張量結(jié)構(gòu)映射及多核學(xué)習(xí)。針對(duì)含輔助數(shù)據(jù)源的多源時(shí)間序列,設(shè)計(jì)了較優(yōu)的張量構(gòu)建方法;之后,將構(gòu)建的張量進(jìn)行因子分解,即將含噪聲數(shù)據(jù)映射至隱藏空間從而達(dá)到降噪的目的;最后,基于張量結(jié)構(gòu)映射并利用多核學(xué)習(xí)天然對(duì)應(yīng)的多數(shù)據(jù)源特性,進(jìn)行時(shí)間序列未來數(shù)據(jù)預(yù)測(cè),為系統(tǒng)未來狀態(tài)評(píng)價(jià)作準(zhǔn)備。實(shí)驗(yàn)結(jié)果表明,ISM框架展現(xiàn)出比傳統(tǒng)方法更優(yōu)的性能。
【學(xué)位授予單位】:上海交通大學(xué)
【學(xué)位級(jí)別】:博士
【學(xué)位授予年份】:2018
【分類號(hào)】:TP311.13;O211.61
【圖文】:

示意圖,缺失數(shù)據(jù),時(shí)間序列預(yù)測(cè),示意圖


控因素的干擾,或多或少的會(huì)出現(xiàn)數(shù)據(jù)缺失;而數(shù)據(jù)缺失會(huì)直接影響到所建立模型的效果,并最終影響到預(yù)測(cè)及決策。缺失數(shù)據(jù)預(yù)測(cè),即直接填補(bǔ)缺失的數(shù)據(jù)是基于觀測(cè)得到的數(shù)據(jù)進(jìn)行填充,如圖2 2(a)所示。因此缺失數(shù)據(jù)預(yù)測(cè)很大程度上依賴于所觀測(cè)得到的數(shù)據(jù)。作為時(shí)間序列研究的熱點(diǎn)之一,缺失數(shù)據(jù)預(yù)測(cè)的代表性建模方法包括確定性模型— 13 —

示意圖,缺失數(shù)據(jù),示意圖,預(yù)測(cè)算法


圖 3 2 缺失數(shù)據(jù)預(yù)測(cè)示意圖Fig 3 2 Illustration of missing data prediction如圖3 2所示,我們假設(shè)t缺失,時(shí)間序列的缺失數(shù)據(jù)預(yù)測(cè)算法如下[84]:t= (t 1 t 2 t 3) +t(3 1)— 22 —

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 孫其法;閆秋艷;閆欣鳴;;基于多樣化top-k shapelets轉(zhuǎn)換的時(shí)間序列分類方法[J];計(jì)算機(jī)應(yīng)用;2017年02期

2 王金策;楊寧;;時(shí)間序列趨勢(shì)預(yù)測(cè)[J];現(xiàn)代計(jì)算機(jī)(專業(yè)版);2017年02期

3 彭佳星;肖基毅;;基于分型轉(zhuǎn)折點(diǎn)的證券時(shí)間序列分段表示法[J];商;2016年31期

4 劉偉龍;;基于ARMA模型的股價(jià)預(yù)測(cè)及實(shí)證研究[J];智富時(shí)代;2017年02期

5 周仰;;《漫長(zhǎng)的告別》(年度資助攝影圖書)[J];中國攝影;2017年04期

6 王嵬;;王嵬作品[J];當(dāng)代油畫;2017年07期

7 劉明華;張晉昕;;時(shí)間序列的異常點(diǎn)診斷方法[J];中國衛(wèi)生統(tǒng)計(jì);2011年04期

8 郭崇慧;蘇木亞;;基于獨(dú)立成分分析的時(shí)間序列譜聚類方法[J];系統(tǒng)工程理論與實(shí)踐;2011年10期

9 王佳林;王斌;楊曉春;;面向不確定時(shí)間序列的分類方法[J];計(jì)算機(jī)研究與發(fā)展;2011年S3期

10 萬里;廖建新;朱曉民;倪萍;;一種基于頻繁模式的時(shí)間序列分類框架[J];電子與信息學(xué)報(bào);2010年02期

相關(guān)會(huì)議論文 前10條

1 周家斌;張海福;楊桂英;;多維多步時(shí)間序列預(yù)報(bào)方法及其應(yīng)用[A];中國現(xiàn)場(chǎng)統(tǒng)計(jì)研究會(huì)第九屆學(xué)術(shù)年會(huì)論文集[C];1999年

2 張可;李媛;柴毅;黃磊;;基于分段趨勢(shì)的符號(hào)化時(shí)間序列聚類表示[A];第37屆中國控制會(huì)議論文集(D)[C];2018年

3 張立波;龐蓉蓉;王勇;黃敏;何成濤;傅強(qiáng);曲賢敏;仲昭衍;;基于時(shí)間序列的隨機(jī)質(zhì)控設(shè)計(jì)與應(yīng)用[A];中國輸血協(xié)會(huì)第九屆輸血大會(huì)論文專輯[C];2018年

4 徐光晶;;統(tǒng)計(jì)學(xué)在大地電磁測(cè)深時(shí)間序列處理中的應(yīng)用[A];2017中國地球科學(xué)聯(lián)合學(xué)術(shù)年會(huì)論文集(二十九)——專題57:電磁地球物理學(xué)研究及其應(yīng)用[C];2017年

5 毛宇清;王詠青;王革麗;;支持向量機(jī)方法應(yīng)用于理想時(shí)間序列的預(yù)測(cè)研究[A];中國氣象學(xué)會(huì)2008年年會(huì)氣候預(yù)測(cè)研究與預(yù)測(cè)方法分會(huì)場(chǎng)論文集[C];2008年

6 吳麗娜;黃領(lǐng)梅;沈冰;呂繼強(qiáng);;黃河上游降水時(shí)間序列混沌特性識(shí)別與預(yù)測(cè)年限分析[A];水系統(tǒng)與水資源可持續(xù)管理——第七屆中國水論壇論文集[C];2009年

7 吳堅(jiān)忠;路子愚;鄭應(yīng)平;;時(shí)間序列社會(huì)悖論模型及分析[A];1989年控制理論及其應(yīng)用年會(huì)論文集(上)[C];1989年

8 雷敏;孟光;謝洪波;Kerreie Mengersen;Peter Bartlett;;嵌入維數(shù)對(duì)復(fù)雜時(shí)間序列的熵分析的影響研究[A];中國力學(xué)大會(huì)-2015論文摘要集[C];2015年

9 王兆甲;王海良;;一種相似時(shí)間序列挖掘算法及其在汽車運(yùn)動(dòng)分析中的應(yīng)用[A];2014中國汽車工程學(xué)會(huì)年會(huì)論文集[C];2014年

10 林忠輝;莫興國;薛玲;;用NDVI時(shí)間序列確定作物物侯和作物類型判別[A];第十四屆全國遙感技術(shù)學(xué)術(shù)交流會(huì)論文摘要集[C];2003年

相關(guān)重要報(bào)紙文章 前10條

1 王曉寶 楊永恒 永安期貨;淺析波動(dòng)率的均值回復(fù)特征[N];期貨日?qǐng)?bào);2017年

2 東證期貨 王愛華 楊衛(wèi)東;兩年漲跌輪回 秋季普遍下跌[N];期貨日?qǐng)?bào);2009年

3 國家統(tǒng)計(jì)局核算司 呂峰;不變價(jià)GDP時(shí)間序列數(shù)據(jù)的構(gòu)造[N];中國信息報(bào);2016年

4 ;《時(shí)間序列與金融數(shù)據(jù)分析》[N];中國信息報(bào);2004年

5 何德旭 王朝陽;時(shí)間序列計(jì)量經(jīng)濟(jì)學(xué):協(xié)整與有條件的異方差自回歸[N];中國社會(huì)科學(xué)院院報(bào);2003年

6 劉俏;讓數(shù)據(jù)坦白真相[N];21世紀(jì)經(jīng)濟(jì)報(bào)道;2003年

7 卞紀(jì);我國多時(shí)間序列濕地遙感制圖完成[N];中國氣象報(bào);2011年

8 權(quán)證一級(jí)交易商 國信證券;正股走勢(shì)及時(shí)間序列主導(dǎo)下半年權(quán)證市場(chǎng)運(yùn)行結(jié)構(gòu)[N];證券時(shí)報(bào);2006年

9 廣發(fā)期貨股指研究小組 謝貞聯(lián);Hurst指數(shù)提示市場(chǎng)升勢(shì)或?qū)⑿纬蒣N];上海證券報(bào);2012年

10 丁睿 中糧期貨研究院;試論指數(shù)HP濾波分析法的應(yīng)用[N];期貨日?qǐng)?bào);2014年

相關(guān)博士學(xué)位論文 前10條

1 劉海洋;復(fù)雜環(huán)境下時(shí)間序列預(yù)測(cè)方法研究[D];北京交通大學(xué);2019年

2 石巍巍;大規(guī)模多源時(shí)間序列預(yù)處理與隱藏空間映射分析研究[D];上海交通大學(xué);2018年

3 康峻;基于時(shí)間序列遙感數(shù)據(jù)的植被精細(xì)分類與覆蓋度反演研究[D];中國科學(xué)院大學(xué)(中國科學(xué)院遙感與數(shù)字地球研究所);2018年

4 林蕾;基于循環(huán)神經(jīng)網(wǎng)絡(luò)模型的遙感影像時(shí)間序列分類及變化檢測(cè)方法研究[D];中國科學(xué)院大學(xué)(中國科學(xué)院遙感與數(shù)字地球研究所);2018年

5 丁紅;柳江徑流分析與預(yù)測(cè)研究[D];武漢理工大學(xué);2016年

6 周超;集成時(shí)間序列InSAR技術(shù)的滑坡早期識(shí)別與預(yù)測(cè)研究[D];中國地質(zhì)大學(xué);2018年

7 張琪;時(shí)間序列流數(shù)據(jù)異常檢測(cè)問題的研究[D];山東大學(xué);2019年

8 張方;局部相似分析的統(tǒng)計(jì)研究及其在生物時(shí)間序列中的應(yīng)用[D];山東大學(xué);2019年

9 郝鵬宇;基于多時(shí)相遙感數(shù)據(jù)的作物早期識(shí)別[D];中國農(nóng)業(yè)科學(xué)院;2019年

10 鄒蕾;基于趨勢(shì)基元的時(shí)間序列同構(gòu)關(guān)系發(fā)現(xiàn)[D];北京科技大學(xué);2017年

相關(guān)碩士學(xué)位論文 前10條

1 劉彩云;基于時(shí)間序列挖掘技術(shù)的南水北調(diào)工程安全監(jiān)測(cè)數(shù)據(jù)異常檢測(cè)[D];華北水利水電大學(xué);2019年

2 潘壯壯;微博熱點(diǎn)話題表示及演化研究[D];安徽理工大學(xué);2019年

3 武帥;面向時(shí)間序列的增量模糊聚類算法研究[D];河南理工大學(xué);2018年

4 王賽蘭;基于多元方法和時(shí)間序列的PM2.5濃度分析與預(yù)測(cè)[D];湖南師范大學(xué);2019年

5 曹洋洋;時(shí)間序列的特征表示和相似性度量方法研究[D];江南大學(xué);2019年

6 劉昶;基于時(shí)間序列的經(jīng)典模型和LSTM模型的城市宏觀行程速度預(yù)測(cè)研究[D];北京交通大學(xué);2019年

7 朱志靜;基于趨勢(shì)和特征子序列的時(shí)間序列數(shù)據(jù)挖掘研究[D];江南大學(xué);2019年

8 尹康;基于LSTM的關(guān)聯(lián)時(shí)間序列預(yù)測(cè)方法研究[D];北京交通大學(xué);2019年

9 陳洋;中高空間分辨率衛(wèi)星NDVI時(shí)間序列數(shù)據(jù)重建技術(shù)研究[D];電子科技大學(xué);2019年

10 肖寧寧;基于時(shí)間序列InSAR技術(shù)的成都地區(qū)地表沉降研究[D];電子科技大學(xué);2019年



本文編號(hào):2718510

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/yysx/2718510.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶aa3bf***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com