時間序列聚類中U-shapelets提取方法的研究
發(fā)布時間:2020-12-21 18:37
時間序列數(shù)據(jù)廣泛存在于生活的各個方面,它記錄了事物在每個給定時間間隔內(nèi)的觀測值,具有數(shù)據(jù)維度高、數(shù)據(jù)量大的特點(diǎn)。時間序列聚類作為數(shù)據(jù)挖掘領(lǐng)域的一個重要研究分支,受到人們的廣泛關(guān)注。傳統(tǒng)的研究方法大多直接對整個時間序列進(jìn)行聚類分析,然而時間序列中存在的噪音等無關(guān)數(shù)據(jù)會影響聚類結(jié)果的準(zhǔn)確性。最近,一種基于u-shapelets的時間序列聚類方法被提出,該方法利用局部形狀特征來區(qū)分序列之間的差異,不僅聚類精度高,對聚類結(jié)果也有很好的解釋性。雖然基于u-shapelets的時間序列聚類方法已經(jīng)取得一定的成果,但仍存在一些問題。主要體現(xiàn)在三個方面:其一,提取u-shapelets的過程非常耗時,尤其是在一些大數(shù)據(jù)集上;其二,為了加速u-shapelets的提取而忽略其質(zhì)量,在一定程度上降低了聚類結(jié)果的準(zhǔn)確性;其三,原始的u-shapelets質(zhì)量度量方式不夠準(zhǔn)確,會影響u-shapelets的辨別性。本文圍繞以上問題主要對u-shapelets的提取過程進(jìn)行研究,其主要內(nèi)容如下:(1)本文提出一種隨機(jī)局部搜索u-shapelets的算法(Random Local Search Algorithm...
【文章來源】:華東師范大學(xué)上海市 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:75 頁
【學(xué)位級別】:碩士
【部分圖文】:
某股票在2012-2016年的交易數(shù)量
華東師范大學(xué)碩士學(xué)位論文 第一章 緒論這與人們直觀上的理解為什么有些時間序列能夠被分為同一類簇是一致的。U-shapele是利用時間序列的局部形狀特征進(jìn)行聚類分析的,這種方法可以有效緩解時間序列數(shù)據(jù)維度高以及存在噪音的問題,也可以用于不等長時間序列的聚類,最重要的是聚類結(jié)果具有準(zhǔn)確性高、可解釋性強(qiáng)的特點(diǎn)。因此,基于 u-shapelets 的時間序列聚類具有廣泛的研究前景。
一個時間序列是一組連續(xù)的實(shí)值型數(shù)據(jù)值,通常是在相同時間間隔內(nèi),給定采樣率,對某個過程進(jìn)行觀測得到的一組數(shù)據(jù)[34]。定義 2.1 時間序列。時間序列 是一個實(shí)值序列,可以表示為 ,其中 是時間序列 的長度。定義 2.2 時間序列數(shù)據(jù)集。時間序列數(shù)據(jù)集 是 個時間序列 的集合。本文研究的重點(diǎn)是時間序列的子序列,所以接下來對時間序列的子序列進(jìn)行定義。定義 2.3 子序列。一個時間序列 的子序列 是從位置 開始長度為 的連續(xù)的子片段,其中 ≤ ≤ , ≤ ≤ 。值得注意的是,子序列中的數(shù)據(jù)點(diǎn)是連續(xù)的,每個子序列可以看作是時間序列的一個局部形狀特征。子序列可以通過采用滑動窗口算法(Sliding Window Algorithm)[29]在長序列上進(jìn)行滑動得到。如圖 2.1 所示,給定窗口大小,在時間序列上滑動,每個滑動點(diǎn)產(chǎn)生一個與滑動窗口長度相等的子序列。
本文編號:2930292
【文章來源】:華東師范大學(xué)上海市 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:75 頁
【學(xué)位級別】:碩士
【部分圖文】:
某股票在2012-2016年的交易數(shù)量
華東師范大學(xué)碩士學(xué)位論文 第一章 緒論這與人們直觀上的理解為什么有些時間序列能夠被分為同一類簇是一致的。U-shapele是利用時間序列的局部形狀特征進(jìn)行聚類分析的,這種方法可以有效緩解時間序列數(shù)據(jù)維度高以及存在噪音的問題,也可以用于不等長時間序列的聚類,最重要的是聚類結(jié)果具有準(zhǔn)確性高、可解釋性強(qiáng)的特點(diǎn)。因此,基于 u-shapelets 的時間序列聚類具有廣泛的研究前景。
一個時間序列是一組連續(xù)的實(shí)值型數(shù)據(jù)值,通常是在相同時間間隔內(nèi),給定采樣率,對某個過程進(jìn)行觀測得到的一組數(shù)據(jù)[34]。定義 2.1 時間序列。時間序列 是一個實(shí)值序列,可以表示為 ,其中 是時間序列 的長度。定義 2.2 時間序列數(shù)據(jù)集。時間序列數(shù)據(jù)集 是 個時間序列 的集合。本文研究的重點(diǎn)是時間序列的子序列,所以接下來對時間序列的子序列進(jìn)行定義。定義 2.3 子序列。一個時間序列 的子序列 是從位置 開始長度為 的連續(xù)的子片段,其中 ≤ ≤ , ≤ ≤ 。值得注意的是,子序列中的數(shù)據(jù)點(diǎn)是連續(xù)的,每個子序列可以看作是時間序列的一個局部形狀特征。子序列可以通過采用滑動窗口算法(Sliding Window Algorithm)[29]在長序列上進(jìn)行滑動得到。如圖 2.1 所示,給定窗口大小,在時間序列上滑動,每個滑動點(diǎn)產(chǎn)生一個與滑動窗口長度相等的子序列。
本文編號:2930292
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/2930292.html
最近更新
教材專著