基于流形學習的時間序列聚類研究
本文關鍵詞:基于流形學習的時間序列聚類研究,,由筆耕文化傳播整理發(fā)布。
【摘要】:現(xiàn)實世界不是靜止不動的,而是隨著時間在不斷變化。時間序列一般是維數(shù)比較高且按時間次序進行排列的數(shù)據(jù)。它的生成過程極易受周圍環(huán)境的影響,并且有部分噪聲,時間點一般是連續(xù)且均勻分布的。聚類是對沒有類標簽的實例根據(jù)相似度進行分組,相似度大的實例分為一組,不同組之間的實例相似度最小。時間序列聚類普遍應用于工業(yè)、農(nóng)業(yè)、交通、手勢識別等行業(yè)。它的應用實例有很多,如投資組合風險管理、自然語言理解、交通流等。本文以時間序列數(shù)據(jù)為研究對象,探討了利用不同的流形學習算法對時間序列數(shù)據(jù)進行聚類以及聚類融合,從而提高聚類性能。本文的主要研究工作如下:(1)基于流形學習的時間序列聚類研究。時間序列數(shù)據(jù)通常不僅數(shù)據(jù)量大,而且是高維的,直接對原始數(shù)據(jù)集進行聚類,得到的聚類性能一般不會很好。如何有效的對時間序列降維,而且保留原數(shù)據(jù)集的主要信息,是本文的一個研究點。針對時間序列這個特點,對來自不同領域的10個時間序列數(shù)據(jù)集,分別使用三種流形學習方法,局部保持投影(Locality Preserving Projection,LPP)、局部線性嵌入(Locally Linear Embedding,LLE)、鄰域保持嵌入(Neighborhood Preserving Embedding,NPE)將其維數(shù)約簡,并對降維后的數(shù)據(jù)用K-均值算法進行聚類。這三種流形學習方法既可以對高維數(shù)據(jù)進行維數(shù)約簡,也可以試圖去發(fā)現(xiàn)高維數(shù)據(jù)中存在的低維流形結構。將三種流形學習算法的實驗結果分別與對原始數(shù)據(jù)直接K-均值聚類、使用主成分分析(Principal Component Analysis,PCA)降維后再聚類、使用分段聚合近似(Piecewise Aggregate Approximation,PAA)降維后再聚類的結果進行配對樣本t檢驗,實驗顯示三種流形學習算法的聚類性能要好于這些方法。(2)基于流形學習的時間序列聚類融合研究。只使用一種聚類算法也許實驗結果會不穩(wěn)定,如今融合多個聚類的結果已成為一種趨勢。聚類融合是將多個聚類算法或一種聚類算法通過不同的初始化或參數(shù)獲得的多個聚類成員使用共識函數(shù)進行融合,獲得最終的聚類結果。它能比較好地提升聚類算法的穩(wěn)定性。對來自不同領域的10個時間序列數(shù)據(jù)集使用LPP、LLE、NPE進行維數(shù)約簡,降維后的數(shù)據(jù)多次利用K-均值聚類得聚類成員,將這些聚類成員利用加權投票法進行聚類融合。將這三種算法的結果分別與對原始數(shù)據(jù)直接K-均值聚類、使用PCA降維后再聚類、使用PAA降維后再聚類的結果進行配對樣本t檢驗,實驗顯示三種流形學習算法的聚類性能顯著好于這些方法。
【關鍵詞】:時間序列 聚類 局部保持投影 局部線性嵌入 鄰域保持嵌入
【學位授予單位】:河北經(jīng)貿(mào)大學
【學位級別】:碩士
【學位授予年份】:2016
【分類號】:TP311.13;O211.61
【目錄】:
- 摘要4-6
- Abstract6-10
- 1 緒論10-16
- 1.1 研究背景與意義10-11
- 1.2 國內(nèi)外研究現(xiàn)狀11-14
- 1.3 論文的主要工作14-15
- 1.4 論文的組織結構15-16
- 2 流形學習方法介紹16-21
- 2.1 基本概念16
- 2.2 局部保持投影16-18
- 2.3 局部線性嵌入18-19
- 2.4 鄰域保持嵌入19-21
- 3 基于流形學習的時間序列聚類21-33
- 3.1 研究基礎21-24
- 3.1.1 主成分分析21-22
- 3.1.2 分段聚合近似22
- 3.1.3 k-均值聚類22-23
- 3.1.4 單樣本K-S檢驗和配對樣本t檢驗23-24
- 3.2 基于LPP的時間序列聚類算法24-25
- 3.3 基于LLE的時間序列聚類算法25
- 3.4 基于NPE的時間序列聚類算法25-26
- 3.5 實驗26-32
- 3.5.1 數(shù)據(jù)集描述26
- 3.5.2 評價準則26-27
- 3.5.3 性能比較27-28
- 3.5.4 結果顯著差異分析28-29
- 3.5.5 參數(shù)對算法性能的影響29-32
- 3.6 本章小結32-33
- 4 基于流形學習的時間序列聚類融合33-44
- 4.1 研究基礎33-34
- 4.1.1 聚類融合的相關概念33
- 4.1.2 類標記的轉(zhuǎn)換33-34
- 4.1.3 基于互信息的聚類成員的權值34
- 4.2 基于LPP的時間序列聚類融合算法34-35
- 4.3 基于LLE的時間序列聚類融合算法35-36
- 4.4 基于NPE的時間序列聚類融合算法36-37
- 4.5 實驗37-43
- 4.5.1 性能比較37-38
- 4.5.2 結果顯著差異分析38-39
- 4.5.3 參數(shù)對算法性能的影響39-43
- 4.6 本章小結43-44
- 5 總結與展望44-46
- 5.1 總結44
- 5.2 展望44-46
- 參考文獻46-51
- 致謝51-52
- 攻讀學位期間取得的科研成果清單52
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 尹峻松;肖健;周宗潭;胡德文;;非線性流形學習方法的分析與應用[J];自然科學進展;2007年08期
2 劉志勇;王玨;;流形學習方法及其在頭部姿勢估計中的應用[J];貴州大學學報(自然科學版);2010年04期
3 周波;;兩種基于譜方法的流形學習算法研究[J];云南民族大學學報(自然科學版);2008年04期
4 劉輝;楊俊安;王一;;基于流形學習的聲目標特征提取方法研究[J];物理學報;2011年07期
5 張德國;湯一彬;朱昌平;韓慶邦;;改進的流形學習圖像稀疏降噪方法[J];實驗室研究與探索;2013年07期
6 劉凱偉;張冬梅;;基于流形學習的異常檢測算法研究[J];計算機工程與應用;2013年13期
7 黃永毅;;基于流形學習降維技術的研究概述[J];中國科技信息;2013年14期
8 張輝遠;;基于高光譜影像的流形學習降維方法近鄰畸變分析[J];鐵道勘察;2014年02期
9 黃添強;李凱;鄭之;;有監(jiān)督的噪音流形學習算法[J];廣西師范大學學報(自然科學版);2011年03期
10 杜博;張樂飛;張良培;胡文斌;;高光譜圖像降維的判別流形學習方法[J];光子學報;2013年03期
中國重要會議論文全文數(shù)據(jù)庫 前4條
1 宋欣;王娟;張斌;葉世偉;;流形學習算法分析及在人臉數(shù)據(jù)庫上的應用[A];2008年全國開放式分布與并行計算機學術會議論文集(上冊)[C];2008年
2 劉曉平;季浩;鄧偉財;;基于流形學習的非線性系統(tǒng)可視化算法[A];全國第21屆計算機技術與應用學術會議(CACIS·2010)暨全國第2屆安全關鍵技術與應用學術會議論文集[C];2010年
3 何慧;陳博;郭軍;;基于流形學習的半監(jiān)督文本情感分類算法[A];第五屆全國信息檢索學術會議論文集[C];2009年
4 蔣全勝;賈民平;胡建中;許飛云;;一種基于流形學習的故障模式識別方法[A];第九屆全國振動理論及應用學術會議論文集[C];2007年
中國博士學位論文全文數(shù)據(jù)庫 前10條
1 蘇祖強;基于泛化流形學習的風電機組傳動系統(tǒng)早期故障診斷方法研究[D];重慶大學;2015年
2 黃焱;基于流形學習的金融數(shù)據(jù)分析方法研究[D];電子科技大學;2015年
3 馬婧華;基于流形學習的旋轉(zhuǎn)機械早期故障融合診斷方法研究[D];重慶大學;2015年
4 邢向磊;流形學習與稀疏表示在模式識別中的應用[D];南京大學;2013年
5 黃鴻;圖嵌入框架下流形學習理論及應用研究[D];重慶大學;2008年
6 尹峻松;流形學習理論與方法研究及在人臉識別中的應用[D];國防科學技術大學;2007年
7 黃啟宏;流形學習方法理論研究及圖像中應用[D];電子科技大學;2007年
8 馮海亮;流形學習算法在人臉識別中的應用研究[D];重慶大學;2008年
9 曾憲華;流形學習的譜方法相關問題研究[D];北京交通大學;2009年
10 詹宇斌;流形學習理論與方法及其應用研究[D];國防科學技術大學;2011年
中國碩士學位論文全文數(shù)據(jù)庫 前10條
1 胡浩松;基于流形學習的旋轉(zhuǎn)機械故障識別方法研究[D];燕山大學;2015年
2 丁春濤;基于圖嵌入的判別近鄰分析研究及應用[D];蘇州大學;2015年
3 余嬋娟;交互式人臉檢索中人機人臉認知一致性研究[D];上海大學;2015年
4 陳明霞;基于半監(jiān)督的多流形學習算法研究[D];華僑大學;2015年
5 顧陽陽;基于流形學習的雷達輻射源識別技術[D];西安電子科技大學;2014年
6 高漢宇;基于最優(yōu)r-覆蓋堆積數(shù)本征維數(shù)估計方法及其應用[D];西安電子科技大學;2014年
7 羅廷金;基于流形學習的數(shù)據(jù)降維算法研究[D];國防科學技術大學;2013年
8 周韻然;基于流形學習的A股上市公司抽樣的信用評價[D];電子科技大學;2014年
9 史仍浩;基于流形學習的在線社會網(wǎng)絡節(jié)點分類[D];上海交通大學;2013年
10 陳詩文;流形學習在數(shù)據(jù)降維中的應用研究[D];浙江工業(yè)大學;2015年
本文關鍵詞:基于流形學習的時間序列聚類研究,由筆耕文化傳播整理發(fā)布。
本文編號:495741
本文鏈接:http://sikaile.net/kejilunwen/yysx/495741.html