大數據的序貫預測和聚類研究
本文關鍵詞:大數據的序貫預測和聚類研究,,由筆耕文化傳播整理發(fā)布。
【摘要】:信息技術的進步導致各行各業(yè)產生的數據越來越大,這使得大數據的研究迫在眉睫。本文分別研究了序貫數據的預測方法和高維無標簽數據的聚類問題。(1)針對序貫得到樣本量龐大的數據,我們提出了序貫線性回歸方法。此方法不僅可以節(jié)約存儲空間和提高計算速度,而且預測正確率比傳統(tǒng)的均值預測高。根據數據獲取的時間效應以及數據預測效果,我們又提出了加權重的序貫線性回歸方法。(2)針對高維無標簽數據,稀疏自表示神經網絡方法進行降維,用數值優(yōu)化方法求解神經網絡并在隱層用k-means方法聚類。與其它聚類方法相比,我們從模擬數據和真實數據驗證了稀疏自表示神經網絡方法聚類的優(yōu)越性。
【關鍵詞】:大數據 序貫線性回歸方法 加權的序貫線性回歸方法 稀疏自表示神經網絡的方法 聚類
【學位授予單位】:中國科學技術大學
【學位級別】:碩士
【學位授予年份】:2016
【分類號】:O212.1;TP183
【目錄】:
- 摘要5-6
- ABSTRACT6-12
- 主要符號對照表12-13
- 第一章 緒論13-15
- 1.1 大數據研究13
- 1.2 序貫分析和高維數據聚類13-14
- 1.3 文章結構14-15
- 第二章 大數據預備知識15-33
- 2.1 常見的聚類方法15-19
- 2.1.1 k-means聚類16
- 2.1.2 DBSCAN聚類16-17
- 2.1.3 AGNES聚類17
- 2.1.4 譜聚類17-19
- 2.2 高維數據無監(jiān)督降維方法19-24
- 2.2.1 主成分分析方法19
- 2.2.2 RUFS方法19-21
- 2.2.3 SOCFS方法21-24
- 2.3 數據挖掘算法24-25
- 2.3.1 人工神經網絡24-25
- 2.4 數值優(yōu)化算法25-33
- 2.4.1 ADMM算法25-28
- 2.4.2 線搜索方法28-33
- 第三章 序貫大數據的預測方法33-45
- 3.1 問題描述與基本模型33-35
- 3.1.1 問題描述33
- 3.1.2 線性模型33-35
- 3.2 序貫線性回歸(SLR)方法35-39
- 3.2.1 序貫回歸35-36
- 3.2.2 帶權重的序貫回歸36-37
- 3.2.3 序貫估計算法37-38
- 3.2.4 序貫更新算法的收斂性38-39
- 3.2.5 SLR方法的復雜度分析39
- 3.3 真實數據實驗39-45
- 3.3.1 數據描述39-40
- 3.3.2 實驗結果40-45
- 第四章 稀疏自表示神經網絡聚類方法45-59
- 4.1 一般的神經網絡求解45-46
- 4.2 自表示神經網絡46
- 4.3 稀疏自表示神經網絡聚類46-59
- 4.3.1 單隱層的稀疏自表示神經網絡聚類(SAENN)47-51
- 4.3.2 模擬數據實驗51-54
- 4.3.3 真實數據實驗54-59
- 第五章 總結59-61
- 參考文獻61-63
- 致謝63-65
- 在讀期間發(fā)表的學術論文與取得的研究成果65
【相似文獻】
中國期刊全文數據庫 前10條
1 張志 ,王漢文;論加權擬線性回歸方法[J];中南財經大學學報;1992年03期
2 劉妙龍;多變量對多變量線性回歸方法及其在區(qū)域研究中的應用[J];湖北大學學報(自然科學版);1989年04期
3 楊小怡,黃世芹,姚雷;用線性回歸方法建立貴陽市空氣質量預報模式[J];貴州氣象;2001年04期
4 錢海榮;線性回歸方法的探討[J];統(tǒng)計與決策;2005年11期
5 趙永翔,孫亞芳,高慶;分析常用7種統(tǒng)計分布的統(tǒng)一線性回歸方法[J];機械強度;2001年01期
6 錢海榮;線性回歸方法的改進[J];統(tǒng)計與決策;2004年08期
7 劉巍,王培麟;加權擬線性回歸方法[J];寧夏工學院學報;1994年Z2期
8 陳少泳;基于線性回歸方法的工程材料需求量預測[J];鐵道物資科學管理;2004年03期
9 佟曉君;陳海彬;馬群;張建;;雙向線性回歸方法[J];機械強度;2006年06期
10 段科鋒,謝英亮;一種模糊線性回歸方法及其應用[J];南方冶金學院學報;1998年01期
中國重要會議論文全文數據庫 前1條
1 馬鐵豐;;線性回歸方法進行時間序列異常值檢驗及證券投資風險研究[A];加入WTO和中國科技與可持續(xù)發(fā)展——挑戰(zhàn)與機遇、責任和對策(上冊)[C];2002年
中國碩士學位論文全文數據庫 前3條
1 趙爽;血管緊張素轉換酶基因多態(tài)性與高血壓合并糖尿病的關系[D];華北理工大學;2015年
2 張青婷;大數據的序貫預測和聚類研究[D];中國科學技術大學;2016年
3 張秀偉;異方差雙向線性回歸方法及其在砼強度檢測中的應用[D];河北理工大學;2009年
本文關鍵詞:大數據的序貫預測和聚類研究,由筆耕文化傳播整理發(fā)布。
本文編號:273369
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/273369.html