特征降維算法在股價預(yù)測中的應(yīng)用研究
發(fā)布時間:2022-02-19 03:00
隨著信息時代的到來,數(shù)據(jù)的獲取更加便捷,不論是在維度上或樣本數(shù)目上都呈現(xiàn)爆炸性的增長。各大行業(yè)利用互聯(lián)網(wǎng)快速便捷的優(yōu)勢不斷地吸收、獲取、交換著數(shù)據(jù)信息,這些數(shù)據(jù)信息能夠幫助人們從不同的角度、不同方式詳細(xì)地描述和理解事物,但同時也出現(xiàn)維度過高、信息冗余、計算困難等問題,這些問題反而容易導(dǎo)致對信息描述的不準(zhǔn)確。雖然高維大量的樣本數(shù)據(jù)能帶給我們更多更豐富的信息,但是如何把握信息中關(guān)鍵的內(nèi)容,如何處理和摒棄掉冗余的信息仍然是需要廣泛深入研究的問題,現(xiàn)今已有一種處理方式即是對高維數(shù)據(jù)進(jìn)行降維處理。無論是線性或是非線性的降維方法都已多種多樣,其中運(yùn)用較為廣泛的一種方法是主成分分析(PCA)算法,它的優(yōu)異之處在于無特定限制的參數(shù)以及算法簡潔明了,但其本身是一種無監(jiān)督的特征提取算法,不能充分考慮到標(biāo)簽帶來的先驗信息。其次是算法提取主元個數(shù)的關(guān)鍵步驟缺乏客觀性,過多或過少的主元信息都容易使得模型精度降低,且前人對此的研究也較少。針對上述所提到的問題,本文主要研究工作如下:(1)考慮到很多研究在利用PCA算法進(jìn)行降維之前未考慮特征與標(biāo)簽之間的關(guān)聯(lián)性,即標(biāo)簽的先驗信息,本文提出在PCA進(jìn)行降維前,利用互信息...
【文章來源】:華南理工大學(xué)廣東省211工程院校985工程院校教育部直屬院校
【文章頁數(shù)】:74 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 研究背景和研究意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 特征選擇研究綜述
1.2.2 股價預(yù)測模型綜述
1.2.3 問題總結(jié)
1.3 本文研究目標(biāo)及主要內(nèi)容
1.3.1 研究對象及目標(biāo)
1.3.2 主要內(nèi)容及創(chuàng)新點
1.3.3 本文結(jié)構(gòu)安排
第二章 線性與非線性降維技術(shù)原理
2.1 線性降維算法
2.1.1 線性判別分析算法
2.1.2 局部保持投影算法
2.1.3 主成分分析算法
2.2 非線性降維算法
2.2.1 核主成分分析算法
2.2.2 多維尺度分析算法
2.2.3 局部線性嵌入算法
2.2.4 隨機(jī)分布嵌入算法及其改進(jìn)
第三章 特征降維分類框架
3.1 特征降維分類概述
3.2 特征選擇算法
3.2.1 過濾式(Filter)
3.2.2 封裝式(Wrapper)
3.2.3 嵌入式(Embedding)
3.3 特征提取算法
3.3.1 線性特征提取算法
3.3.2 非線性特征提取算法
第四章 MI-IPCA降維算法
4.1 熵和互信息
4.1.1 信息熵、聯(lián)合熵和條件熵
4.1.2 互信息
4.2 主成分分析具體算法步驟
4.3 基于MI-IPCA的雙重特征選擇算法
4.3.1 復(fù)相關(guān)系數(shù)
4.3.2 改進(jìn)的PCA算法
4.3.3 互信息和改進(jìn)的PCA融合的特征選擇算法(MI-IPCA)
第五章 MI-IPCA算法在股價預(yù)測中的實證研究
5.1 樣本數(shù)據(jù)的選取和預(yù)處理
5.1.1 樣本數(shù)據(jù)的選取
5.1.2 數(shù)據(jù)預(yù)處理
5.2 基于互信息的初步特征篩選
5.3 基于改進(jìn)的PCA算法的特征提取結(jié)果
5.4 基于BP神經(jīng)網(wǎng)絡(luò)的實證預(yù)測研究
5.4.1 BP神經(jīng)網(wǎng)絡(luò)概述
5.4.2 激活函數(shù)及網(wǎng)絡(luò)參數(shù)
5.4.3 BP網(wǎng)絡(luò)算法流程
5.4.4 模型評價標(biāo)準(zhǔn)
5.4.5 主元數(shù)選取模型的預(yù)測
5.4.6 MI-IPCA與 IPCA降維后預(yù)測結(jié)果比較
總結(jié)與展望
參考文獻(xiàn)
攻讀碩士學(xué)位期間取得的研究成果
致謝
附件
【參考文獻(xiàn)】:
期刊論文
[1]基于PCA與t-SNE特征降維的城市植被SVM識別方法[J]. 于慧伶,霍鏡宇,張怡卓,蔣毅. 實驗室研究與探索. 2019(12)
[2]主成分分析和線性判別分析應(yīng)用于心電信號特征提取和診斷算法研究[J]. 李鴻強(qiáng),魏小清,王有璽,張振,宮正,吳非凡. 生物醫(yī)學(xué)工程研究. 2019(02)
[3]基于特征選擇和SVM的電信客戶離網(wǎng)預(yù)測[J]. 盧光躍,張宏建,閆真光,吳洋. 西安郵電大學(xué)學(xué)報. 2019(02)
[4]基于DMD-LSTM模型的股票價格時間序列預(yù)測研究[J]. 史建楠,鄒俊忠,張見,汪春梅,衛(wèi)作臣. 計算機(jī)應(yīng)用研究. 2020(03)
[5]基于特征選擇和神經(jīng)網(wǎng)絡(luò)的鐵路貨運(yùn)量預(yù)測[J]. 段力,王開鵬,劉聰健,王孫超. 物流技術(shù). 2018(09)
[6]基于特征選取與LSTM模型的股指預(yù)測方法研究[J]. 陳佳,劉冬雪,武大碩. 計算機(jī)工程與應(yīng)用. 2019(06)
[7]基于正則化LSTM模型的股票指數(shù)預(yù)測[J]. 任君,王建華,王傳美,王建祥. 計算機(jī)應(yīng)用與軟件. 2018(04)
[8]基于BPNN和SVR的股票價格預(yù)測研究[J]. 冉楊帆,蔣洪迅. 山西大學(xué)學(xué)報(自然科學(xué)版). 2018(01)
[9]基于時間序列的GA-BP神經(jīng)網(wǎng)絡(luò)股價預(yù)測模型[J]. 薛倩男,高岳林. 蘭州文理學(xué)院學(xué)報(自然科學(xué)版). 2017(05)
[10]基于改進(jìn)t-SNE算法的人體運(yùn)動數(shù)據(jù)關(guān)鍵幀提取[J]. 馬吉,劉瑞,張建霞. 計算機(jī)工程. 2016(05)
博士論文
[1]面向高維數(shù)據(jù)的特征學(xué)習(xí)算法研究[D]. 王海雷.中國科學(xué)技術(shù)大學(xué) 2019
[2]基于人工神經(jīng)網(wǎng)絡(luò)的化學(xué)發(fā)光法及光度法在多組分同時測定中的應(yīng)用研究[D]. 申金山.四川大學(xué) 2005
碩士論文
[1]工業(yè)監(jiān)測數(shù)據(jù)降維及應(yīng)用[D]. 張永艷.西安理工大學(xué) 2019
[2]變分自編碼器結(jié)合t分布隨機(jī)鄰域嵌入降維及聚類分析[D]. 郭韻穎.大連理工大學(xué) 2019
[3]基于PCA-GA-BPNN模型對股價預(yù)測的研究[D]. 李海燕.西安理工大學(xué) 2018
[4]基于卷積神經(jīng)網(wǎng)絡(luò)的滬深300指數(shù)預(yù)測[D]. 陳祥一.北京郵電大學(xué) 2018
[5]基于主成分分析和BP神經(jīng)網(wǎng)絡(luò)的股價預(yù)測[D]. 劉慶霞.蘇州大學(xué) 2017
[6]高維數(shù)據(jù)降維處理關(guān)鍵技術(shù)研究[D]. 李蟬娟.電子科技大學(xué) 2017
[7]基于改進(jìn)的SVM和t-SNE高速列車走行部故障診斷[D]. 張雨晨.西南交通大學(xué) 2016
[8]改進(jìn)的卷積神經(jīng)網(wǎng)絡(luò)在金融預(yù)測中的應(yīng)用研究[D]. 張貴勇.鄭州大學(xué) 2016
[9]基于LSTM神經(jīng)網(wǎng)絡(luò)的美股股指價格趨勢預(yù)測模型的研究[D]. 孫瑞奇.首都經(jīng)濟(jì)貿(mào)易大學(xué) 2016
[10]降維算法的改進(jìn)與應(yīng)用[D]. 賈洪哲.遼寧師范大學(xué) 2014
本文編號:3632077
【文章來源】:華南理工大學(xué)廣東省211工程院校985工程院校教育部直屬院校
【文章頁數(shù)】:74 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 研究背景和研究意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 特征選擇研究綜述
1.2.2 股價預(yù)測模型綜述
1.2.3 問題總結(jié)
1.3 本文研究目標(biāo)及主要內(nèi)容
1.3.1 研究對象及目標(biāo)
1.3.2 主要內(nèi)容及創(chuàng)新點
1.3.3 本文結(jié)構(gòu)安排
第二章 線性與非線性降維技術(shù)原理
2.1 線性降維算法
2.1.1 線性判別分析算法
2.1.2 局部保持投影算法
2.1.3 主成分分析算法
2.2 非線性降維算法
2.2.1 核主成分分析算法
2.2.2 多維尺度分析算法
2.2.3 局部線性嵌入算法
2.2.4 隨機(jī)分布嵌入算法及其改進(jìn)
第三章 特征降維分類框架
3.1 特征降維分類概述
3.2 特征選擇算法
3.2.1 過濾式(Filter)
3.2.2 封裝式(Wrapper)
3.2.3 嵌入式(Embedding)
3.3 特征提取算法
3.3.1 線性特征提取算法
3.3.2 非線性特征提取算法
第四章 MI-IPCA降維算法
4.1 熵和互信息
4.1.1 信息熵、聯(lián)合熵和條件熵
4.1.2 互信息
4.2 主成分分析具體算法步驟
4.3 基于MI-IPCA的雙重特征選擇算法
4.3.1 復(fù)相關(guān)系數(shù)
4.3.2 改進(jìn)的PCA算法
4.3.3 互信息和改進(jìn)的PCA融合的特征選擇算法(MI-IPCA)
第五章 MI-IPCA算法在股價預(yù)測中的實證研究
5.1 樣本數(shù)據(jù)的選取和預(yù)處理
5.1.1 樣本數(shù)據(jù)的選取
5.1.2 數(shù)據(jù)預(yù)處理
5.2 基于互信息的初步特征篩選
5.3 基于改進(jìn)的PCA算法的特征提取結(jié)果
5.4 基于BP神經(jīng)網(wǎng)絡(luò)的實證預(yù)測研究
5.4.1 BP神經(jīng)網(wǎng)絡(luò)概述
5.4.2 激活函數(shù)及網(wǎng)絡(luò)參數(shù)
5.4.3 BP網(wǎng)絡(luò)算法流程
5.4.4 模型評價標(biāo)準(zhǔn)
5.4.5 主元數(shù)選取模型的預(yù)測
5.4.6 MI-IPCA與 IPCA降維后預(yù)測結(jié)果比較
總結(jié)與展望
參考文獻(xiàn)
攻讀碩士學(xué)位期間取得的研究成果
致謝
附件
【參考文獻(xiàn)】:
期刊論文
[1]基于PCA與t-SNE特征降維的城市植被SVM識別方法[J]. 于慧伶,霍鏡宇,張怡卓,蔣毅. 實驗室研究與探索. 2019(12)
[2]主成分分析和線性判別分析應(yīng)用于心電信號特征提取和診斷算法研究[J]. 李鴻強(qiáng),魏小清,王有璽,張振,宮正,吳非凡. 生物醫(yī)學(xué)工程研究. 2019(02)
[3]基于特征選擇和SVM的電信客戶離網(wǎng)預(yù)測[J]. 盧光躍,張宏建,閆真光,吳洋. 西安郵電大學(xué)學(xué)報. 2019(02)
[4]基于DMD-LSTM模型的股票價格時間序列預(yù)測研究[J]. 史建楠,鄒俊忠,張見,汪春梅,衛(wèi)作臣. 計算機(jī)應(yīng)用研究. 2020(03)
[5]基于特征選擇和神經(jīng)網(wǎng)絡(luò)的鐵路貨運(yùn)量預(yù)測[J]. 段力,王開鵬,劉聰健,王孫超. 物流技術(shù). 2018(09)
[6]基于特征選取與LSTM模型的股指預(yù)測方法研究[J]. 陳佳,劉冬雪,武大碩. 計算機(jī)工程與應(yīng)用. 2019(06)
[7]基于正則化LSTM模型的股票指數(shù)預(yù)測[J]. 任君,王建華,王傳美,王建祥. 計算機(jī)應(yīng)用與軟件. 2018(04)
[8]基于BPNN和SVR的股票價格預(yù)測研究[J]. 冉楊帆,蔣洪迅. 山西大學(xué)學(xué)報(自然科學(xué)版). 2018(01)
[9]基于時間序列的GA-BP神經(jīng)網(wǎng)絡(luò)股價預(yù)測模型[J]. 薛倩男,高岳林. 蘭州文理學(xué)院學(xué)報(自然科學(xué)版). 2017(05)
[10]基于改進(jìn)t-SNE算法的人體運(yùn)動數(shù)據(jù)關(guān)鍵幀提取[J]. 馬吉,劉瑞,張建霞. 計算機(jī)工程. 2016(05)
博士論文
[1]面向高維數(shù)據(jù)的特征學(xué)習(xí)算法研究[D]. 王海雷.中國科學(xué)技術(shù)大學(xué) 2019
[2]基于人工神經(jīng)網(wǎng)絡(luò)的化學(xué)發(fā)光法及光度法在多組分同時測定中的應(yīng)用研究[D]. 申金山.四川大學(xué) 2005
碩士論文
[1]工業(yè)監(jiān)測數(shù)據(jù)降維及應(yīng)用[D]. 張永艷.西安理工大學(xué) 2019
[2]變分自編碼器結(jié)合t分布隨機(jī)鄰域嵌入降維及聚類分析[D]. 郭韻穎.大連理工大學(xué) 2019
[3]基于PCA-GA-BPNN模型對股價預(yù)測的研究[D]. 李海燕.西安理工大學(xué) 2018
[4]基于卷積神經(jīng)網(wǎng)絡(luò)的滬深300指數(shù)預(yù)測[D]. 陳祥一.北京郵電大學(xué) 2018
[5]基于主成分分析和BP神經(jīng)網(wǎng)絡(luò)的股價預(yù)測[D]. 劉慶霞.蘇州大學(xué) 2017
[6]高維數(shù)據(jù)降維處理關(guān)鍵技術(shù)研究[D]. 李蟬娟.電子科技大學(xué) 2017
[7]基于改進(jìn)的SVM和t-SNE高速列車走行部故障診斷[D]. 張雨晨.西南交通大學(xué) 2016
[8]改進(jìn)的卷積神經(jīng)網(wǎng)絡(luò)在金融預(yù)測中的應(yīng)用研究[D]. 張貴勇.鄭州大學(xué) 2016
[9]基于LSTM神經(jīng)網(wǎng)絡(luò)的美股股指價格趨勢預(yù)測模型的研究[D]. 孫瑞奇.首都經(jīng)濟(jì)貿(mào)易大學(xué) 2016
[10]降維算法的改進(jìn)與應(yīng)用[D]. 賈洪哲.遼寧師范大學(xué) 2014
本文編號:3632077
本文鏈接:http://sikaile.net/kejilunwen/yysx/3632077.html
最近更新
教材專著