特征降維算法在股價(jià)預(yù)測(cè)中的應(yīng)用研究
發(fā)布時(shí)間:2022-02-19 03:00
隨著信息時(shí)代的到來(lái),數(shù)據(jù)的獲取更加便捷,不論是在維度上或樣本數(shù)目上都呈現(xiàn)爆炸性的增長(zhǎng)。各大行業(yè)利用互聯(lián)網(wǎng)快速便捷的優(yōu)勢(shì)不斷地吸收、獲取、交換著數(shù)據(jù)信息,這些數(shù)據(jù)信息能夠幫助人們從不同的角度、不同方式詳細(xì)地描述和理解事物,但同時(shí)也出現(xiàn)維度過(guò)高、信息冗余、計(jì)算困難等問(wèn)題,這些問(wèn)題反而容易導(dǎo)致對(duì)信息描述的不準(zhǔn)確。雖然高維大量的樣本數(shù)據(jù)能帶給我們更多更豐富的信息,但是如何把握信息中關(guān)鍵的內(nèi)容,如何處理和摒棄掉冗余的信息仍然是需要廣泛深入研究的問(wèn)題,現(xiàn)今已有一種處理方式即是對(duì)高維數(shù)據(jù)進(jìn)行降維處理。無(wú)論是線性或是非線性的降維方法都已多種多樣,其中運(yùn)用較為廣泛的一種方法是主成分分析(PCA)算法,它的優(yōu)異之處在于無(wú)特定限制的參數(shù)以及算法簡(jiǎn)潔明了,但其本身是一種無(wú)監(jiān)督的特征提取算法,不能充分考慮到標(biāo)簽帶來(lái)的先驗(yàn)信息。其次是算法提取主元個(gè)數(shù)的關(guān)鍵步驟缺乏客觀性,過(guò)多或過(guò)少的主元信息都容易使得模型精度降低,且前人對(duì)此的研究也較少。針對(duì)上述所提到的問(wèn)題,本文主要研究工作如下:(1)考慮到很多研究在利用PCA算法進(jìn)行降維之前未考慮特征與標(biāo)簽之間的關(guān)聯(lián)性,即標(biāo)簽的先驗(yàn)信息,本文提出在PCA進(jìn)行降維前,利用互信息...
【文章來(lái)源】:華南理工大學(xué)廣東省211工程院校985工程院校教育部直屬院校
【文章頁(yè)數(shù)】:74 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 研究背景和研究意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.2.1 特征選擇研究綜述
1.2.2 股價(jià)預(yù)測(cè)模型綜述
1.2.3 問(wèn)題總結(jié)
1.3 本文研究目標(biāo)及主要內(nèi)容
1.3.1 研究對(duì)象及目標(biāo)
1.3.2 主要內(nèi)容及創(chuàng)新點(diǎn)
1.3.3 本文結(jié)構(gòu)安排
第二章 線性與非線性降維技術(shù)原理
2.1 線性降維算法
2.1.1 線性判別分析算法
2.1.2 局部保持投影算法
2.1.3 主成分分析算法
2.2 非線性降維算法
2.2.1 核主成分分析算法
2.2.2 多維尺度分析算法
2.2.3 局部線性嵌入算法
2.2.4 隨機(jī)分布嵌入算法及其改進(jìn)
第三章 特征降維分類(lèi)框架
3.1 特征降維分類(lèi)概述
3.2 特征選擇算法
3.2.1 過(guò)濾式(Filter)
3.2.2 封裝式(Wrapper)
3.2.3 嵌入式(Embedding)
3.3 特征提取算法
3.3.1 線性特征提取算法
3.3.2 非線性特征提取算法
第四章 MI-IPCA降維算法
4.1 熵和互信息
4.1.1 信息熵、聯(lián)合熵和條件熵
4.1.2 互信息
4.2 主成分分析具體算法步驟
4.3 基于MI-IPCA的雙重特征選擇算法
4.3.1 復(fù)相關(guān)系數(shù)
4.3.2 改進(jìn)的PCA算法
4.3.3 互信息和改進(jìn)的PCA融合的特征選擇算法(MI-IPCA)
第五章 MI-IPCA算法在股價(jià)預(yù)測(cè)中的實(shí)證研究
5.1 樣本數(shù)據(jù)的選取和預(yù)處理
5.1.1 樣本數(shù)據(jù)的選取
5.1.2 數(shù)據(jù)預(yù)處理
5.2 基于互信息的初步特征篩選
5.3 基于改進(jìn)的PCA算法的特征提取結(jié)果
5.4 基于BP神經(jīng)網(wǎng)絡(luò)的實(shí)證預(yù)測(cè)研究
5.4.1 BP神經(jīng)網(wǎng)絡(luò)概述
5.4.2 激活函數(shù)及網(wǎng)絡(luò)參數(shù)
5.4.3 BP網(wǎng)絡(luò)算法流程
5.4.4 模型評(píng)價(jià)標(biāo)準(zhǔn)
5.4.5 主元數(shù)選取模型的預(yù)測(cè)
5.4.6 MI-IPCA與 IPCA降維后預(yù)測(cè)結(jié)果比較
總結(jié)與展望
參考文獻(xiàn)
攻讀碩士學(xué)位期間取得的研究成果
致謝
附件
【參考文獻(xiàn)】:
期刊論文
[1]基于PCA與t-SNE特征降維的城市植被SVM識(shí)別方法[J]. 于慧伶,霍鏡宇,張怡卓,蔣毅. 實(shí)驗(yàn)室研究與探索. 2019(12)
[2]主成分分析和線性判別分析應(yīng)用于心電信號(hào)特征提取和診斷算法研究[J]. 李鴻強(qiáng),魏小清,王有璽,張振,宮正,吳非凡. 生物醫(yī)學(xué)工程研究. 2019(02)
[3]基于特征選擇和SVM的電信客戶離網(wǎng)預(yù)測(cè)[J]. 盧光躍,張宏建,閆真光,吳洋. 西安郵電大學(xué)學(xué)報(bào). 2019(02)
[4]基于DMD-LSTM模型的股票價(jià)格時(shí)間序列預(yù)測(cè)研究[J]. 史建楠,鄒俊忠,張見(jiàn),汪春梅,衛(wèi)作臣. 計(jì)算機(jī)應(yīng)用研究. 2020(03)
[5]基于特征選擇和神經(jīng)網(wǎng)絡(luò)的鐵路貨運(yùn)量預(yù)測(cè)[J]. 段力,王開(kāi)鵬,劉聰健,王孫超. 物流技術(shù). 2018(09)
[6]基于特征選取與LSTM模型的股指預(yù)測(cè)方法研究[J]. 陳佳,劉冬雪,武大碩. 計(jì)算機(jī)工程與應(yīng)用. 2019(06)
[7]基于正則化LSTM模型的股票指數(shù)預(yù)測(cè)[J]. 任君,王建華,王傳美,王建祥. 計(jì)算機(jī)應(yīng)用與軟件. 2018(04)
[8]基于BPNN和SVR的股票價(jià)格預(yù)測(cè)研究[J]. 冉楊帆,蔣洪迅. 山西大學(xué)學(xué)報(bào)(自然科學(xué)版). 2018(01)
[9]基于時(shí)間序列的GA-BP神經(jīng)網(wǎng)絡(luò)股價(jià)預(yù)測(cè)模型[J]. 薛倩男,高岳林. 蘭州文理學(xué)院學(xué)報(bào)(自然科學(xué)版). 2017(05)
[10]基于改進(jìn)t-SNE算法的人體運(yùn)動(dòng)數(shù)據(jù)關(guān)鍵幀提取[J]. 馬吉,劉瑞,張建霞. 計(jì)算機(jī)工程. 2016(05)
博士論文
[1]面向高維數(shù)據(jù)的特征學(xué)習(xí)算法研究[D]. 王海雷.中國(guó)科學(xué)技術(shù)大學(xué) 2019
[2]基于人工神經(jīng)網(wǎng)絡(luò)的化學(xué)發(fā)光法及光度法在多組分同時(shí)測(cè)定中的應(yīng)用研究[D]. 申金山.四川大學(xué) 2005
碩士論文
[1]工業(yè)監(jiān)測(cè)數(shù)據(jù)降維及應(yīng)用[D]. 張永艷.西安理工大學(xué) 2019
[2]變分自編碼器結(jié)合t分布隨機(jī)鄰域嵌入降維及聚類(lèi)分析[D]. 郭韻穎.大連理工大學(xué) 2019
[3]基于PCA-GA-BPNN模型對(duì)股價(jià)預(yù)測(cè)的研究[D]. 李海燕.西安理工大學(xué) 2018
[4]基于卷積神經(jīng)網(wǎng)絡(luò)的滬深300指數(shù)預(yù)測(cè)[D]. 陳祥一.北京郵電大學(xué) 2018
[5]基于主成分分析和BP神經(jīng)網(wǎng)絡(luò)的股價(jià)預(yù)測(cè)[D]. 劉慶霞.蘇州大學(xué) 2017
[6]高維數(shù)據(jù)降維處理關(guān)鍵技術(shù)研究[D]. 李蟬娟.電子科技大學(xué) 2017
[7]基于改進(jìn)的SVM和t-SNE高速列車(chē)走行部故障診斷[D]. 張雨晨.西南交通大學(xué) 2016
[8]改進(jìn)的卷積神經(jīng)網(wǎng)絡(luò)在金融預(yù)測(cè)中的應(yīng)用研究[D]. 張貴勇.鄭州大學(xué) 2016
[9]基于LSTM神經(jīng)網(wǎng)絡(luò)的美股股指價(jià)格趨勢(shì)預(yù)測(cè)模型的研究[D]. 孫瑞奇.首都經(jīng)濟(jì)貿(mào)易大學(xué) 2016
[10]降維算法的改進(jìn)與應(yīng)用[D]. 賈洪哲.遼寧師范大學(xué) 2014
本文編號(hào):3632077
【文章來(lái)源】:華南理工大學(xué)廣東省211工程院校985工程院校教育部直屬院校
【文章頁(yè)數(shù)】:74 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 研究背景和研究意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.2.1 特征選擇研究綜述
1.2.2 股價(jià)預(yù)測(cè)模型綜述
1.2.3 問(wèn)題總結(jié)
1.3 本文研究目標(biāo)及主要內(nèi)容
1.3.1 研究對(duì)象及目標(biāo)
1.3.2 主要內(nèi)容及創(chuàng)新點(diǎn)
1.3.3 本文結(jié)構(gòu)安排
第二章 線性與非線性降維技術(shù)原理
2.1 線性降維算法
2.1.1 線性判別分析算法
2.1.2 局部保持投影算法
2.1.3 主成分分析算法
2.2 非線性降維算法
2.2.1 核主成分分析算法
2.2.2 多維尺度分析算法
2.2.3 局部線性嵌入算法
2.2.4 隨機(jī)分布嵌入算法及其改進(jìn)
第三章 特征降維分類(lèi)框架
3.1 特征降維分類(lèi)概述
3.2 特征選擇算法
3.2.1 過(guò)濾式(Filter)
3.2.2 封裝式(Wrapper)
3.2.3 嵌入式(Embedding)
3.3 特征提取算法
3.3.1 線性特征提取算法
3.3.2 非線性特征提取算法
第四章 MI-IPCA降維算法
4.1 熵和互信息
4.1.1 信息熵、聯(lián)合熵和條件熵
4.1.2 互信息
4.2 主成分分析具體算法步驟
4.3 基于MI-IPCA的雙重特征選擇算法
4.3.1 復(fù)相關(guān)系數(shù)
4.3.2 改進(jìn)的PCA算法
4.3.3 互信息和改進(jìn)的PCA融合的特征選擇算法(MI-IPCA)
第五章 MI-IPCA算法在股價(jià)預(yù)測(cè)中的實(shí)證研究
5.1 樣本數(shù)據(jù)的選取和預(yù)處理
5.1.1 樣本數(shù)據(jù)的選取
5.1.2 數(shù)據(jù)預(yù)處理
5.2 基于互信息的初步特征篩選
5.3 基于改進(jìn)的PCA算法的特征提取結(jié)果
5.4 基于BP神經(jīng)網(wǎng)絡(luò)的實(shí)證預(yù)測(cè)研究
5.4.1 BP神經(jīng)網(wǎng)絡(luò)概述
5.4.2 激活函數(shù)及網(wǎng)絡(luò)參數(shù)
5.4.3 BP網(wǎng)絡(luò)算法流程
5.4.4 模型評(píng)價(jià)標(biāo)準(zhǔn)
5.4.5 主元數(shù)選取模型的預(yù)測(cè)
5.4.6 MI-IPCA與 IPCA降維后預(yù)測(cè)結(jié)果比較
總結(jié)與展望
參考文獻(xiàn)
攻讀碩士學(xué)位期間取得的研究成果
致謝
附件
【參考文獻(xiàn)】:
期刊論文
[1]基于PCA與t-SNE特征降維的城市植被SVM識(shí)別方法[J]. 于慧伶,霍鏡宇,張怡卓,蔣毅. 實(shí)驗(yàn)室研究與探索. 2019(12)
[2]主成分分析和線性判別分析應(yīng)用于心電信號(hào)特征提取和診斷算法研究[J]. 李鴻強(qiáng),魏小清,王有璽,張振,宮正,吳非凡. 生物醫(yī)學(xué)工程研究. 2019(02)
[3]基于特征選擇和SVM的電信客戶離網(wǎng)預(yù)測(cè)[J]. 盧光躍,張宏建,閆真光,吳洋. 西安郵電大學(xué)學(xué)報(bào). 2019(02)
[4]基于DMD-LSTM模型的股票價(jià)格時(shí)間序列預(yù)測(cè)研究[J]. 史建楠,鄒俊忠,張見(jiàn),汪春梅,衛(wèi)作臣. 計(jì)算機(jī)應(yīng)用研究. 2020(03)
[5]基于特征選擇和神經(jīng)網(wǎng)絡(luò)的鐵路貨運(yùn)量預(yù)測(cè)[J]. 段力,王開(kāi)鵬,劉聰健,王孫超. 物流技術(shù). 2018(09)
[6]基于特征選取與LSTM模型的股指預(yù)測(cè)方法研究[J]. 陳佳,劉冬雪,武大碩. 計(jì)算機(jī)工程與應(yīng)用. 2019(06)
[7]基于正則化LSTM模型的股票指數(shù)預(yù)測(cè)[J]. 任君,王建華,王傳美,王建祥. 計(jì)算機(jī)應(yīng)用與軟件. 2018(04)
[8]基于BPNN和SVR的股票價(jià)格預(yù)測(cè)研究[J]. 冉楊帆,蔣洪迅. 山西大學(xué)學(xué)報(bào)(自然科學(xué)版). 2018(01)
[9]基于時(shí)間序列的GA-BP神經(jīng)網(wǎng)絡(luò)股價(jià)預(yù)測(cè)模型[J]. 薛倩男,高岳林. 蘭州文理學(xué)院學(xué)報(bào)(自然科學(xué)版). 2017(05)
[10]基于改進(jìn)t-SNE算法的人體運(yùn)動(dòng)數(shù)據(jù)關(guān)鍵幀提取[J]. 馬吉,劉瑞,張建霞. 計(jì)算機(jī)工程. 2016(05)
博士論文
[1]面向高維數(shù)據(jù)的特征學(xué)習(xí)算法研究[D]. 王海雷.中國(guó)科學(xué)技術(shù)大學(xué) 2019
[2]基于人工神經(jīng)網(wǎng)絡(luò)的化學(xué)發(fā)光法及光度法在多組分同時(shí)測(cè)定中的應(yīng)用研究[D]. 申金山.四川大學(xué) 2005
碩士論文
[1]工業(yè)監(jiān)測(cè)數(shù)據(jù)降維及應(yīng)用[D]. 張永艷.西安理工大學(xué) 2019
[2]變分自編碼器結(jié)合t分布隨機(jī)鄰域嵌入降維及聚類(lèi)分析[D]. 郭韻穎.大連理工大學(xué) 2019
[3]基于PCA-GA-BPNN模型對(duì)股價(jià)預(yù)測(cè)的研究[D]. 李海燕.西安理工大學(xué) 2018
[4]基于卷積神經(jīng)網(wǎng)絡(luò)的滬深300指數(shù)預(yù)測(cè)[D]. 陳祥一.北京郵電大學(xué) 2018
[5]基于主成分分析和BP神經(jīng)網(wǎng)絡(luò)的股價(jià)預(yù)測(cè)[D]. 劉慶霞.蘇州大學(xué) 2017
[6]高維數(shù)據(jù)降維處理關(guān)鍵技術(shù)研究[D]. 李蟬娟.電子科技大學(xué) 2017
[7]基于改進(jìn)的SVM和t-SNE高速列車(chē)走行部故障診斷[D]. 張雨晨.西南交通大學(xué) 2016
[8]改進(jìn)的卷積神經(jīng)網(wǎng)絡(luò)在金融預(yù)測(cè)中的應(yīng)用研究[D]. 張貴勇.鄭州大學(xué) 2016
[9]基于LSTM神經(jīng)網(wǎng)絡(luò)的美股股指價(jià)格趨勢(shì)預(yù)測(cè)模型的研究[D]. 孫瑞奇.首都經(jīng)濟(jì)貿(mào)易大學(xué) 2016
[10]降維算法的改進(jìn)與應(yīng)用[D]. 賈洪哲.遼寧師范大學(xué) 2014
本文編號(hào):3632077
本文鏈接:http://sikaile.net/kejilunwen/yysx/3632077.html
最近更新
教材專(zhuān)著