基于量價與情感分析的股市預測技術(shù)研究
發(fā)布時間:2021-11-18 10:40
股市預測作為一項難度很大且富有意義的一項任務(wù),一直被各界研究者所關(guān)注。在“有效市場假說”的大前提下,一個信息公開透明,價格走勢可不受約束地隨信息的披露而波動的股市是很難預測的。然而,在實際情況下,所有投資者不可能同時掌握相同的信息,尤其是在互聯(lián)網(wǎng)高速發(fā)展的今天,網(wǎng)絡(luò)信息龐雜混亂,不同的投資者處理信息的能力不同,面對如此大量的信息會產(chǎn)生對價格走勢不同的看法。從這一觀點切入,本文希望通過現(xiàn)有技術(shù)來盡可能多的分析可獲取信息,從而盡可能準確地預測價格走勢。目前股市市場主要存在結(jié)構(gòu)化數(shù)據(jù)(量化數(shù)據(jù))以及非結(jié)構(gòu)化數(shù)據(jù)(文本數(shù)據(jù)),因此本文的研究主要從以下三個方向出發(fā):量化預測、情感分析、量化與情感分析融合預測。量化預測是整個股市預測中最基礎(chǔ)但也是最重要的一個任務(wù),其本質(zhì)是時間序列分析,已有的絕大部分工作都是基于規(guī)則或是統(tǒng)計學對價格序列進行建模,需要了解一定金融領(lǐng)域知識,然而不斷變化的股市規(guī)律以及股市市場本身的復雜性使得這種分析方式十分困難且效果也不盡人意。因此本文提出了一個基于棧式自編碼結(jié)合長短期記憶網(wǎng)絡(luò)的時間序列預測模型,通過棧式自編碼來自動構(gòu)建特征,并通過長短期記憶網(wǎng)絡(luò)來進行時間序列分析。結(jié)果...
【文章來源】:哈爾濱工業(yè)大學黑龍江省 211工程院校 985工程院校
【文章頁數(shù)】:65 頁
【學位級別】:碩士
【部分圖文】:
論文框架圖
哈爾濱工業(yè)大學工程碩士學位論文股票在開啟了一波上漲行情后,一般來說該股所在板塊的非龍頭股股一段時間過后獲得部分投資,從而股價上漲,可以看出各個股票價格是在一定程度上依賴于所處版塊。為了利用這部分信息來輔助時間序本文采用了一種基于圖的表示學習方法,來學習各個股票的板塊信息到對應(yīng)的板塊編碼。實驗結(jié)果表明,通過引入各個股票之間的板塊信于提升模型在量價時間序列上的預測效果。時間序列預測方法本節(jié)中,將詳細介紹提出的基于量價的時間序列預測方法。這里的時測任務(wù)其本質(zhì)還是一個分類任務(wù),即通過已有的歷史信息 X 來推斷出的漲跌 Y,其中 Y 只有兩個值 1、0 對應(yīng)漲、跌兩個類別。在實際任示歷史量價數(shù)據(jù),Y 表示下一天收盤價相對于當天收盤價的漲跌。本節(jié)型結(jié)構(gòu)如下圖 2-1 所示。
(2)軟閾值法 當系數(shù)絕對值大于閾值時減去閾值,反之為 0使得過濾后的函數(shù)圖像依然連續(xù),具體表達式如下:,sgn | | | | 0 | | 其中sgn 函數(shù)表示符號函數(shù)。對于非線性參數(shù)的取值,Donoho 理論證明得到非線性軟閾值表達式為。2log 公式中,n 表示時間序列的長度, 表示時間序列的標準方差,由中的噪聲強度是未知的,因此 采用如下公式來進行近似估計。Median | | /0.6745 如圖 2-2 所示,圖為使用離散小波變換對大盤指數(shù)部分序列數(shù)據(jù)的效果圖。
本文編號:3502753
【文章來源】:哈爾濱工業(yè)大學黑龍江省 211工程院校 985工程院校
【文章頁數(shù)】:65 頁
【學位級別】:碩士
【部分圖文】:
論文框架圖
哈爾濱工業(yè)大學工程碩士學位論文股票在開啟了一波上漲行情后,一般來說該股所在板塊的非龍頭股股一段時間過后獲得部分投資,從而股價上漲,可以看出各個股票價格是在一定程度上依賴于所處版塊。為了利用這部分信息來輔助時間序本文采用了一種基于圖的表示學習方法,來學習各個股票的板塊信息到對應(yīng)的板塊編碼。實驗結(jié)果表明,通過引入各個股票之間的板塊信于提升模型在量價時間序列上的預測效果。時間序列預測方法本節(jié)中,將詳細介紹提出的基于量價的時間序列預測方法。這里的時測任務(wù)其本質(zhì)還是一個分類任務(wù),即通過已有的歷史信息 X 來推斷出的漲跌 Y,其中 Y 只有兩個值 1、0 對應(yīng)漲、跌兩個類別。在實際任示歷史量價數(shù)據(jù),Y 表示下一天收盤價相對于當天收盤價的漲跌。本節(jié)型結(jié)構(gòu)如下圖 2-1 所示。
(2)軟閾值法 當系數(shù)絕對值大于閾值時減去閾值,反之為 0使得過濾后的函數(shù)圖像依然連續(xù),具體表達式如下:,sgn | | | | 0 | | 其中sgn 函數(shù)表示符號函數(shù)。對于非線性參數(shù)的取值,Donoho 理論證明得到非線性軟閾值表達式為。2log 公式中,n 表示時間序列的長度, 表示時間序列的標準方差,由中的噪聲強度是未知的,因此 采用如下公式來進行近似估計。Median | | /0.6745 如圖 2-2 所示,圖為使用離散小波變換對大盤指數(shù)部分序列數(shù)據(jù)的效果圖。
本文編號:3502753
本文鏈接:http://sikaile.net/jingjilunwen/jinrongzhengquanlunwen/3502753.html
教材專著