基于神經網(wǎng)絡與自適應分形分析的股評情感分析
發(fā)布時間:2021-06-23 03:59
經典金融學以有效性市場為假說,認為金融市場的價值始終等于其基本價值,但卻無法解釋現(xiàn)實生活中的“異象”,行為金融學強調市場投資者的認知與情緒會對其決策產生影響,從而引起資本市場價格波動。股市作為投資市場的重要組成部分,其指數(shù)變動也會受到投資者情緒的影響。有很多學者利用機器學習方法對與股市投資者相關的文本進行過情感挖掘,但鮮有人提及現(xiàn)實應用環(huán)境下由于文本噪聲過多產生的不均衡文本分類問題。本文針對此問題采用序列生成對抗網(wǎng)絡算法作為文本生成器,對不均衡的股民評論等數(shù)據(jù)集完成過采樣工作,通過在隨機森林分類器上進行分類比較得出,利用序列生成對抗網(wǎng)絡算法進行文本過采樣的方法要比傳統(tǒng)的基于插值的SMOTE、Borderline-SMOTE、ADASYN等過采樣方法有效,更適合用于不均衡文本分類任務。其次針對傳統(tǒng)的卷積神經網(wǎng)絡不能捕捉到語料中的長期的上下文關系以及非連續(xù)詞之間的關系,本文將注意力機制引入到經典的短文本分類卷積神經網(wǎng)絡模型,并通過實驗證明改進結構的有效性。最后本文利用隨機分形理論里的自適應分形分析(AFA),結合構建出的投資者情緒指數(shù)與股市對數(shù)收益率,對已經分出了情感傾向的股民評論進行情感...
【文章來源】:廣西大學廣西壯族自治區(qū) 211工程院校
【文章頁數(shù)】:70 頁
【學位級別】:碩士
【部分圖文】:
圖2-1隨機過采樣示意圖??
ft?^??圖2-2二維平面SMOTE采樣示意圖??Fig.?2-2?SMOTE?sampling?in?2D??可以看到,SMOTE合成的新樣本點相當于舊樣本點與其最近鄰點連線上以一定的??概率選取的點,所以算法可視為“插值”生成新樣本。??SMOTE算法以“插值”的方式生成新樣本點,主要存在兩方面的問題:??一是在近鄰選擇時存在一定的盲目性,從算法流程可以看出,K的值需要由用戶指??定,K值的上下限難以根據(jù)實際應用情況確定;??二是算法容易生成一些噪音,將原樣本點與其對立類別的點混合到一起,具體可如??圖2-3所示:??SMOTE??60-j??4〇?■?、*?.fd???1??1?1?T??1?1??????-60?-40?-20?0?20?40?60??圖2-3?SMOTE生成采樣點示意圖??Fig.?2-3?Sample?generated?using?SMOTE??圖2-3所示的是圖2-1中的樣本經過SMOTE采樣后的結果,可以看到,中間紅色??方框框起來的是少數(shù)類經過過采樣生成的部分數(shù)據(jù)點
K值的上下限難以根據(jù)實際應用情況確定;??二是算法容易生成一些噪音,將原樣本點與其對立類別的點混合到一起,具體可如??圖2-3所示:??SMOTE??60-j??4〇?■?、*?.fd???1??1?1?T??1?1??????-60?-40?-20?0?20?40?60??圖2-3?SMOTE生成采樣點示意圖??Fig.?2-3?Sample?generated?using?SMOTE??圖2-3所示的是圖2-1中的樣本經過SMOTE采樣后的結果,可以看到,中間紅色??方框框起來的是少數(shù)類經過過采樣生成的部分數(shù)據(jù)點,這些數(shù)據(jù)點模糊了多數(shù)類與少數(shù)??9??
【參考文獻】:
期刊論文
[1]不平衡數(shù)據(jù)分類方法綜述[J]. 李艷霞,柴毅,胡友強,尹宏鵬. 控制與決策. 2019(04)
[2]基于類重疊度欠采樣的不平衡模糊多類支持向量機[J]. 吳園園,申立勇. 中國科學院大學學報. 2018(04)
[3]投資者情緒與股票市場收益的相關性研究——基于多重分形分析方法[J]. 孫凌蕓,張金林. 金融評論. 2017(05)
[4]社交媒體投資者關注、投資者情緒對中國股票市場的影響[J]. 石勇,唐靜,郭琨. 中央財經大學學報. 2017(07)
[5]基于多次隨機欠采樣和POSS方法的軟件缺陷檢測[J]. 方昊,李云. 山東大學學報(工學版). 2017(01)
[6]投資者情緒對股票市場收益和波動的影響——基于開放式股票型基金資金凈流入的實證研究[J]. 王春. 中國管理科學. 2014(09)
[7]投資者情緒、資產估值與股票市場波動[J]. 胡昌生,池陽春. 金融研究. 2013(10)
[8]中國股市投資者情緒與股票收益的實證研究[J]. 張強,楊淑娥,楊紅. 系統(tǒng)工程. 2007(07)
[9]投資者情緒與股市的互動研究[J]. 程昆,劉仁和. 上海經濟研究. 2005(11)
[10]投資者情感假說及其在中國股市的應用[J]. 張圣平,張崢,吳毛利. 經濟學動態(tài). 2004(09)
博士論文
[1]面向不平衡數(shù)據(jù)的特征選擇與半監(jiān)督分類算法研究[D]. 杜利敏.西南交通大學 2017
本文編號:3244183
【文章來源】:廣西大學廣西壯族自治區(qū) 211工程院校
【文章頁數(shù)】:70 頁
【學位級別】:碩士
【部分圖文】:
圖2-1隨機過采樣示意圖??
ft?^??圖2-2二維平面SMOTE采樣示意圖??Fig.?2-2?SMOTE?sampling?in?2D??可以看到,SMOTE合成的新樣本點相當于舊樣本點與其最近鄰點連線上以一定的??概率選取的點,所以算法可視為“插值”生成新樣本。??SMOTE算法以“插值”的方式生成新樣本點,主要存在兩方面的問題:??一是在近鄰選擇時存在一定的盲目性,從算法流程可以看出,K的值需要由用戶指??定,K值的上下限難以根據(jù)實際應用情況確定;??二是算法容易生成一些噪音,將原樣本點與其對立類別的點混合到一起,具體可如??圖2-3所示:??SMOTE??60-j??4〇?■?、*?.fd???1??1?1?T??1?1??????-60?-40?-20?0?20?40?60??圖2-3?SMOTE生成采樣點示意圖??Fig.?2-3?Sample?generated?using?SMOTE??圖2-3所示的是圖2-1中的樣本經過SMOTE采樣后的結果,可以看到,中間紅色??方框框起來的是少數(shù)類經過過采樣生成的部分數(shù)據(jù)點
K值的上下限難以根據(jù)實際應用情況確定;??二是算法容易生成一些噪音,將原樣本點與其對立類別的點混合到一起,具體可如??圖2-3所示:??SMOTE??60-j??4〇?■?、*?.fd???1??1?1?T??1?1??????-60?-40?-20?0?20?40?60??圖2-3?SMOTE生成采樣點示意圖??Fig.?2-3?Sample?generated?using?SMOTE??圖2-3所示的是圖2-1中的樣本經過SMOTE采樣后的結果,可以看到,中間紅色??方框框起來的是少數(shù)類經過過采樣生成的部分數(shù)據(jù)點,這些數(shù)據(jù)點模糊了多數(shù)類與少數(shù)??9??
【參考文獻】:
期刊論文
[1]不平衡數(shù)據(jù)分類方法綜述[J]. 李艷霞,柴毅,胡友強,尹宏鵬. 控制與決策. 2019(04)
[2]基于類重疊度欠采樣的不平衡模糊多類支持向量機[J]. 吳園園,申立勇. 中國科學院大學學報. 2018(04)
[3]投資者情緒與股票市場收益的相關性研究——基于多重分形分析方法[J]. 孫凌蕓,張金林. 金融評論. 2017(05)
[4]社交媒體投資者關注、投資者情緒對中國股票市場的影響[J]. 石勇,唐靜,郭琨. 中央財經大學學報. 2017(07)
[5]基于多次隨機欠采樣和POSS方法的軟件缺陷檢測[J]. 方昊,李云. 山東大學學報(工學版). 2017(01)
[6]投資者情緒對股票市場收益和波動的影響——基于開放式股票型基金資金凈流入的實證研究[J]. 王春. 中國管理科學. 2014(09)
[7]投資者情緒、資產估值與股票市場波動[J]. 胡昌生,池陽春. 金融研究. 2013(10)
[8]中國股市投資者情緒與股票收益的實證研究[J]. 張強,楊淑娥,楊紅. 系統(tǒng)工程. 2007(07)
[9]投資者情緒與股市的互動研究[J]. 程昆,劉仁和. 上海經濟研究. 2005(11)
[10]投資者情感假說及其在中國股市的應用[J]. 張圣平,張崢,吳毛利. 經濟學動態(tài). 2004(09)
博士論文
[1]面向不平衡數(shù)據(jù)的特征選擇與半監(jiān)督分類算法研究[D]. 杜利敏.西南交通大學 2017
本文編號:3244183
本文鏈接:http://sikaile.net/jingjilunwen/jinrongzhengquanlunwen/3244183.html
教材專著