基于文本挖掘的投資者情緒與股票市場波動關系研究
【文章頁數(shù)】:54 頁
【學位級別】:碩士
【部分圖文】:
圖2-1中國石油詞云圖
基于文本挖掘的投資者情緒與股票市場波動關系研究17包,該分詞包的底層使用的是C++,而后通過Rcpp進行調(diào)用,相較于其他方法的分詞包,它具有分詞精度高、分詞速度快等優(yōu)點。因此,本文采用了jiebaR程序包對文本數(shù)據(jù)進行中文分詞,并對中國石油的文本數(shù)據(jù)分詞處理結果后進行了可視化,形....
圖2-2樸素貝葉斯分類
第二章投資者情緒指數(shù)測度18圖2-2樸素貝葉斯分類圖2-3支持向量機分類在對所有的文本數(shù)據(jù)進行分類之前,需要合理的選取一定比例的訓練數(shù)據(jù)集作為樣本,運用訓練集的擬合效果來選擇合適的分類方法。因為是從股吧中抓取出來的文本,文本數(shù)據(jù)較為口語化、不規(guī)范化,因此本文從最終清洗完成的數(shù)據(jù)集....
圖2-3支持向量機分類在對所有的文本數(shù)據(jù)進行分類之前,需要合理的選取一定比例的訓練數(shù)據(jù)集
第二章投資者情緒指數(shù)測度18圖2-2樸素貝葉斯分類圖2-3支持向量機分類在對所有的文本數(shù)據(jù)進行分類之前,需要合理的選取一定比例的訓練數(shù)據(jù)集作為樣本,運用訓練集的擬合效果來選擇合適的分類方法。因為是從股吧中抓取出來的文本,文本數(shù)據(jù)較為口語化、不規(guī)范化,因此本文從最終清洗完成的數(shù)據(jù)集....
圖2-4中國石油2018年日投資者情緒指數(shù)折線圖
爬取,隨后通過文本挖掘技術和機器學習方法對經(jīng)過文本清洗后的未標記的數(shù)據(jù)樣本進行了投資者情緒分類,主要分為看漲、看平和看跌三類,F(xiàn)已得到每個帖子投資者情緒的預測值,最后需要利用所構建的投資者情緒指標計算得出中國石油股票最終的每天的投資者情緒指數(shù)值。根據(jù)投資者情緒指數(shù)計算方法可以看出....
本文編號:3968108
本文鏈接:http://sikaile.net/guanlilunwen/shengchanguanlilunwen/3968108.html