基于文本挖掘的投資者情緒與股票市場(chǎng)波動(dòng)關(guān)系研究
【文章頁(yè)數(shù)】:54 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖2-1中國(guó)石油詞云圖
基于文本挖掘的投資者情緒與股票市場(chǎng)波動(dòng)關(guān)系研究17包,該分詞包的底層使用的是C++,而后通過(guò)Rcpp進(jìn)行調(diào)用,相較于其他方法的分詞包,它具有分詞精度高、分詞速度快等優(yōu)點(diǎn)。因此,本文采用了jiebaR程序包對(duì)文本數(shù)據(jù)進(jìn)行中文分詞,并對(duì)中國(guó)石油的文本數(shù)據(jù)分詞處理結(jié)果后進(jìn)行了可視化,形....
圖2-2樸素貝葉斯分類
第二章投資者情緒指數(shù)測(cè)度18圖2-2樸素貝葉斯分類圖2-3支持向量機(jī)分類在對(duì)所有的文本數(shù)據(jù)進(jìn)行分類之前,需要合理的選取一定比例的訓(xùn)練數(shù)據(jù)集作為樣本,運(yùn)用訓(xùn)練集的擬合效果來(lái)選擇合適的分類方法。因?yàn)槭菑墓砂芍凶ト〕鰜?lái)的文本,文本數(shù)據(jù)較為口語(yǔ)化、不規(guī)范化,因此本文從最終清洗完成的數(shù)據(jù)集....
圖2-3支持向量機(jī)分類在對(duì)所有的文本數(shù)據(jù)進(jìn)行分類之前,需要合理的選取一定比例的訓(xùn)練數(shù)據(jù)集
第二章投資者情緒指數(shù)測(cè)度18圖2-2樸素貝葉斯分類圖2-3支持向量機(jī)分類在對(duì)所有的文本數(shù)據(jù)進(jìn)行分類之前,需要合理的選取一定比例的訓(xùn)練數(shù)據(jù)集作為樣本,運(yùn)用訓(xùn)練集的擬合效果來(lái)選擇合適的分類方法。因?yàn)槭菑墓砂芍凶ト〕鰜?lái)的文本,文本數(shù)據(jù)較為口語(yǔ)化、不規(guī)范化,因此本文從最終清洗完成的數(shù)據(jù)集....
圖2-4中國(guó)石油2018年日投資者情緒指數(shù)折線圖
爬取,隨后通過(guò)文本挖掘技術(shù)和機(jī)器學(xué)習(xí)方法對(duì)經(jīng)過(guò)文本清洗后的未標(biāo)記的數(shù)據(jù)樣本進(jìn)行了投資者情緒分類,主要分為看漲、看平和看跌三類,F(xiàn)已得到每個(gè)帖子投資者情緒的預(yù)測(cè)值,最后需要利用所構(gòu)建的投資者情緒指標(biāo)計(jì)算得出中國(guó)石油股票最終的每天的投資者情緒指數(shù)值。根據(jù)投資者情緒指數(shù)計(jì)算方法可以看出....
本文編號(hào):3968108
本文鏈接:http://sikaile.net/guanlilunwen/shengchanguanlilunwen/3968108.html