天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于文本挖掘的投資者情緒與股票市場波動關系研究

發(fā)布時間:2024-05-09 01:22
  自1990年上海證券交易所成立以來,中國的股票市場規(guī)?焖贁U大,發(fā)展速度迅速,截止2018年末,總有1449家公司上市,上市證券共有12373只。在中國股票市場向成熟的市場化發(fā)展的進程中,投資者是該市場中重要的一個部分,但由于市場的不成熟,如受政策影響大,信息不對稱情況嚴重,易產(chǎn)生股市暴跌暴漲現(xiàn)象等,加上投資者自身金融知識的不足與心理認知偏差等,導致股票市場中存在著許多非理性行為,使得股市波動更加劇烈。同時,隨著網(wǎng)絡的不斷發(fā)展和互聯(lián)網(wǎng)時代的到來,投資者越來越多的使用網(wǎng)絡來進行股票的投資,并實時的在網(wǎng)絡平臺上留下自己的觀點或表達自己的情緒,在對股市持看漲積極態(tài)度時會在網(wǎng)絡上留下買入、加倉和持有股票等信息,在對股市持看跌消極態(tài)度時會在網(wǎng)絡上留下賣出、減倉和推出等信息。在這樣的背景下,使得研究投資者情緒與股票市場的互動影響成為了可能。本文基于行為金融學和投資者心理認知偏差理論,通過構建合適的投資者情緒指標來刻畫投資者在股票市場中的非理性行為;赑ython語句對東方財富網(wǎng)站股吧內(nèi)的帖子進行抓取后,利用文本挖掘技術對清洗后的數(shù)據(jù)進行處理分析,使文本數(shù)據(jù)量化為投資者情緒指數(shù),從而與反映股票市場...

【文章頁數(shù)】:54 頁

【學位級別】:碩士

【部分圖文】:

圖2-1中國石油詞云圖

圖2-1中國石油詞云圖

基于文本挖掘的投資者情緒與股票市場波動關系研究17包,該分詞包的底層使用的是C++,而后通過Rcpp進行調(diào)用,相較于其他方法的分詞包,它具有分詞精度高、分詞速度快等優(yōu)點。因此,本文采用了jiebaR程序包對文本數(shù)據(jù)進行中文分詞,并對中國石油的文本數(shù)據(jù)分詞處理結果后進行了可視化,形....


圖2-2樸素貝葉斯分類

圖2-2樸素貝葉斯分類

第二章投資者情緒指數(shù)測度18圖2-2樸素貝葉斯分類圖2-3支持向量機分類在對所有的文本數(shù)據(jù)進行分類之前,需要合理的選取一定比例的訓練數(shù)據(jù)集作為樣本,運用訓練集的擬合效果來選擇合適的分類方法。因為是從股吧中抓取出來的文本,文本數(shù)據(jù)較為口語化、不規(guī)范化,因此本文從最終清洗完成的數(shù)據(jù)集....


圖2-3支持向量機分類在對所有的文本數(shù)據(jù)進行分類之前,需要合理的選取一定比例的訓練數(shù)據(jù)集

圖2-3支持向量機分類在對所有的文本數(shù)據(jù)進行分類之前,需要合理的選取一定比例的訓練數(shù)據(jù)集

第二章投資者情緒指數(shù)測度18圖2-2樸素貝葉斯分類圖2-3支持向量機分類在對所有的文本數(shù)據(jù)進行分類之前,需要合理的選取一定比例的訓練數(shù)據(jù)集作為樣本,運用訓練集的擬合效果來選擇合適的分類方法。因為是從股吧中抓取出來的文本,文本數(shù)據(jù)較為口語化、不規(guī)范化,因此本文從最終清洗完成的數(shù)據(jù)集....


圖2-4中國石油2018年日投資者情緒指數(shù)折線圖

圖2-4中國石油2018年日投資者情緒指數(shù)折線圖

爬取,隨后通過文本挖掘技術和機器學習方法對經(jīng)過文本清洗后的未標記的數(shù)據(jù)樣本進行了投資者情緒分類,主要分為看漲、看平和看跌三類,F(xiàn)已得到每個帖子投資者情緒的預測值,最后需要利用所構建的投資者情緒指標計算得出中國石油股票最終的每天的投資者情緒指數(shù)值。根據(jù)投資者情緒指數(shù)計算方法可以看出....



本文編號:3968108

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/guanlilunwen/shengchanguanlilunwen/3968108.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶81e82***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com