基于大數(shù)據(jù)的投資者情緒指數(shù)構(gòu)建及其應(yīng)用研究
發(fā)布時間:2021-11-12 09:43
傳統(tǒng)金融學(xué)認為投資者是“理性人”,當市場出現(xiàn)波動價格偏離價值時會立即糾正這種偏誤,而上世紀七十年代末以來,金融市場出現(xiàn)了許多有悖傳統(tǒng)金融理論的異象。對此,行為金融學(xué)基于心理學(xué)等視角研究了投資者在參與市場過程中的心理特征與決策行為,并形成了較為完整的理論體系。行為金融學(xué)的一個重要研究內(nèi)容為投資者情緒,其中投資者情緒的量化是相關(guān)研究的基礎(chǔ)與重點。大數(shù)據(jù)時代前,學(xué)者們主要是選取一些如成交量、換手率等能夠反映股票市場總體發(fā)展狀況的指標作為情緒的代理變量,這類變量無法全面反映投資者情緒變化,且只能從客觀上反映投資者情緒。大數(shù)據(jù)時代的到來,互聯(lián)網(wǎng)數(shù)據(jù)的大量、全面、實時、真實等特點為投資者情緒指數(shù)的編制提供了更全面的數(shù)據(jù)基礎(chǔ),同時隨著機器學(xué)習(xí)等技術(shù)的不斷成熟,原先因為技術(shù)限制而無法獲取和利用的數(shù)據(jù)逐漸被學(xué)者們納入到可以研究的范圍內(nèi),因此,基于大數(shù)據(jù)構(gòu)建投資者情緒指數(shù)是一種相對客觀且準確的情緒度量方法。本文主要研究了投資者情緒指數(shù)的構(gòu)建及其與我國股市的影響關(guān)系。關(guān)于投資者情緒指數(shù)構(gòu)建方面,首先基于大數(shù)據(jù)視角下投資者情緒的界定,選取了能反映投資者情感傾向的“用戶評論內(nèi)容”與能反映投資者關(guān)注度的“用戶發(fā)帖...
【文章來源】:河南大學(xué)河南省
【文章頁數(shù)】:83 頁
【學(xué)位級別】:碩士
【部分圖文】:
研究思路圖
相關(guān)理論分析與方法16基于機器學(xué)習(xí)分類法的分類效果更加依賴樣本數(shù)據(jù)量。該方法有以下優(yōu)點:1、學(xué)習(xí)能力強,機器學(xué)習(xí)方法不分析文字表面的意思,其通過創(chuàng)建學(xué)習(xí)內(nèi)容的抽象表征,這些泛化的結(jié)果被稱為向量,機器學(xué)習(xí)可以用向量對數(shù)據(jù)進行分類,且能夠用最新的訓(xùn)練樣本學(xué)習(xí)新出現(xiàn)的詞語語義變化。2、機器學(xué)習(xí)分類方法更加精確,且模型的訓(xùn)練集樣本量越多,模型分類效果越好,故為了達到更加精準的效果,可以簡單地通過增加訓(xùn)練樣本量從而不斷提高準確度。2.4.2指數(shù)編制中主要涉及的機器學(xué)習(xí)算法(1)LSTM算法LSTM(LongShortTermMemory)也稱長短期記憶網(wǎng)絡(luò)模型。LSTM主要由記憶細胞(Cell)與門構(gòu)成,其中記憶細胞直接在整個鏈條上進行,其狀態(tài)類似于傳送帶,只存在一些少量的線性交互,不會影響到在上面流傳的信息。LSTM主要運用三個“門”結(jié)構(gòu)來增加或刪除“細胞狀態(tài)”的信息,其中門結(jié)構(gòu)包括輸出門、輸入門、遺忘門三種,通過控制流傳的信息的增加與去除,實現(xiàn)記憶細胞的保持不變與信息更新。LSTM流程圖見下圖2-1。圖2-1LSTM模型流程圖遺忘門的功能是決定從上一層的“細胞狀態(tài)”中丟棄哪些信息,主要通過一定的遺忘概率來判斷是否需要遺忘上一層的細胞隱藏狀態(tài),其表達式為:1,tttfffwhxb(2-1)其中:為激活函數(shù),其通過輸出一個[0,1]之間的概率值決定多少變量可以通過,1表示“允許所有變量通過”,0表示“不允許任何變量通過”fw為記憶單元遺忘上一層細胞狀態(tài)的概率,tx為當前時刻的輸入值,t1h為上一時刻的輸出值,0,1tf,
基于大數(shù)據(jù)的投資者情緒指數(shù)的測度28網(wǎng)易等大型互聯(lián)網(wǎng)門戶旗下設(shè)立的股吧。本文選擇股吧主要參考兩大標準,一是專業(yè)性,二是代表性。從專業(yè)性角度考慮,本文選擇從專業(yè)的財經(jīng)網(wǎng)站中選齲從代表性角度考慮,本文參考了幾個網(wǎng)站在Alexa(alexa.com)網(wǎng)站上的排名,Alexa是一個專業(yè)提供網(wǎng)站流量信息的網(wǎng)站。在Alexa網(wǎng)站獲取到和訊網(wǎng)(hexun.com)、雪球網(wǎng)(xueqiu.com)、金融界(jrj.com.cn)、東方財富網(wǎng)(eastmoney.com)、同花順(10jqka.com.cn)幾個網(wǎng)站訪問量的競爭性分析。見下圖4-1。圖4-1財經(jīng)網(wǎng)站在Alexa上的訪問量排名從上圖可知,在網(wǎng)站訪問量指標方面,相比于金融界、同花順、和訊網(wǎng)以及雪球網(wǎng),東方財富網(wǎng)的訪問量更高。且東方財富網(wǎng)股吧的閱讀量、發(fā)帖量等數(shù)據(jù)也較高,影響力較大,故選取東方財富網(wǎng)股吧論壇作為文本數(shù)據(jù)的來源。4.1.2指數(shù)編制數(shù)據(jù)的獲取為了獲取東方財富網(wǎng)股吧的文本數(shù)據(jù),本文通過分析該網(wǎng)站的網(wǎng)頁結(jié)構(gòu),基于Python語言中的requests、beautifulsoup4、pandas、multiprocessing等外部庫設(shè)計構(gòu)建了適用東方財富網(wǎng)上證指數(shù)股吧的多進程爬蟲框架。東方財富網(wǎng)存在很強的反爬措施。為了防止股吧網(wǎng)站禁止真實IP的訪問使得數(shù)據(jù)獲取失敗,首先在爬蟲框架下添加了代理IP池來偽裝真實的IP地址。然后在request的請求中添加了user-agent、cookie、refere等瀏覽器信息,從而將爬蟲程序偽裝成正常的瀏覽器訪問,來降低遭到股吧網(wǎng)站禁止訪問的風(fēng)險,進一步提高爬蟲程序的穩(wěn)定性。具體爬蟲框架思路如下:選取requests庫作為請求器,requests庫在程序訪問中更接近正常URL訪問過程,是一個專門用來處理HTTP請求的第三方庫。調(diào)用requests
【參考文獻】:
期刊論文
[1]投資者情緒與股票橫截面收益——基于微博數(shù)據(jù)的實證研究[J]. 原東良. 金融與經(jīng)濟. 2018(07)
[2]基于股吧信息的投資者情緒與極端收益的可預(yù)測性研究[J]. 金秀,姜尚偉,苑瑩. 管理評論. 2018(07)
[3]大數(shù)據(jù)情緒指數(shù)與經(jīng)濟學(xué)研究:現(xiàn)狀、問題與展望[J]. 黃燕芬,張超. 教學(xué)與研究. 2018(05)
[4]基于股評的投資者情緒對股票市場的影響[J]. 部慧,解崢,李佳鴻,吳俊杰. 管理科學(xué)學(xué)報. 2018(04)
[5]情緒指數(shù)與市場收益:納入中國波指(iVX)的分析[J]. 許海川,周煒星. 管理科學(xué)學(xué)報. 2018(01)
[6]我國股市投資者情緒指數(shù)構(gòu)建及其影響研究[J]. 易洪波,蔡玉葉,董大勇. 價格理論與實踐. 2017(10)
[7]中國股票網(wǎng)絡(luò)論壇的信息含量分析[J]. 段江嬌,劉紅忠,曾劍平. 金融研究. 2017(10)
[8]本地偏好、投資者情緒與股票收益率:來自網(wǎng)絡(luò)論壇的經(jīng)驗證據(jù)[J]. 楊曉蘭,沈翰彬,祝宇. 金融研究. 2016(12)
[9]我國股票市場投資者情緒SENT指數(shù)的構(gòu)建——基于上證A股公司的面板數(shù)據(jù)[J]. 馬若微,張娜. 中央財經(jīng)大學(xué)學(xué)報. 2015(07)
[10]投資者情緒對中國IPO首日收益率影響的實證分析[J]. 蔣先玲,張斯琪. 經(jīng)濟問題. 2015(06)
博士論文
[1]基于情緒的投資者行為研究[D]. 薛斐.復(fù)旦大學(xué) 2005
碩士論文
[1]基于微博文本挖掘的投資者情緒與股票市場表現(xiàn)研究[D]. 張偉.山東大學(xué) 2015
本文編號:3490657
【文章來源】:河南大學(xué)河南省
【文章頁數(shù)】:83 頁
【學(xué)位級別】:碩士
【部分圖文】:
研究思路圖
相關(guān)理論分析與方法16基于機器學(xué)習(xí)分類法的分類效果更加依賴樣本數(shù)據(jù)量。該方法有以下優(yōu)點:1、學(xué)習(xí)能力強,機器學(xué)習(xí)方法不分析文字表面的意思,其通過創(chuàng)建學(xué)習(xí)內(nèi)容的抽象表征,這些泛化的結(jié)果被稱為向量,機器學(xué)習(xí)可以用向量對數(shù)據(jù)進行分類,且能夠用最新的訓(xùn)練樣本學(xué)習(xí)新出現(xiàn)的詞語語義變化。2、機器學(xué)習(xí)分類方法更加精確,且模型的訓(xùn)練集樣本量越多,模型分類效果越好,故為了達到更加精準的效果,可以簡單地通過增加訓(xùn)練樣本量從而不斷提高準確度。2.4.2指數(shù)編制中主要涉及的機器學(xué)習(xí)算法(1)LSTM算法LSTM(LongShortTermMemory)也稱長短期記憶網(wǎng)絡(luò)模型。LSTM主要由記憶細胞(Cell)與門構(gòu)成,其中記憶細胞直接在整個鏈條上進行,其狀態(tài)類似于傳送帶,只存在一些少量的線性交互,不會影響到在上面流傳的信息。LSTM主要運用三個“門”結(jié)構(gòu)來增加或刪除“細胞狀態(tài)”的信息,其中門結(jié)構(gòu)包括輸出門、輸入門、遺忘門三種,通過控制流傳的信息的增加與去除,實現(xiàn)記憶細胞的保持不變與信息更新。LSTM流程圖見下圖2-1。圖2-1LSTM模型流程圖遺忘門的功能是決定從上一層的“細胞狀態(tài)”中丟棄哪些信息,主要通過一定的遺忘概率來判斷是否需要遺忘上一層的細胞隱藏狀態(tài),其表達式為:1,tttfffwhxb(2-1)其中:為激活函數(shù),其通過輸出一個[0,1]之間的概率值決定多少變量可以通過,1表示“允許所有變量通過”,0表示“不允許任何變量通過”fw為記憶單元遺忘上一層細胞狀態(tài)的概率,tx為當前時刻的輸入值,t1h為上一時刻的輸出值,0,1tf,
基于大數(shù)據(jù)的投資者情緒指數(shù)的測度28網(wǎng)易等大型互聯(lián)網(wǎng)門戶旗下設(shè)立的股吧。本文選擇股吧主要參考兩大標準,一是專業(yè)性,二是代表性。從專業(yè)性角度考慮,本文選擇從專業(yè)的財經(jīng)網(wǎng)站中選齲從代表性角度考慮,本文參考了幾個網(wǎng)站在Alexa(alexa.com)網(wǎng)站上的排名,Alexa是一個專業(yè)提供網(wǎng)站流量信息的網(wǎng)站。在Alexa網(wǎng)站獲取到和訊網(wǎng)(hexun.com)、雪球網(wǎng)(xueqiu.com)、金融界(jrj.com.cn)、東方財富網(wǎng)(eastmoney.com)、同花順(10jqka.com.cn)幾個網(wǎng)站訪問量的競爭性分析。見下圖4-1。圖4-1財經(jīng)網(wǎng)站在Alexa上的訪問量排名從上圖可知,在網(wǎng)站訪問量指標方面,相比于金融界、同花順、和訊網(wǎng)以及雪球網(wǎng),東方財富網(wǎng)的訪問量更高。且東方財富網(wǎng)股吧的閱讀量、發(fā)帖量等數(shù)據(jù)也較高,影響力較大,故選取東方財富網(wǎng)股吧論壇作為文本數(shù)據(jù)的來源。4.1.2指數(shù)編制數(shù)據(jù)的獲取為了獲取東方財富網(wǎng)股吧的文本數(shù)據(jù),本文通過分析該網(wǎng)站的網(wǎng)頁結(jié)構(gòu),基于Python語言中的requests、beautifulsoup4、pandas、multiprocessing等外部庫設(shè)計構(gòu)建了適用東方財富網(wǎng)上證指數(shù)股吧的多進程爬蟲框架。東方財富網(wǎng)存在很強的反爬措施。為了防止股吧網(wǎng)站禁止真實IP的訪問使得數(shù)據(jù)獲取失敗,首先在爬蟲框架下添加了代理IP池來偽裝真實的IP地址。然后在request的請求中添加了user-agent、cookie、refere等瀏覽器信息,從而將爬蟲程序偽裝成正常的瀏覽器訪問,來降低遭到股吧網(wǎng)站禁止訪問的風(fēng)險,進一步提高爬蟲程序的穩(wěn)定性。具體爬蟲框架思路如下:選取requests庫作為請求器,requests庫在程序訪問中更接近正常URL訪問過程,是一個專門用來處理HTTP請求的第三方庫。調(diào)用requests
【參考文獻】:
期刊論文
[1]投資者情緒與股票橫截面收益——基于微博數(shù)據(jù)的實證研究[J]. 原東良. 金融與經(jīng)濟. 2018(07)
[2]基于股吧信息的投資者情緒與極端收益的可預(yù)測性研究[J]. 金秀,姜尚偉,苑瑩. 管理評論. 2018(07)
[3]大數(shù)據(jù)情緒指數(shù)與經(jīng)濟學(xué)研究:現(xiàn)狀、問題與展望[J]. 黃燕芬,張超. 教學(xué)與研究. 2018(05)
[4]基于股評的投資者情緒對股票市場的影響[J]. 部慧,解崢,李佳鴻,吳俊杰. 管理科學(xué)學(xué)報. 2018(04)
[5]情緒指數(shù)與市場收益:納入中國波指(iVX)的分析[J]. 許海川,周煒星. 管理科學(xué)學(xué)報. 2018(01)
[6]我國股市投資者情緒指數(shù)構(gòu)建及其影響研究[J]. 易洪波,蔡玉葉,董大勇. 價格理論與實踐. 2017(10)
[7]中國股票網(wǎng)絡(luò)論壇的信息含量分析[J]. 段江嬌,劉紅忠,曾劍平. 金融研究. 2017(10)
[8]本地偏好、投資者情緒與股票收益率:來自網(wǎng)絡(luò)論壇的經(jīng)驗證據(jù)[J]. 楊曉蘭,沈翰彬,祝宇. 金融研究. 2016(12)
[9]我國股票市場投資者情緒SENT指數(shù)的構(gòu)建——基于上證A股公司的面板數(shù)據(jù)[J]. 馬若微,張娜. 中央財經(jīng)大學(xué)學(xué)報. 2015(07)
[10]投資者情緒對中國IPO首日收益率影響的實證分析[J]. 蔣先玲,張斯琪. 經(jīng)濟問題. 2015(06)
博士論文
[1]基于情緒的投資者行為研究[D]. 薛斐.復(fù)旦大學(xué) 2005
碩士論文
[1]基于微博文本挖掘的投資者情緒與股票市場表現(xiàn)研究[D]. 張偉.山東大學(xué) 2015
本文編號:3490657
本文鏈接:http://sikaile.net/guanlilunwen/bankxd/3490657.html
最近更新
教材專著