基于微博文本挖掘的投資者情緒與股票市場表現(xiàn)研究
發(fā)布時間:2017-03-16 22:09
本文關(guān)鍵詞:基于微博文本挖掘的投資者情緒與股票市場表現(xiàn)研究,由筆耕文化傳播整理發(fā)布。
【摘要】:新型網(wǎng)絡(luò)時代開啟的標志就是各種社會化網(wǎng)絡(luò)(微博、博客、微信、論壇等)的出現(xiàn)。社會化網(wǎng)絡(luò)在人們的生活中扮演著越來越重要的角色,它讓人們在信息傳遞的過程中角色由被動接收方變?yōu)橹鲃觿?chuàng)造者,這一改變極大的調(diào)動了互聯(lián)網(wǎng)用戶的積極性,每天都有大量的用戶原創(chuàng)數(shù)據(jù)(User Generated Content)產(chǎn)生。這些數(shù)據(jù)凝聚了大眾對于社會問題的觀點、看法,例如財經(jīng)媒體、金融從業(yè)者在社交媒體上實時發(fā)布股票市場信息,投資者實時獲取這些信息,表達自己對于市場和個股的看法,并與其他社會化網(wǎng)絡(luò)的參與者對某一市場問題進行討論。這些UGC數(shù)據(jù)代表了一定時期內(nèi)整個市場對于當期和未來一段時間內(nèi)走向的判斷,對于股票市場走勢的預(yù)測具有重要意義,越來越多的學(xué)者參與到對于股票市場UGC數(shù)據(jù)進行挖掘的研究當中,F(xiàn)有的研究認為分析社會化網(wǎng)絡(luò)的信息活動強度和情感傾向有利于完善現(xiàn)有的股市預(yù)測技術(shù),而國內(nèi)外現(xiàn)有研究多以論壇等傳統(tǒng)社會化媒體作為數(shù)據(jù)來源對象,對于微博這種新興的社會化媒體的研究有限。由于新浪微博是國內(nèi)市場占有率最高的微博平臺,固本文以新浪微博作為獲取數(shù)據(jù)的來源。本研究共獲取2012年——2014年期間320萬條股票市場相關(guān)微博,通過使用文本挖掘與情感分析等分析技術(shù)對獲取的微博文本數(shù)據(jù)進行量化,構(gòu)建出由投資者情感傾向、投資者未來預(yù)期與投資者關(guān)注度三大類指標組成的投資者情緒指標體系,并結(jié)合上證指數(shù)的收盤點數(shù)、收益率、波動率、成交量等市場表現(xiàn)數(shù)據(jù),探索兩者之間的相關(guān)性,通過該部分的分析證明了基于新浪微博文本分析所得到的投資者情緒各指標與股票市場表現(xiàn)之間存在相互影響。在相關(guān)性研究的基礎(chǔ)上,嘗試建立加入投資者情緒變量的上證指數(shù)的預(yù)測模型,并與傳統(tǒng)預(yù)測模型進行了比較。主要研究成果如下:(1)投資情情緒。對通常的投資者分析而言,都帶有一定程度的間接性,但本研究采用的是基于微博內(nèi)容的投資者情緒分析,這些微博往往是投資者或者市場的關(guān)注者真實的情緒表達,因此具有直接性和更強的真實性,相對間接投資者情緒價值更大。(2)構(gòu)建投資者代理情緒指標體系。本研究在已有的研究成果的基礎(chǔ)上,構(gòu)建了投資者代理情緒的指標體系。該體系為后續(xù)的投資者情緒研究奠定了基礎(chǔ)。(3)實證設(shè)計和研究。首先從微博獲取關(guān)鍵詞信息如股票市場、情感維度等幾個方面的關(guān)鍵詞的提取,隨后對其進行指標的量化。通過實證研究,發(fā)現(xiàn)投資者情感傾向和股票市場指標、投資者未來預(yù)期和股票市場指標、投資者關(guān)注度和股票市場指標之間都存在著顯著的相關(guān)關(guān)系,加入投資者情緒指標的模型預(yù)測精度要高于傳統(tǒng)模型。
【關(guān)鍵詞】:文本挖掘 情感分析 新浪微博 支持向量回歸
【學(xué)位授予單位】:山東大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2015
【分類號】:F832.51
【目錄】:
- 摘要8-10
- Abstract10-12
- 1 緒論12-19
- 1.1 研究背景12-13
- 1.2 研究意義13-14
- 1.3 研究方法14-15
- 1.4 研究內(nèi)容與論文組織結(jié)構(gòu)15-18
- 1.5 主要創(chuàng)新點18-19
- 2 文獻綜述與理論基礎(chǔ)19-29
- 2.1 投資者情緒和投資者關(guān)注度19-23
- 2.2 情感分析與預(yù)測23-27
- 2.3 股票市場表現(xiàn)27-29
- 3 數(shù)據(jù)的獲取與處理29-45
- 3.1 新浪微博的數(shù)據(jù)獲取29-30
- 3.2 關(guān)鍵詞提取與量化30-35
- 3.3 投資者情感傾向指標的量化35-39
- 3.4 投資者未來預(yù)期量化39-40
- 3.5 投資者關(guān)注度量化40-41
- 3.6 股票市場表現(xiàn)數(shù)據(jù)的整理41-45
- 4 投資者情緒和股票市場表現(xiàn)的實證研究45-63
- 4.1 投資者情感傾向和股票市場指標實證分析45-49
- 4.2 投資者未來預(yù)期和股票市場指標實證分析49-53
- 4.3 投資者關(guān)注度和股票市場指標實證分析53-56
- 4.4 投資者情感傾向、投資者未來預(yù)期、投資者關(guān)注度之間關(guān)系的實證分析56-59
- 4.5 基于SVM的傳統(tǒng)預(yù)測模型與投資者情緒預(yù)測模型比較59-63
- 5 結(jié)論和展望63-65
- 5.1 結(jié)論63-64
- 5.2 展望64-65
- 參考文獻65-70
- 致謝70-71
- 學(xué)位論文評閱及答辯情況表71
【參考文獻】
中國期刊全文數(shù)據(jù)庫 前1條
1 龐磊;李壽山;周國棟;;基于情緒知識的中文微博情感分類方法[J];計算機工程;2012年13期
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前1條
1 何印;基于互聯(lián)網(wǎng)新聞文本挖掘的投資與監(jiān)管輔助決策系統(tǒng)[D];西南財經(jīng)大學(xué);2013年
本文關(guān)鍵詞:基于微博文本挖掘的投資者情緒與股票市場表現(xiàn)研究,由筆耕文化傳播整理發(fā)布。
,本文編號:252406
本文鏈接:http://sikaile.net/guanlilunwen/zhqtouz/252406.html
最近更新
教材專著