互聯(lián)網(wǎng)財(cái)經(jīng)新聞對(duì)股市影響的定量分析
發(fā)布時(shí)間:2017-10-24 04:19
本文關(guān)鍵詞:互聯(lián)網(wǎng)財(cái)經(jīng)新聞對(duì)股市影響的定量分析
更多相關(guān)文章: 文本挖掘 支持向量機(jī) 互聯(lián)網(wǎng)新聞 股市波動(dòng) 多元線性回歸
【摘要】:影響股市波動(dòng)的因素很多,有市場(chǎng)行情、通貨膨脹、交易策略、公司本身等等因素。實(shí)際上,所有與財(cái)經(jīng)相關(guān)的信息都會(huì)影響證券市場(chǎng)股價(jià)的波動(dòng)。這些信息、最終可以歸結(jié)為定量信息和定性信息。定量信息是指可以直接獲得的實(shí)際觀測(cè)數(shù)據(jù),即技術(shù)指標(biāo),例如紅利股價(jià)比、賬面市值比、利潤(rùn)等。而定性信息、是指不能直接用數(shù)據(jù)精確描述的因素,例如商業(yè)環(huán)境、文化程度、技術(shù)優(yōu)勢(shì)、戰(zhàn)爭(zhēng)、自然災(zāi)害、政府經(jīng)濟(jì)政策變動(dòng)等等,互聯(lián)網(wǎng)財(cái)經(jīng)新聞中就包含了大量的這種定性信息。 新聞對(duì)股市有影響,這已經(jīng)是學(xué)術(shù)界和實(shí)業(yè)界公認(rèn)的事實(shí);ヂ(lián)網(wǎng)財(cái)經(jīng)新聞作為信息時(shí)代公眾獲取財(cái)經(jīng)信息的主要渠道,其與股市波動(dòng)之間必然有著某種關(guān)聯(lián),但其對(duì)上市公司的報(bào)道將是如何影響證券市場(chǎng)股票的價(jià)格波動(dòng),即:新聞報(bào)道對(duì)股市的影響第幾天最為顯著?新聞報(bào)道對(duì)股市影響的持續(xù)時(shí)間是多長(zhǎng)?中國(guó)股票市場(chǎng)分為滬深兩市,那么互聯(lián)財(cái)經(jīng)網(wǎng)新聞對(duì)滬深兩市股票產(chǎn)生的影響強(qiáng)度、影響周期是否一致?如果不同,那么分別又體現(xiàn)在哪些方面。這一系列問(wèn)題的解決,對(duì)于監(jiān)管者進(jìn)行股市制度改革、投資者投資策略選擇、承銷商承銷方案制訂等都具有重要的參考意義。 然而目前為止,計(jì)算機(jī)科學(xué)領(lǐng)域?qū)W者對(duì)新聞與股市波動(dòng)之間關(guān)系的研究,僅局限于預(yù)測(cè)新聞對(duì)股價(jià)的影響,并未系統(tǒng)分析兩者之間的種種關(guān)聯(lián)。然而,影響股價(jià)波動(dòng)的因素很多,這使得用新聞?lì)A(yù)測(cè)股價(jià)的準(zhǔn)確度較低,從而實(shí)用價(jià)值一直不高。計(jì)算機(jī)領(lǐng)域?qū)W者之所以并未系統(tǒng)分析新聞與股市之間關(guān)系,是因?yàn)榇藛?wèn)題的解決需要借助計(jì)量經(jīng)濟(jì)學(xué)的分析方法。目前,經(jīng)濟(jì)學(xué)領(lǐng)域?qū)W者對(duì)新聞與股市的研究,由于技術(shù)的局限性,僅是簡(jiǎn)單地分析新聞標(biāo)題、新聞數(shù)量等與股市波動(dòng)之間的關(guān)系,并未挖掘新聞文本信息,而新聞文本中通常包含大量有價(jià)值的軟信息。造成這種現(xiàn)狀的原因是挖掘新聞文本中包含的信息需要計(jì)算機(jī)領(lǐng)域的文本挖掘技術(shù)?傊,各領(lǐng)域都存在技術(shù)局限性,使得系統(tǒng)地分析新聞文本信息與股市波動(dòng)之間關(guān)系這項(xiàng)研究還處于知識(shí)空白。 基于此,本篇文章跨計(jì)算機(jī)科學(xué)與經(jīng)濟(jì)學(xué)兩學(xué)科,利用文本挖掘技術(shù)中的支持向量回歸模型和計(jì)量經(jīng)濟(jì)學(xué)中多元回歸分析方法,將新聞內(nèi)容量化為造成股市波動(dòng)的一個(gè)影響因子,首次從宏觀層面上,系統(tǒng)地分析互聯(lián)網(wǎng)新聞文本信息對(duì)中國(guó)股市的影響。本文采用如下技術(shù)方案來(lái)研究新聞對(duì)股市的影響: (1)采用文本挖掘技術(shù),量化定性新聞這種無(wú)結(jié)構(gòu)的文本信息對(duì)股市的影響,量化結(jié)果作為定性新聞對(duì)股市影響的一個(gè)因子。此階段涉及的文本挖掘技術(shù)有向量空間模型、TFIDF加權(quán)方法、特征降維、中文分詞、支持向量回歸等等。如何選擇最優(yōu)方法,提高量化結(jié)果的準(zhǔn)確性,這是此階段需要解決的問(wèn)題,也本篇文章的關(guān)鍵點(diǎn)。本文根據(jù)股市特性,建立股市特有的特征詞庫(kù)來(lái)進(jìn)行文本向量化,從而將無(wú)結(jié)構(gòu)的文本信息轉(zhuǎn)換為結(jié)構(gòu)化的向量形式。在向量化過(guò)程中,本文采用TFIDF來(lái)進(jìn)行特征加權(quán),采用同義詞詞庫(kù)進(jìn)行特征降維,從而得到最終的新聞文本向量。然后采用支持向量回歸來(lái)建立新聞文本向量與股票收益率之間的回歸模型,用此模型來(lái)量化新聞對(duì)股市的影響,量化結(jié)果作為定性新聞?dòng)绊懝墒械囊蜃印?(2)將定性新聞對(duì)股市影響的因子與定量的影響股市的主要技術(shù)指標(biāo)相結(jié)合,采用計(jì)量經(jīng)濟(jì)學(xué)的多元線性回歸模型,依據(jù)各種假設(shè)檢驗(yàn)來(lái)分析新聞是如何影響股市,影響的顯著性等問(wèn)題。具體而言,本文將量化后的新聞對(duì)股市影響的因子作為多元回歸模型的解釋變量之一,將股票累計(jì)異常收益率作為被解釋變量,采用統(tǒng)計(jì)檢驗(yàn)方法來(lái)檢驗(yàn)多元回歸模型的擬合優(yōu)度、方程顯著性和新聞等因子的顯著性問(wèn)題,從而具體分析新聞因子與股市波動(dòng)之間的關(guān)系。 通過(guò)實(shí)驗(yàn),我們發(fā)現(xiàn):滬深兩市上市公司的新聞報(bào)道后都會(huì)影響該上市公司的股票的波動(dòng),但對(duì)深市上市公司股票的影響要強(qiáng)于滬市股票,而且,滬市上市公司的新聞?dòng)绊懥Χ群统掷m(xù)時(shí)間均小于深市上市公司。同時(shí),我們發(fā)現(xiàn),新聞報(bào)道后滬市上市公司的收益明顯受到公司規(guī)模的影響,經(jīng)分析可得,對(duì)于規(guī)模越大的公司,新聞報(bào)道對(duì)其股票產(chǎn)生的影響越不明顯,對(duì)于規(guī)模越小的公司,新聞報(bào)道對(duì)其產(chǎn)生的影響越大,且持續(xù)時(shí)間越長(zhǎng)。 本文的創(chuàng)新之處可以從以下方面加以詳述。 (1)本文從研究方法上來(lái)講,創(chuàng)新之處在于:融合計(jì)算機(jī)領(lǐng)域的文本挖掘技術(shù)與經(jīng)濟(jì)學(xué)領(lǐng)域的計(jì)量方法,跨學(xué)科角度解決新聞與股市波動(dòng)之間的關(guān)系問(wèn)題。財(cái)經(jīng)新聞內(nèi)容中包含大量影響股市的信息,本文采用計(jì)算機(jī)領(lǐng)域中的文本挖掘技術(shù)來(lái)量化這些信息對(duì)股市的影響,并將量化結(jié)果作為影響股市收益率的一個(gè)指標(biāo)因子,融合影響股市的幾個(gè)主要技術(shù)指標(biāo),采用計(jì)量經(jīng)濟(jì)學(xué)中多元線性回歸分析的各種假設(shè)檢驗(yàn)方法,來(lái)分析新聞如何影響股市,影響持續(xù)時(shí)間以及影響強(qiáng)度等問(wèn)題。 (2)本文從研究角度來(lái)講,創(chuàng)新之處在于:目前大部分研究還主要集中在用新聞?lì)A(yù)測(cè)股價(jià)方面。本文利用文本挖掘技術(shù)和計(jì)量經(jīng)濟(jì)學(xué)方法,將新聞內(nèi)容量化為影響股市波動(dòng)的一個(gè)因子,系統(tǒng)分析互聯(lián)網(wǎng)財(cái)經(jīng)新聞對(duì)中國(guó)股市的影響。同時(shí),中國(guó)股市分為滬深兩市,但目前為止,很少有研究將滬深兩市進(jìn)行對(duì)比分析。本文致力于研究互聯(lián)網(wǎng)財(cái)經(jīng)新聞對(duì)滬市和深市股票產(chǎn)生的影響強(qiáng)度、影響周期是否一致等問(wèn)題。 (3)本文從技術(shù)方面來(lái)講,創(chuàng)新之處在于:針對(duì)股市特性,本文建立了股市專有的特征詞以及同義詞詞庫(kù)。在對(duì)新聞文本進(jìn)行中文分詞時(shí),將股市特征詞庫(kù)加入分詞字典,增加分詞準(zhǔn)確性。在用文本挖掘技術(shù)進(jìn)行新聞文本向量化時(shí),本文采用的方法是基于特征詞庫(kù)的向量化方法,同時(shí)根據(jù)同義詞詞庫(kù)對(duì)文本向量化結(jié)果進(jìn)行特征降維,從而得到一個(gè)較為合理的向量化結(jié)果。 本文的內(nèi)容結(jié)構(gòu)安排如下:第一部分介紹論文的研究背景、研究意義以及研究方法;第二部分對(duì)本文涉及的相關(guān)技術(shù)進(jìn)行介紹,本文涉及兩個(gè)領(lǐng)域的相關(guān)知識(shí),故此部分按領(lǐng)域分別進(jìn)行介紹;第三部分介紹實(shí)驗(yàn)過(guò)程所需數(shù)據(jù)的準(zhǔn)備工作,本實(shí)驗(yàn)所需數(shù)據(jù)分為兩大塊,即新聞數(shù)據(jù)和股票交易日數(shù)據(jù),故此部分分別介紹兩塊數(shù)據(jù)的獲取以及預(yù)處理工作;第四部分介紹實(shí)驗(yàn)步驟以及實(shí)驗(yàn)結(jié)果;第五部分對(duì)整篇論文做總結(jié)以及展望。
【關(guān)鍵詞】:文本挖掘 支持向量機(jī) 互聯(lián)網(wǎng)新聞 股市波動(dòng) 多元線性回歸
【學(xué)位授予單位】:西南財(cái)經(jīng)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2012
【分類號(hào)】:F49;F832.51;F224
【目錄】:
- 摘要4-7
- Abstract7-12
- 1. 引言12-24
- 1.1 研究背景12-16
- 1.2 研究目的及意義16-18
- 1.2.1 研究目的17
- 1.2.2 研究意義17-18
- 1.3 研究方法18-21
- 1.3.1 文本挖掘技術(shù)19
- 1.3.2 計(jì)量經(jīng)濟(jì)學(xué)19-20
- 1.3.3 CAPM模型20-21
- 1.4 研究?jī)?nèi)容21-22
- 1.5 本文主要貢獻(xiàn)22-24
- 2. 相關(guān)知識(shí)24-35
- 2.1 文本挖掘技術(shù)24-28
- 2.1.1 向量空間模型25-26
- 2.1.2 特征權(quán)重計(jì)算26
- 2.1.3 特征選擇26-27
- 2.1.4 中文分詞27-28
- 2.2 支持向量機(jī)28-30
- 2.3 經(jīng)濟(jì)學(xué)30-32
- 2.3.1 計(jì)量經(jīng)濟(jì)學(xué)31
- 2.3.2 CAPM模型31-32
- 2.4 網(wǎng)頁(yè)抓爬器及新聞內(nèi)容提取32-34
- 2.5 本章小結(jié)34-35
- 3. 數(shù)據(jù)準(zhǔn)備35-39
- 3.1 新聞數(shù)據(jù)獲取以及預(yù)處理35-37
- 3.2 股市交易日數(shù)據(jù)37-38
- 3.3 本章小結(jié)38-39
- 4. 實(shí)驗(yàn)設(shè)計(jì)與分析39-51
- 4.1 量化新聞指標(biāo)39-41
- 4.2 計(jì)量分析方法41-42
- 4.3 評(píng)測(cè)指標(biāo)42-43
- 4.4 實(shí)驗(yàn)環(huán)境以及實(shí)驗(yàn)步驟43-44
- 4.5 實(shí)驗(yàn)結(jié)果分析44-49
- 4.5.1 上海市場(chǎng)新聞對(duì)股市影響的定量分析44-46
- 4.5.2 深圳市場(chǎng)新聞對(duì)股市影響的定量分析46-48
- 4.5.3 滬深兩市新聞對(duì)股市影響的對(duì)比分析48-49
- 4.6 本章小結(jié)49-51
- 5. 總結(jié)與展望51-54
- 5.1 研究工作總結(jié)51-52
- 5.2 未來(lái)的研究?jī)?nèi)容展望52-54
- 參考文獻(xiàn)54-57
- 后記57-58
- 致謝58-60
- 在讀期間科研成果目錄60
【參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前6條
1 趙靜梅;何欣;吳風(fēng)云;;中國(guó)股市謠言研究:傳謠、辟謠及其對(duì)股價(jià)的沖擊[J];管理世界;2010年11期
2 何誠(chéng)穎;中國(guó)股市市盈率分布特征及國(guó)際比較研究[J];經(jīng)濟(jì)研究;2003年09期
3 楊繼東;;媒體影響了投資者行為嗎?——基于文獻(xiàn)的一個(gè)思考[J];金融研究;2007年11期
4 饒育蕾;王攀;;媒體關(guān)注度對(duì)新股表現(xiàn)的影響——來(lái)自中國(guó)股票市場(chǎng)的證據(jù)[J];財(cái)務(wù)與金融;2010年03期
5 徐筱鳳,李壽喜;中國(guó)企業(yè)市盈率:理論分析與經(jīng)驗(yàn)證據(jù)[J];世界經(jīng)濟(jì)文匯;2005年Z1期
6 趙偉;梁循;;互聯(lián)網(wǎng)金融信息量與收益率波動(dòng)關(guān)聯(lián)研究[J];計(jì)算機(jī)技術(shù)與發(fā)展;2009年12期
,本文編號(hào):1086999
本文鏈接:http://sikaile.net/guanlilunwen/sjfx/1086999.html
最近更新
教材專著