在中國(guó)A股市場(chǎng)基于輿情的交易策略
本文選題:中國(guó)股票市場(chǎng) 切入點(diǎn):機(jī)器學(xué)習(xí) 出處:《上海交通大學(xué)》2014年碩士論文 論文類型:學(xué)位論文
【摘要】:隨著互聯(lián)網(wǎng)和移動(dòng)互聯(lián)網(wǎng)時(shí)代的到來(lái),數(shù)據(jù)變得越來(lái)越重要,“大數(shù)據(jù)”這個(gè)概念也正在改變我們的生活以及很多行業(yè)的生產(chǎn)經(jīng)營(yíng)行為;ヂ(lián)網(wǎng)讓數(shù)據(jù)的共享便利化,任何人都能在互聯(lián)網(wǎng)的海量數(shù)據(jù)中找到所需要的信息,且人與人的溝通也隨著Web2.0的出現(xiàn)而更加頻繁和密切,所以誕生了許多輿論情報(bào)分析的職業(yè)和崗位。 在中國(guó)股票市場(chǎng)上,散戶投資者居多,且多為非理性投資者,其投資決策更容易受到消息面的影響,他們的存在增加了股市的波動(dòng)性。散戶投資者往往在各大股吧表現(xiàn)活躍,他們的情緒也直接影響著股市的成交狀況。研究他們的活動(dòng)可以加深我們對(duì)中國(guó)資本市場(chǎng)的理解。 基于行為金融學(xué)和數(shù)據(jù)挖掘原理,本文用機(jī)器學(xué)習(xí)的方法,通過(guò)分析這些投資者的發(fā)帖、評(píng)論等文本信息,,從中挖掘出他們的情緒指標(biāo)及其變化。然后通過(guò)多元回歸,證明這些情緒指標(biāo)能夠?yàn)楹笠唤灰兹盏氖毡P價(jià)提供額外的顯著信息。并且,在考慮交易成本之前和之后,本文提供的交易策略在243個(gè)交易日中相對(duì)大盤分別超過(guò)27.49%和14.62%。
[Abstract]:With the advent of the Internet and the mobile Internet, data is becoming more and more important. The concept of "big data" is also changing our lives and the production and operation of many industries. The Internet makes data sharing easier. Anyone can find the information needed in the massive data of Internet, and the communication between people and people is more frequent and closer with the appearance of Web2.0, so many professions and posts of public opinion intelligence analysis have been born. In China's stock market, retail investors are more likely to be irrational, and their investment decisions are more susceptible to news. Their presence increases the volatility of the stock market. Retail investors tend to be active in big stock bars. Their emotions also have a direct impact on trading in the stock market. Studying their activities can deepen our understanding of China's capital markets. Based on the principles of behavioral finance and data mining, this paper uses the method of machine learning, by analyzing the text information of these investors, such as posts, comments and other text information, excavates their emotional indicators and their changes from them, and then through multiple regression. It is proved that these sentiment indicators can provide significant additional information for the closing price of the next trading day. Moreover, before and after considering transaction costs, the trading strategies provided in this paper exceed 27.49% and 14.62 respectively in 243 trading days.
【學(xué)位授予單位】:上海交通大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2014
【分類號(hào)】:F832.51
【共引文獻(xiàn)】
相關(guān)期刊論文 前10條
1 劉喜文;鄭昌興;王文龍;湯剛強(qiáng);;構(gòu)建數(shù)據(jù)倉(cāng)庫(kù)過(guò)程中的數(shù)據(jù)清洗研究[J];圖書與情報(bào);2013年05期
2 潘善亮;茅琴嬌;韓露;;一種基于虛擬社交化的Web服務(wù)發(fā)現(xiàn)方法研究[J];電信科學(xué);2013年12期
3 顧益軍;解易;張培晶;;面向有組織犯罪分析的人際關(guān)系網(wǎng)絡(luò)節(jié)點(diǎn)重要性評(píng)價(jià)研究[J];中國(guó)人民公安大學(xué)學(xué)報(bào)(自然科學(xué)版);2013年04期
4 鄭晶;;基于云計(jì)算的Pagerank算法的改進(jìn)[J];福州大學(xué)學(xué)報(bào)(自然科學(xué)版);2014年01期
5 "基于大數(shù)據(jù)的互聯(lián)網(wǎng)化存量經(jīng)營(yíng)"項(xiàng)目組;"基于用戶感知的運(yùn)維轉(zhuǎn)型"項(xiàng)目組;;運(yùn)營(yíng)商存量經(jīng)營(yíng)大數(shù)據(jù)平臺(tái)及其關(guān)鍵技術(shù)研究[J];電信科學(xué);2014年06期
6 張喜平;李永樹(shù);劉剛;王蕾;;節(jié)點(diǎn)重要度貢獻(xiàn)的復(fù)雜網(wǎng)絡(luò)節(jié)點(diǎn)重要度評(píng)估方法[J];復(fù)雜系統(tǒng)與復(fù)雜性科學(xué);2014年03期
7 龔衛(wèi)華;郭偉鵬;楊良懷;;信任網(wǎng)絡(luò)中多維信任序列模式挖掘方法研究[J];電子與信息學(xué)報(bào);2014年08期
8 周少波;;基于Lucene2.0和Heritrix搜索引擎的應(yīng)用研究[J];電腦編程技巧與維護(hù);2014年20期
9 潘偉豐;李兵;馬于濤;姜波;;基于加權(quán)PageRank算法的關(guān)鍵包識(shí)別方法[J];電子學(xué)報(bào);2014年11期
10 吳哲;郭宇春;陳常嘉;;基于用戶關(guān)系的在線社會(huì)網(wǎng)絡(luò)關(guān)鍵用戶識(shí)別算法[J];北京交通大學(xué)學(xué)報(bào);2014年05期
相關(guān)博士學(xué)位論文 前10條
1 劉馨月;Web挖掘中的鏈接分析與話題檢測(cè)研究[D];大連理工大學(xué);2012年
2 馬飛;云數(shù)據(jù)中心中虛擬機(jī)放置和實(shí)時(shí)遷移研究[D];北京交通大學(xué);2013年
3 樂(lè)承毅;企業(yè)知識(shí)與員工知識(shí)貢獻(xiàn)度集成評(píng)價(jià)方法及應(yīng)用研究[D];浙江大學(xué);2013年
4 孫甲申;基于主題模型和隨機(jī)游走的標(biāo)簽技術(shù)研究[D];北京郵電大學(xué);2013年
5 張鵬;數(shù)據(jù)中心網(wǎng)絡(luò)的流量管理和優(yōu)化問(wèn)題研究[D];北京郵電大學(xué);2013年
6 龔書;抽取式多文檔文摘的文本表示研究[D];北京交通大學(xué);2013年
7 尹莉;基礎(chǔ)數(shù)學(xué)領(lǐng)域作者合作網(wǎng)絡(luò)實(shí)證分析[D];西北大學(xué);2013年
8 李朋;異構(gòu)信息網(wǎng)絡(luò)分析模型及其應(yīng)用研究[D];重慶大學(xué);2013年
9 程輝;網(wǎng)絡(luò)用戶偏好分析及話題趨勢(shì)預(yù)測(cè)方法研究[D];北京交通大學(xué);2013年
10 湯希瑋;基于多生物信息的蛋白質(zhì)網(wǎng)絡(luò)研究[D];中南大學(xué);2013年
相關(guān)碩士學(xué)位論文 前10條
1 耿玉嬌;MapReduce中基于抽樣技術(shù)的傾斜問(wèn)題研究[D];大連海事大學(xué);2013年
2 芮虎;比價(jià)購(gòu)物平臺(tái)中網(wǎng)絡(luò)爬蟲(chóng)的設(shè)計(jì)與實(shí)現(xiàn)[D];華東理工大學(xué);2013年
3 王梓;林產(chǎn)品貿(mào)易信息用戶興趣模型及個(gè)性化搜索[D];北京林業(yè)大學(xué);2013年
4 牛雷;分布式多媒體平臺(tái)中視頻搜索技術(shù)的研究與應(yīng)用[D];北京郵電大學(xué);2013年
5 林哲;面向行業(yè)的信息融合原型系統(tǒng)的研究與實(shí)現(xiàn)[D];北京郵電大學(xué);2013年
6 萬(wàn)德穩(wěn);藏文搜索和搜索結(jié)果聚類研究及系統(tǒng)實(shí)現(xiàn)[D];西南交通大學(xué);2013年
7 閻正喜;H基金公司網(wǎng)上交易系統(tǒng)安全問(wèn)題研究[D];西南交通大學(xué);2013年
8 顏志博;基于用戶反饋的關(guān)系數(shù)據(jù)庫(kù)關(guān)鍵詞搜索技術(shù)研究[D];黑龍江大學(xué);2012年
9 張婧;面向云計(jì)算運(yùn)營(yíng)管理的資源預(yù)測(cè)模型[D];西北大學(xué);2013年
10 黃佳;比較購(gòu)物搜索引擎的研究與應(yīng)用[D];武漢理工大學(xué);2013年
本文編號(hào):1625884
本文鏈接:http://sikaile.net/jingjilunwen/jinrongzhengquanlunwen/1625884.html