天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

文本挖掘選股與資產(chǎn)組合建模及其分散化研究

發(fā)布時間:2017-09-24 12:39

  本文關鍵詞:文本挖掘選股與資產(chǎn)組合建模及其分散化研究


  更多相關文章: 文本挖掘 文本情緒 資產(chǎn)組合理論 行為金融學 分散化


【摘要】:文本挖掘是一項綜合性的課題,涉及數(shù)學、統(tǒng)計學、計算機科學等眾多技術,是用來應對信息爆炸的有力武器;ヂ(lián)網(wǎng)上的信息汗牛充棟,其中不乏有用的知識,但無關的噪音更多,人力早已無從甄別,只有在現(xiàn)代計算機的性能飛躍發(fā)展的基礎上,使用分布式計算(Distributed Computation)如Hadoop、Map-Reduce等技術處理大數(shù)據(jù)。本文回顧了資產(chǎn)組合理論的起源與發(fā)展,及其在資本市場的深遠影響和廣泛運用,同時建立在這塊基石上的傳統(tǒng)金融學理論現(xiàn)今也受到越來越多的市場異象的挑戰(zhàn),所以一些學者借鑒了很多社會科學、行為學、心理學的理論成果,對市場異象給出了解釋,發(fā)展了行為資產(chǎn)組合理論。在前人研究的基礎上,我們證明了文本挖掘系統(tǒng)實施的可行性。本文致力于利用計算機技術分析金融文本的情緒,搭建了文本挖掘系統(tǒng),針對門戶網(wǎng)站的財經(jīng)新聞及雪球發(fā)貼,使用網(wǎng)絡爬蟲抓取文本,使用分布式計算和大規(guī)模支持向量機(LSSVM)對文本進行分類;設計了股票關注度、情緒量化指標,對這些金融文本數(shù)據(jù)進行量化分析;將該指標納入傳統(tǒng)價值選股模型,建立了文本挖掘選股模型。我們創(chuàng)新性地建立了中文文本挖掘系統(tǒng),首先對投資社交平臺一雪球網(wǎng)的金融文本數(shù)據(jù)進行了挖掘。我們創(chuàng)新性地設計了文本挖掘選股因子買入賣出信號,并驗證了該信號的有效性。對于傳統(tǒng)選股模型與文本挖掘選股模型,我們創(chuàng)新性地用有效賭注數(shù)來評判模型的優(yōu)劣,即對比二者的風險分散化水平。通過對比我們發(fā)現(xiàn),在傳統(tǒng)選股模型中加入文本挖掘選股因子,能提供一個有別于公司基本面、股價量價關系等指標的全新視角,有效增加選股模型的風險分散化水平,資產(chǎn)組合預期能獲得更為穩(wěn)定的低風險收益。文本挖掘模型的有效性,也從旁佐證了投資行為偏差的存在,通過對這些偏差的識別,能增加選股模型獲得超額收益的可能性。通過本文的研究,我們加深了對現(xiàn)代資產(chǎn)組合理論的理解,對行為金融學的發(fā)展、文本挖掘技術的運用進行了非常有益的探討。
【關鍵詞】:文本挖掘 文本情緒 資產(chǎn)組合理論 行為金融學 分散化
【學位授予單位】:南京大學
【學位級別】:碩士
【學位授予年份】:2015
【分類號】:F830.91;TP391.1
【目錄】:
  • 摘要5-7
  • Abstract7-11
  • 第一章 緒論11-19
  • 1.1 研究背景11-17
  • 1.1.1 現(xiàn)代資產(chǎn)組合理論的起源與發(fā)展12-13
  • 1.1.2 現(xiàn)代資產(chǎn)組合理論在資本市場的運用13-16
  • 1.1.3 現(xiàn)代資產(chǎn)組合理論存在的問題16-17
  • 1.2 研究思路及創(chuàng)新點17
  • 1.3 研究內(nèi)容及研究框架17-19
  • 第二章 文獻綜述19-30
  • 2.1 行為金融學19-21
  • 2.2 文本挖掘理論21-28
  • 2.2.1 信息源22-24
  • 2.2.2 內(nèi)容分析的方法24-27
  • 2.2.3 衡量文本情緒27-28
  • 2.3 分散化理論28-29
  • 2.4 本章小結29-30
  • 第三章 文本挖掘系統(tǒng)30-40
  • 3.1 文本挖掘系統(tǒng)實施方案30-36
  • 3.1.1 數(shù)據(jù)來源30-32
  • 3.1.2 文本挖掘系統(tǒng)架構32-36
  • 3.2 文本挖掘選股因子36-40
  • 3.2.1 熱點題材挖掘36
  • 3.2.2 關注度指標36-37
  • 3.2.3 情緒指標37-38
  • 3.2.4 文本挖掘選股因子構建38-40
  • 第四章 數(shù)據(jù)分析與實證研究40-55
  • 4.1 “國企改革”樣本股統(tǒng)計性描述40-43
  • 4.2 文本挖掘選股因子43-45
  • 4.3 投資組合構建45-48
  • 4.3.1 基準投資組合45-47
  • 4.3.2 文本挖掘投資組合47-48
  • 4.4 投資組合有效前沿對比48-49
  • 4.5 投資組合分散化水平分析49-55
  • 4.5.1 有效賭注數(shù)49-50
  • 4.5.2 主成分賭注50-51
  • 4.5.3 最小扭轉(zhuǎn)賭注51-52
  • 4.5.4 投資組合分散化水平分析52-55
  • 第五章 結論與展望55-56
  • 參考文獻56-60
  • 致謝60-61

【參考文獻】

中國期刊全文數(shù)據(jù)庫 前2條

1 吳世農(nóng),韋紹永;上海股市投資組合規(guī)模和風險關系的實證研究[J];經(jīng)濟研究;1998年04期

2 諶志群;張國煊;;文本挖掘與中文文本挖掘模型研究[J];情報科學;2007年07期



本文編號:911465

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/jingjilunwen/zbyz/911465.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶338be***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com