基于突發(fā)事件的股票風險預測方法研究
本文選題:風險預測 + 主題模型��; 參考:《哈爾濱工業(yè)大學》2013年碩士論文
【摘要】:2008年金融海嘯發(fā)生后,金融風險問題開始日漸引起管理機構及學者的重視。近年來,隨著社交網(wǎng)絡的飛速發(fā)展,突發(fā)性金融信息會在短時間內迅速傳遞至每一個用戶,而用戶會多渠道、多次轉發(fā)相同信息,更會加劇突發(fā)事件所蘊含金融風險的影響。突發(fā)事件在短時間內即會對相關金融資產(chǎn)價格造成較強擾動,,因此迫切需要研究面向突發(fā)事件的金融風險預測方法。 然而,傳統(tǒng)方法在突發(fā)事件發(fā)生的情況下并不能有效的預測突發(fā)事件帶來的金融風險。原因在于傳統(tǒng)的方法如宏觀模型法、時間序列等方法僅針對金融資產(chǎn)價格變化,或其基本面影響因子進行預測研究,而這些方法已經(jīng)被證明在突發(fā)事件帶來的強擾動下是無效的。因此,需要研究能夠快速提煉突發(fā)事件所蘊含風險的建模方法。已有研究表明,金融文本信息與股票價格變化存在關聯(lián)關系,在此基礎上,本文提出通過學習突發(fā)事件的主題的分布與股票風險變化之間的關聯(lián)關系,來對股票風險進行預測。本文的主要研究工作包括: 首先,針對突發(fā)新聞與股票對應關系的缺失問題,本文采用基于高斯分布對突發(fā)新聞與股票異常波動的共現(xiàn)關系進行過濾,從而識別突發(fā)事件與股票的多對多關系; 其次,針對突發(fā)事件所蘊含金融風險的估值量化問題,本文首先使用無監(jiān)督的主題聚類模型,對風險主題事件進行聚類,利用事件與股票的多對多關系,建立隨機游走模型,識別并量化主題事件對應的股票金融風險; 最后,針對主題聚類模型未能考慮股票價格變化對模型的反饋影響問題,本文提出建立有監(jiān)督的主題聚類模型,模型學習時同時考慮股票價格變化及新聞主題分布的耦合關系,最后利用訓練好的模型來估計股票的金融風險。 實驗結果表明在突發(fā)事件發(fā)生的情況下,通過本文所提出的兩種主題聚類的方法對股票的金融風險進行預測時,能夠較傳統(tǒng)方法獲得更為準確的預測結果。
[Abstract]:After the 2008 financial tsunami, the financial risk problem began to attract the attention of regulators and scholars. In recent years, with the rapid development of social networks, the sudden financial information will be transmitted to every user in a short time, and the users will transmit the same information through multiple channels, which will aggravate the impact of financial risks contained in emergencies. Sudden events will cause strong disturbances to the prices of related financial assets in a short period of time, so it is urgent to study the financial risk forecasting methods for emergencies. However, the traditional method can not effectively predict the financial risks brought by emergencies. The reason is that the traditional methods, such as macroscopic model method, time series method and so on, are only used to predict the change of financial asset price or its fundamental influencing factors. These methods have been proved to be ineffective under the strong disturbance caused by the emergency. Therefore, it is necessary to study modeling methods that can quickly extract the risks involved in emergencies. Previous studies have shown that financial text information has a correlation with stock price changes. On this basis, this paper proposes to predict the stock risk by learning the correlation relationship between the distribution of the subject of unexpected events and the change of stock risk. The main research work of this paper includes: First of all, aiming at the lack of corresponding relation between emergency news and stock, this paper uses Gao Si distribution to filter the co-occurrence relationship between unexpected news and stock abnormal fluctuation, so as to identify the many-to-many relationship between unexpected news and stock. Secondly, aiming at the quantification of financial risk involved in unexpected events, this paper first uses the unsupervised thematic clustering model to cluster the risk thematic events, and establishes a random walk model by using the many-to-many relationships between events and stocks. Identifying and quantifying the stock financial risk corresponding to the subject event; Finally, in view of the problem that the topic clustering model fails to consider the feedback effect of stock price change on the model, this paper proposes a supervised thematic clustering model, in which the coupling relationship between stock price change and news topic distribution is taken into account in model learning. Finally, the trained model is used to estimate the financial risk of stocks. The experimental results show that when the financial risk of stocks is predicted by the two thematic clustering methods proposed in this paper, it can obtain more accurate results than the traditional methods.
【學位授予單位】:哈爾濱工業(yè)大學
【學位級別】:碩士
【學位授予年份】:2013
【分類號】:F830.91;F224
【共引文獻】
相關期刊論文 前10條
1 劉韓松;;基于文本挖掘及情感分析的社區(qū)負面輿論傳播預測模型[J];計算機安全;2013年12期
2 馬寶君;張楠;孫濤;;智慧城市背景下公眾反饋大數(shù)據(jù)分析:概率主題建模的視角[J];電子政務;2013年12期
3 李祥飛;張再生;黃超;高楊;;基于EMD與STSA混合方法的金融收益信息提取與預測[J];系統(tǒng)工程;2014年02期
4 劉杰;杜軍平;;基于潛在主題融合的跨媒體圖像語義標注[J];電子學報;2014年05期
5 Stefan Daume;Matthias Albert;Klaus von Gadow;;Assessing citizen science opportunities in forest monitoring using probabilistic topic modelling[J];Forest Ecosystems;2014年02期
6 謝昊;江紅;;一種面向微博主題挖掘的改進LDA模型[J];華東師范大學學報(自然科學版);2013年06期
7 衡偉;于佳;李蕾;劉詠彬;;應用hLDA進行多文檔主題建模關鍵因素研究[J];中文信息學報;2013年06期
8 張引;陳敏;廖小飛;;大數(shù)據(jù)應用的現(xiàn)狀與展望[J];計算機研究與發(fā)展;2013年S2期
9 李偉;馬永征;沈一;;一種解決“中心主題湮沒問題”的基于圖模型的Labeled-LDA文本分類算法[J];計算機科學;2014年03期
10 邸亮;杜永萍;;LDA模型在微博用戶推薦中的應用[J];計算機工程;2014年05期
相關會議論文 前1條
1 吳君青;胡谷雨;;基于主題模型的CCN緩存模式設計[A];第十一屆全國博士生學術年會——信息技術與安全專題論文集[C];2013年
相關博士學位論文 前7條
1 楊寅;存儲系統(tǒng)可靠性關鍵技術研究[D];華中科技大學;2013年
2 楊銘;社會化媒體的環(huán)境掃描與情報分析[D];哈爾濱工業(yè)大學;2012年
3 周而重;博客輿情熱點發(fā)現(xiàn)與分析[D];北京工業(yè)大學;2013年
4 楊寅;存儲系統(tǒng)可靠性關鍵技術研究[D];華中科技大學;2013年
5 段東圣;社會網(wǎng)絡中群組探測和話題建模技術研究[D];華中科技大學;2013年
6 孫妮;B2C購物網(wǎng)站商品評價的效應研究[D];對外經(jīng)濟貿易大學;2014年
7 鐘岑岑;基于上下文的音視頻標注研究[D];北京交通大學;2014年
相關碩士學位論文 前10條
1 馬俊;基于話題傳播的微博用戶影響力分析[D];解放軍信息工程大學;2013年
2 施乾坤;基于LDA模型的文本主題挖掘和文本靜態(tài)可視化的研究[D];廣西大學;2013年
3 楊逍;機器學習中隱式因子模型及其優(yōu)化算法研究[D];哈爾濱工業(yè)大學;2013年
4 肖娟;分布式話題檢測方法研究[D];哈爾濱工業(yè)大學;2012年
5 劉麗娟;網(wǎng)絡用戶數(shù)據(jù)挖掘與行為分析[D];北京交通大學;2014年
6 韓成;特定領域下實時主題建模與事件檢測[D];浙江大學;2014年
7 丁雪濤;基于協(xié)同關系主題回歸模型的推薦算法研究[D];清華大學;2013年
8 田田;基于語義的網(wǎng)絡輿情熱點話題發(fā)現(xiàn)研究[D];天津科技大學;2012年
9 金秋;人機交互中的人臉聚類研究[D];寧波大學;2013年
10 董露露;基于特征選擇及LDA模型的中文文本分類研究與實現(xiàn)[D];安徽大學;2014年
本文編號:1915669
本文鏈接:http://sikaile.net/jingjilunwen/zbyz/1915669.html