基于互聯(lián)網(wǎng)金融異構(gòu)信息挖掘的熱點發(fā)現(xiàn)與追蹤
發(fā)布時間:2017-07-31 18:35
本文關(guān)鍵詞:基于互聯(lián)網(wǎng)金融異構(gòu)信息挖掘的熱點發(fā)現(xiàn)與追蹤
更多相關(guān)文章: 熱點發(fā)現(xiàn) 熱點追蹤 排名聚合算法 時間序列預(yù)測 排名學(xué)習(xí)
【摘要】:近年來,滬深A(yù)股市場上涌現(xiàn)出了許多熱點概念,例如2015年上半年期間,“國企改革”、“互聯(lián)網(wǎng)金融”、“一帶一路”、“滬港通”等概念相繼成為熱點并頻繁出現(xiàn)。相關(guān)個股在某一概念、熱點背景下,往往在短期內(nèi)有較好的市場表現(xiàn)。如何抓住這種市場上的熱點、概念帶來的投資機會,是量化研究領(lǐng)域非常關(guān)心的問題。本課題圍繞A股市場熱點發(fā)現(xiàn)這一問題,從互聯(lián)網(wǎng)海量金融數(shù)據(jù)中挖掘出當(dāng)前市場的熱點個股以及相關(guān)板塊,追蹤市場熱點的發(fā)展過程,并向投資者提供有價值的市場信息。本課題研究的主要內(nèi)容如下:互聯(lián)網(wǎng)金融異構(gòu)信息獲取及預(yù)處理:主要分為三大類信息,第一類是A股實時行情數(shù)據(jù),主要包括A股市場股票的每日價格漲跌和成交量;第二類是A股財務(wù)信息及板塊分類;第三類是個股輿情數(shù)據(jù),主要包括新聞數(shù)據(jù)和股吧數(shù)據(jù)。獲取這些數(shù)據(jù)后,通過進一步去噪,優(yōu)化,提煉等處理,將原始的非結(jié)構(gòu)化的金融數(shù)據(jù)處理為結(jié)構(gòu)化數(shù)據(jù),為后續(xù)系統(tǒng)的構(gòu)建提供準確的數(shù)據(jù)保障;谂琶酆纤惴ǖ臒狳c發(fā)現(xiàn):本文把市場熱點發(fā)現(xiàn)問題轉(zhuǎn)化為排名聚合問題,從市場的熱度信息中挖掘熱度指標(biāo),將熱度指標(biāo)轉(zhuǎn)化為熱度排名,并采用排名聚合方法將眾多的熱度排名轉(zhuǎn)化為綜合熱度排名,從熱度排名信息中發(fā)現(xiàn)市場熱點。本文主要研究了一類基于無監(jiān)督的排名聚合算法,并從行情、股吧、新聞三個維度進行熱度計算,搭建了一套完善且有效的熱點發(fā)現(xiàn)模塊。基于時間序列預(yù)測方法的熱點追蹤:完成熱點發(fā)現(xiàn)模塊后,從熱度時間序列信息出發(fā),研究市場上的熱點變化規(guī)律。根據(jù)歷史熱度序列去預(yù)測未來熱度序列正是時間序列預(yù)測所研究的內(nèi)容。本文主要研究了時間序列預(yù)測方法和排名學(xué)習(xí)方法在熱點追蹤問題中的應(yīng)用。綜上所述,本文使用數(shù)據(jù)挖掘技術(shù)從海量金融數(shù)據(jù)中挖掘當(dāng)前市場正在炒作的熱點個股以及相關(guān)板塊,追蹤市場熱點的發(fā)展過程,并向投資者提供有價值的市場信息。
【關(guān)鍵詞】:熱點發(fā)現(xiàn) 熱點追蹤 排名聚合算法 時間序列預(yù)測 排名學(xué)習(xí)
【學(xué)位授予單位】:哈爾濱工業(yè)大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2015
【分類號】:F724.6;F832
【目錄】:
- 摘要4-5
- Abstract5-9
- 第1章 緒論9-15
- 1.1 課題背景及意義9-10
- 1.2 國內(nèi)外研究現(xiàn)狀10-13
- 1.2.1 排名聚合算法研究現(xiàn)狀10-11
- 1.2.2 時間序列預(yù)測方法研究現(xiàn)狀11-12
- 1.2.3 排名學(xué)習(xí)方法研究現(xiàn)狀12-13
- 1.3 本文主要研究內(nèi)容及章節(jié)安排13-15
- 第2章 互聯(lián)網(wǎng)金融異構(gòu)信息獲取及預(yù)處理15-21
- 2.1 引言15
- 2.2 金融異構(gòu)信息獲取15-19
- 2.2.1 實時行情數(shù)據(jù)15-16
- 2.2.2 財務(wù)信息及板塊分類16-18
- 2.2.3 個股輿情數(shù)據(jù)18-19
- 2.3 金融異構(gòu)信息預(yù)處理19
- 2.3.1 行情數(shù)據(jù)的預(yù)處理19
- 2.3.2 新聞和股吧數(shù)據(jù)的預(yù)處理19
- 2.4 本章小結(jié)19-21
- 第3章 基于排名聚合算法的金融熱點發(fā)現(xiàn)21-28
- 3.1 基于無監(jiān)督學(xué)習(xí)的排名聚合算法21-23
- 3.1.1 樸素的線性加權(quán)策略21-22
- 3.1.2 基于隨機梯度下降的排名聚合方法22-23
- 3.2 個股熱度計算方法23-26
- 3.2.1 行情熱度計算25-26
- 3.2.2 新聞和股吧熱度計算26
- 3.3 板塊熱度計算方法26-27
- 3.4 本章小結(jié)27-28
- 第4章 基于預(yù)測模型的金融熱點追蹤28-43
- 4.1 熱點追蹤問題背景介紹28-29
- 4.2 基于時間序列預(yù)測方法的熱點追蹤29-34
- 4.2.1 移動平均法和指數(shù)平滑法29-30
- 4.2.2 最小二乘學(xué)習(xí)法30-32
- 4.2.3 基于時間序列的金融熱點預(yù)測模型32-34
- 4.3 基于排名學(xué)習(xí)方法的熱點追蹤34-39
- 4.3.1 排名學(xué)習(xí)方法34-36
- 4.3.2 基于排名學(xué)習(xí)的支持向量機方法36-38
- 4.3.3 基于Pair Wise LTR的金融熱點排序模型38-39
- 4.4 金融熱點演化規(guī)律39-42
- 4.5 本章小結(jié)42-43
- 第5章 實驗平臺與知識服務(wù)的實現(xiàn)43-51
- 5.1 實驗環(huán)境與實驗數(shù)據(jù)43
- 5.2 實驗結(jié)果評估與分析43-48
- 5.2.1 基于時間序列的金融熱點預(yù)測實驗分析43-45
- 5.2.2 基于Pair Wise LTR的金融熱點排序?qū)嶒灧治?/span>45-48
- 5.3 熱點發(fā)現(xiàn)與追蹤知識服務(wù)平臺的實現(xiàn)48-50
- 5.4 本章小結(jié)50-51
- 結(jié)論51-52
- 參考文獻52-57
- 附錄57-67
- 附錄A57-59
- 附錄B59-67
- 致謝67
【相似文獻】
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前1條
1 蔡文舉;基于互聯(lián)網(wǎng)金融異構(gòu)信息挖掘的熱點發(fā)現(xiàn)與追蹤[D];哈爾濱工業(yè)大學(xué);2015年
,本文編號:600536
本文鏈接:http://sikaile.net/guanlilunwen/huobilw/600536.html
最近更新
教材專著