基于文本分析和數(shù)據(jù)挖掘的股市分析系統(tǒng)
發(fā)布時間:2023-11-04 10:36
在傳統(tǒng)的股票交易軟件中,用戶僅僅可以獲得實時市場行情數(shù)據(jù)以及獨立于各個股票之間的關(guān)于股票股評信息。用戶很難從這些信息中發(fā)現(xiàn)當(dāng)前市場的熱點,這些信息也難以和用戶在股票交易過程中考慮的股票的新聞、公告等文本數(shù)據(jù)相關(guān)聯(lián)。同時,這種傳統(tǒng)的分析股票的方式基本是以股票之間無關(guān)聯(lián)的思維方式進行分析的。然而,A股市場的股票之間并不是孤立的,在漲跌變化時,股票間的漲跌行為多表現(xiàn)出了一定的關(guān)聯(lián)性。并且這些群體的漲跌行為多和股票行情外部的文本信息有著極大的關(guān)聯(lián)性。本系統(tǒng)的目的就是通過數(shù)據(jù)挖掘等技術(shù)對股票關(guān)聯(lián)性進行分析,找到股票之間的關(guān)聯(lián)關(guān)系,進而結(jié)合股票之間的關(guān)聯(lián)關(guān)系和市場行情數(shù)據(jù)對A股市場進行更加詳盡的分析。同時利用文本分析技術(shù)將新聞、公告等文本數(shù)據(jù)和分析結(jié)果進行進一步對應(yīng)。協(xié)助用戶找到漲跌的原因。本系統(tǒng)主要基于數(shù)據(jù)挖據(jù)中相似性計算,關(guān)聯(lián)分析,聚類技術(shù)和自然語言處理中文本摘要,文本生成等技術(shù)。本系統(tǒng)為了解決股票之間孤立的問題,首先提出了標簽的概念,為股票進行細粒度,層次化的劃分。然后,分別建立股票,標簽之間的關(guān)聯(lián)關(guān)系。并且以股票,標簽之間的關(guān)聯(lián)關(guān)系為基礎(chǔ),結(jié)合市場行情數(shù)據(jù),用多影響因素的思路,以整體性和關(guān)...
【文章頁數(shù)】:82 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第1章 緒論
1.1 課題背景及研究的目的和意義
1.2 研究現(xiàn)狀
1.2.1 基于股市基本數(shù)據(jù)的股市分析
1.2.2 利用股市文本分析技術(shù)的股市分析
1.2.3 聯(lián)合基本數(shù)據(jù)和文本數(shù)據(jù)的股市分析
1.2.4 研究現(xiàn)狀分析
1.3 本文的主要研究內(nèi)容
1.4 本文的主要組織結(jié)構(gòu)
第2章 標簽及股票的關(guān)系計算和行情數(shù)據(jù)挖掘
2.1 標簽的定義及獲取
2.2 基于股票集合的標簽關(guān)系計算
2.2.1 標簽的消歧算法
2.2.2 基于股票集合的標簽關(guān)系計算
2.3 基于詞向量的標簽關(guān)系計算
2.4 股票關(guān)系的計算
2.5 股票歷史行情數(shù)據(jù)的挖掘
2.6 本章工作評價
2.7 本章小結(jié)
第3章 基于標簽組合的股市分析
3.1 熱門標簽組合選擇算法
3.2 熱門標簽選擇算法
3.3 分析算法評價
3.3.1 基于股市特征和熱門標簽推薦股票
3.3.2 對照實驗?zāi)P徒榻B
3.3.3 實驗設(shè)置
3.3.4 實驗結(jié)果
3.4 本章小結(jié)
第4章 股票新聞多文檔摘要及分析描述生成
4.1 股票多文檔摘要任務(wù)定義
4.2 新聞文本表示及多文檔摘要
4.2.1 多文檔摘要句子排序算法
4.2.2 句子表示和相似度計算
4.3 股票多文檔摘要的評價
4.3.1 實驗設(shè)置
4.3.2 實驗結(jié)果
4.4 股市分析結(jié)果描述生成
4.4.1 描述數(shù)據(jù)的收集
4.4.2 數(shù)據(jù)的分析
4.4.3 文本規(guī)劃和模板設(shè)計
4.5 生成描述實例及分析
4.6 本章小結(jié)
第5章 股市分析系統(tǒng)設(shè)計與實現(xiàn)
5.1 總體架構(gòu)和交互邏輯
5.1.1 系統(tǒng)總體架構(gòu)
5.1.2 系統(tǒng)和用戶的交互邏輯
5.2 整體的系統(tǒng)展示
5.2.1 股票標簽基本數(shù)據(jù)的存儲
5.2.2 熱門標簽組合的展示
5.2.3 熱門標簽的展示
5.2.4 文檔摘要及短文本的展示
5.2.5 股票熱度強度展示
5.3 本章小結(jié)
結(jié)論
參考文獻
攻讀碩士學(xué)位期間發(fā)表的論文及其他成果
致謝
本文編號:3860135
【文章頁數(shù)】:82 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第1章 緒論
1.1 課題背景及研究的目的和意義
1.2 研究現(xiàn)狀
1.2.1 基于股市基本數(shù)據(jù)的股市分析
1.2.2 利用股市文本分析技術(shù)的股市分析
1.2.3 聯(lián)合基本數(shù)據(jù)和文本數(shù)據(jù)的股市分析
1.2.4 研究現(xiàn)狀分析
1.3 本文的主要研究內(nèi)容
1.4 本文的主要組織結(jié)構(gòu)
第2章 標簽及股票的關(guān)系計算和行情數(shù)據(jù)挖掘
2.1 標簽的定義及獲取
2.2 基于股票集合的標簽關(guān)系計算
2.2.1 標簽的消歧算法
2.2.2 基于股票集合的標簽關(guān)系計算
2.3 基于詞向量的標簽關(guān)系計算
2.4 股票關(guān)系的計算
2.5 股票歷史行情數(shù)據(jù)的挖掘
2.6 本章工作評價
2.7 本章小結(jié)
第3章 基于標簽組合的股市分析
3.1 熱門標簽組合選擇算法
3.2 熱門標簽選擇算法
3.3 分析算法評價
3.3.1 基于股市特征和熱門標簽推薦股票
3.3.2 對照實驗?zāi)P徒榻B
3.3.3 實驗設(shè)置
3.3.4 實驗結(jié)果
3.4 本章小結(jié)
第4章 股票新聞多文檔摘要及分析描述生成
4.1 股票多文檔摘要任務(wù)定義
4.2 新聞文本表示及多文檔摘要
4.2.1 多文檔摘要句子排序算法
4.2.2 句子表示和相似度計算
4.3 股票多文檔摘要的評價
4.3.1 實驗設(shè)置
4.3.2 實驗結(jié)果
4.4 股市分析結(jié)果描述生成
4.4.1 描述數(shù)據(jù)的收集
4.4.2 數(shù)據(jù)的分析
4.4.3 文本規(guī)劃和模板設(shè)計
4.5 生成描述實例及分析
4.6 本章小結(jié)
第5章 股市分析系統(tǒng)設(shè)計與實現(xiàn)
5.1 總體架構(gòu)和交互邏輯
5.1.1 系統(tǒng)總體架構(gòu)
5.1.2 系統(tǒng)和用戶的交互邏輯
5.2 整體的系統(tǒng)展示
5.2.1 股票標簽基本數(shù)據(jù)的存儲
5.2.2 熱門標簽組合的展示
5.2.3 熱門標簽的展示
5.2.4 文檔摘要及短文本的展示
5.2.5 股票熱度強度展示
5.3 本章小結(jié)
結(jié)論
參考文獻
攻讀碩士學(xué)位期間發(fā)表的論文及其他成果
致謝
本文編號:3860135
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3860135.html
最近更新
教材專著