基于新聞情感分析的房?jī)r(jià)預(yù)測(cè)研究
發(fā)布時(shí)間:2021-01-18 04:21
互聯(lián)網(wǎng)的出現(xiàn)改變了投資者獲取新聞的方式。網(wǎng)上可用的大量信息意味著建立一個(gè)收集新聞并執(zhí)行文本處理以檢查對(duì)特定資產(chǎn)市場(chǎng)的任何潛在影響的自動(dòng)化系統(tǒng)是明智的。在任何國(guó)家,住房市場(chǎng)對(duì)經(jīng)濟(jì)影響很大。住房市場(chǎng)影響經(jīng)濟(jì)增長(zhǎng),影響資產(chǎn)組合價(jià)值,影響金融機(jī)構(gòu)的盈利能力和金融體系的可靠性。因此,有很多涉及住房市場(chǎng)的利益相關(guān)者。這項(xiàng)研究的重點(diǎn)是大的國(guó)際城市,如紐約,悉尼和倫敦,因?yàn)榇蟪鞘杏懈嗟臄?shù)據(jù)是現(xiàn)成的。這項(xiàng)研究將分析這三個(gè)城市的住房市場(chǎng),特別是房?jī)r(jià)預(yù)測(cè)。有許多經(jīng)濟(jì)變量將被使用:國(guó)內(nèi)生產(chǎn)總值(GDP),失業(yè)率,消費(fèi)價(jià)格指數(shù)(CPI),銀行利率,貨幣供應(yīng)量,股票市場(chǎng)指數(shù),新住宅的數(shù)量。此外,還分別收集了有關(guān)紐約、悉尼和倫敦房地產(chǎn)的相關(guān)新聞。這些新聞文章來(lái)自不同的網(wǎng)站。我們?cè)谶@項(xiàng)研究中提出了三種新的方法。第一種算法是SSA-SARIMAX(信號(hào)情緒分析-具有外生變量的季節(jié)性自回歸積分移動(dòng)平均值)。首先對(duì)新聞進(jìn)行預(yù)處理,即拆分句子,標(biāo)記句子,并添加詞類標(biāo)注器(Parts-Of-Speech/POS tagger)。這些句子中的每一句都得分進(jìn)行打分,與房地產(chǎn)市場(chǎng)和經(jīng)濟(jì)相關(guān)的某些負(fù)面和正面的詞語(yǔ)更為重要。然后,我們...
【文章來(lái)源】:哈爾濱工業(yè)大學(xué)黑龍江省 211工程院校 985工程院校
【文章頁(yè)數(shù)】:82 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
ABSTRACT
ACKNOWLEDGEMENT
NOMENCLATURE
CHAPTER 1 INTRODUCTION
1.1. Research Background
1.2. Significance of the Study
1.3. Research Status on House Price Prediction
1.4. Main Content of Research
1.5. Organization of Thesis
CHAPTER 2 LITERATURE REVIEW
2.1. Prediction Models
2.2. Sentiment Analysis
CHAPTER 3 PROPOSED ARCHITECTURE
3.1. Proposed Architecture
3.2. Proposed Algorithm
3.2.1. SSA-SARIMAX
3.2.2. DL-SARIMAX
3.2.3. DLC-SARIMAX
CHAPTER 4 DATA COLLECTION AND PREPROCESSING
4.1. Economic Variables
4.1.1. Unit Root Test
4.1.1.1. Augmented Dickey-Fuller Test
4.1.1.2. Phillips-Perron Test
4.1.1.3. Kwiatkowski-Phillips-Schmidt-Shin Test
4.1.2. Gross Domestic Product
4.1.3. Unemployment Rate
4.1.4. Consumer Price Index
4.1.5. Interest Rate
4.1.6. Money Supply
4.1.7. Stock Market Index
4.1.8. Number of New Residences
4.2. House Price Data
4.3. Sentiment Analysis
4.3.1. News Data
4.3.2. Other Techniques
4.3.2.1. Valence Aware Dictionary and s Entiment Reasoner
4.3.2.2. Senti Word Net
4.3.2.3. Pattern
4.3.2.4. Bayes
4.3.2.5. Support Vector Machine for Sentiment Analysis
4.4. Dataset Comparison with Other Studies
CHAPTER 5 EXPERIMENTAL RESULTS
5.1. Preliminary Model Experiment
5.1.1. Performance Evaluation Metrics
5.1.2. Artificial Neural Network (ANN)
5.1.3. Vector Autoregression (VAR)
5.1.4. Multiple Linear Regression (MLR)
5.1.5. Gradient Boosting
5.1.6. DL-SARIMAX
5.1.7. DLC-SARIMAX
5.2. Performance Evaluation
CONCLUSION
REFERENCES
APPENDICES
AUTHOR’S PUBLICATIONS
【參考文獻(xiàn)】:
期刊論文
[1]中國(guó)住房?jī)r(jià)格波動(dòng)聚集性研究及短期預(yù)測(cè)[J]. 徐軻,馬永開(kāi),鄧長(zhǎng)榮. 管理學(xué)報(bào). 2010(06)
[2]小時(shí)風(fēng)速的向量自回歸模型及應(yīng)用[J]. 孫春順,王耀南,李欣然. 中國(guó)電機(jī)工程學(xué)報(bào). 2008(14)
本文編號(hào):2984262
【文章來(lái)源】:哈爾濱工業(yè)大學(xué)黑龍江省 211工程院校 985工程院校
【文章頁(yè)數(shù)】:82 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
ABSTRACT
ACKNOWLEDGEMENT
NOMENCLATURE
CHAPTER 1 INTRODUCTION
1.1. Research Background
1.2. Significance of the Study
1.3. Research Status on House Price Prediction
1.4. Main Content of Research
1.5. Organization of Thesis
CHAPTER 2 LITERATURE REVIEW
2.1. Prediction Models
2.2. Sentiment Analysis
CHAPTER 3 PROPOSED ARCHITECTURE
3.1. Proposed Architecture
3.2. Proposed Algorithm
3.2.1. SSA-SARIMAX
3.2.2. DL-SARIMAX
3.2.3. DLC-SARIMAX
CHAPTER 4 DATA COLLECTION AND PREPROCESSING
4.1. Economic Variables
4.1.1. Unit Root Test
4.1.1.1. Augmented Dickey-Fuller Test
4.1.1.2. Phillips-Perron Test
4.1.1.3. Kwiatkowski-Phillips-Schmidt-Shin Test
4.1.2. Gross Domestic Product
4.1.3. Unemployment Rate
4.1.4. Consumer Price Index
4.1.5. Interest Rate
4.1.6. Money Supply
4.1.7. Stock Market Index
4.1.8. Number of New Residences
4.2. House Price Data
4.3. Sentiment Analysis
4.3.1. News Data
4.3.2. Other Techniques
4.3.2.1. Valence Aware Dictionary and s Entiment Reasoner
4.3.2.2. Senti Word Net
4.3.2.3. Pattern
4.3.2.4. Bayes
4.3.2.5. Support Vector Machine for Sentiment Analysis
4.4. Dataset Comparison with Other Studies
CHAPTER 5 EXPERIMENTAL RESULTS
5.1. Preliminary Model Experiment
5.1.1. Performance Evaluation Metrics
5.1.2. Artificial Neural Network (ANN)
5.1.3. Vector Autoregression (VAR)
5.1.4. Multiple Linear Regression (MLR)
5.1.5. Gradient Boosting
5.1.6. DL-SARIMAX
5.1.7. DLC-SARIMAX
5.2. Performance Evaluation
CONCLUSION
REFERENCES
APPENDICES
AUTHOR’S PUBLICATIONS
【參考文獻(xiàn)】:
期刊論文
[1]中國(guó)住房?jī)r(jià)格波動(dòng)聚集性研究及短期預(yù)測(cè)[J]. 徐軻,馬永開(kāi),鄧長(zhǎng)榮. 管理學(xué)報(bào). 2010(06)
[2]小時(shí)風(fēng)速的向量自回歸模型及應(yīng)用[J]. 孫春順,王耀南,李欣然. 中國(guó)電機(jī)工程學(xué)報(bào). 2008(14)
本文編號(hào):2984262
本文鏈接:http://sikaile.net/jingjilunwen/jingjiguanlilunwen/2984262.html
最近更新
教材專著