基于微博數(shù)據(jù)的電影票房預測研究
本文關(guān)鍵詞:基于微博數(shù)據(jù)的電影票房預測研究
更多相關(guān)文章: 微博 票房預測 情感強度 BP神經(jīng)網(wǎng)絡(luò)
【摘要】:隨著社交網(wǎng)絡(luò)的快速發(fā)展,越來越多的研究人員開始關(guān)注如何利用社交媒體數(shù)據(jù)預測現(xiàn)實社會將要發(fā)生的事件。社交媒體中蘊含著與用戶思想、行為相關(guān)的海量數(shù)據(jù),深入挖掘相關(guān)信息并將其應(yīng)用到預測恐怖活動、國家選舉、社會突發(fā)事件等熱點問題正成為當前研究的熱門課題之一,這類研究對指導政府行為、商業(yè)活動、生產(chǎn)生活都具有十分重要的意義。本文以微博數(shù)據(jù)預測電影票房為例,深入探究社交媒體預測現(xiàn)實事件的可行性和準確性。本文首先介紹了電影票房預測的研究背景和意義,并從早期預測和實時預測兩方面分析了電影票房預測的研究現(xiàn)狀。在后續(xù)的章節(jié)中,文章介紹了微博的發(fā)展歷程和特點以及微博數(shù)據(jù)的抓取、清洗。然后我們提出了基于微博數(shù)量特征、情感強度和宣傳營銷特征等多項特征分量融合的預測輸入模型,并引入多元線性回歸模型、BP神經(jīng)網(wǎng)絡(luò)模型、支持向量機模型對預測輸入模型的準確性進行驗證。本文的主要研究內(nèi)容和創(chuàng)新點如下:1.在微博數(shù)據(jù)清洗階段,提出了去除僵尸粉、廣告用戶和臨時用戶的算法,有效減少異常數(shù)據(jù),提高了預測精度;2.提出了基于情感強度的微博用戶行為分析方法,將用戶的情感傾向和情感的激烈程度相結(jié)合,更準確地判定用戶對特定電影的喜好程度;3.對微博營銷內(nèi)容分析歸類后提出將投資方、院線、演員的宣傳行為作為重要的參考因素加入預測模型;4.在對微博特征分析分類的基礎(chǔ)上,提出了基于數(shù)量特征、情感強度特征和宣傳特征的多特征預測輸入模型;5.針對微博中出現(xiàn)的異常數(shù)據(jù),提出了改進的BP神經(jīng)網(wǎng)絡(luò),在輸入層和隱含層之間加入記憶層,減少異常數(shù)據(jù)對實驗結(jié)果的影響,提高預測模型的容錯能力。在實驗仿真階段,文章對影響票房的各個特征分量進行分析,找出其相關(guān)性,并對比分析不同預測模型和不同預測方法對預測準確度的影響。實驗驗證了本文提出的預測模型與現(xiàn)有預測方法相比具有較高的準確性和容錯能力。同時實驗得到一系列重要結(jié)論,對電影投資拍攝、影院排片和電影早期宣傳營銷等提供了理論指導。
【關(guān)鍵詞】:微博 票房預測 情感強度 BP神經(jīng)網(wǎng)絡(luò)
【學位授予單位】:重慶大學
【學位級別】:碩士
【學位授予年份】:2015
【分類號】:TP393.092
【目錄】:
- 中文摘要3-4
- 英文摘要4-8
- 1 緒論8-13
- 1.1 電影票房預測的研究背景和意義8-10
- 1.1.1 電影市場發(fā)展迅速8
- 1.1.2 電影票房預測的商業(yè)價值8-10
- 1.2 國內(nèi)外研究現(xiàn)狀10-12
- 1.2.1 早期預測10-11
- 1.2.2 實時預測11-12
- 1.3 論文主要內(nèi)容和章節(jié)安排12-13
- 2 微博數(shù)據(jù)處理13-20
- 2.1 引言13
- 2.2 微博的進化歷程13-14
- 2.3 微博特征分析14-16
- 2.4 微博數(shù)據(jù)的爬取16-17
- 2.5 微博數(shù)據(jù)的清洗17-19
- 2.6 小結(jié)19-20
- 3 基于微博多特征融合的電影票房預測模型20-31
- 3.1 引言20
- 3.2 微博數(shù)據(jù)的特征提取20-28
- 3.2.1 微博數(shù)據(jù)的數(shù)量特征20-21
- 3.2.2 微博數(shù)據(jù)的情感特征21-25
- 3.2.3 微博數(shù)的宣傳特征25-28
- 3.3 基于多特征的輸入模型28-29
- 3.4 小結(jié)29-31
- 4 現(xiàn)有預測模型分析和改進31-46
- 4.1 引言31-32
- 4.2 多元線性回歸模型32-35
- 4.2.1 模型的推導33-34
- 4.2.2 最小二乘估計34-35
- 4.3 支持向量機模型35-38
- 4.3.1 最優(yōu)分類超平面35-36
- 4.3.2 支持向量回歸機36-37
- 4.3.3 非線性回歸問題37-38
- 4.4 BP神經(jīng)網(wǎng)絡(luò)模型38-43
- 4.4.1 BP神經(jīng)網(wǎng)絡(luò)38
- 4.4.2 BP神經(jīng)元和BP網(wǎng)絡(luò)模型38-40
- 4.4.3 BP網(wǎng)絡(luò)的學習40-42
- 4.4.4 BP網(wǎng)絡(luò)的局限性42-43
- 4.5 改進的BP神經(jīng)網(wǎng)絡(luò)模型43-45
- 4.6 小結(jié)45-46
- 5 實驗結(jié)果及分析46-58
- 5.1 引言46
- 5.2 數(shù)據(jù)的初始化46-49
- 5.3 微博特征分量與票房相關(guān)性分析49-50
- 5.4 基于數(shù)量和情感強度的預測方法分析50-53
- 5.4.1 基于情感強度和基于傳統(tǒng)關(guān)鍵字方法對比50-52
- 5.4.2 基于數(shù)量和情感方法的預測準確度對比52-53
- 5.5 不同預測模型準確度分析53-54
- 5.6 與現(xiàn)有預測模型對比分析54-55
- 5.7 改進的BP神經(jīng)網(wǎng)絡(luò)模型預測準確度分析55-57
- 5.8 小結(jié)57-58
- 6 總結(jié)與展望58-60
- 6.1 論文總結(jié)58
- 6.2 展望58-60
- 致謝60-61
- 參考文獻61-64
- 附錄 A. 作者在攻讀學位期間發(fā)表的論文目錄64
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 夏丹;;我國3D電影票房影響因素的實證分析[J];現(xiàn)代傳播(中國傳媒大學學報);2012年09期
2 胡小莉;李波;吳正鵬;;電影票房的影響因素分析[J];中國傳媒大學學報(自然科學版);2013年01期
3 ;傳媒數(shù)字[J];現(xiàn)代視聽;2013年02期
4 ;每周熱門節(jié)點——1996年全美電影票房排行[J];每周電腦報;1997年08期
5 ;中國電影票房破百億[J];青年記者;2011年03期
6 王文文;周澍民;;社會化媒體對電影票房的預測價值研究[J];新聞傳播;2013年12期
7 晉斌;張輝;;基于馬爾科夫鏈模型的中國3D電影票房研究[J];中國傳媒大學學報(自然科學版);2014年02期
8 笈藜;;電影票房分賬別讓觀眾買單[J];聲屏世界;2012年12期
9 ;傳媒數(shù)字[J];現(xiàn)代視聽;2013年07期
10 ;傳媒數(shù)字[J];現(xiàn)代視聽;2012年12期
中國重要會議論文全文數(shù)據(jù)庫 前1條
1 昝勝鋒;朱文雁;;嵌入式廣告、文化暗合與電影票房[A];建設(shè)經(jīng)濟文化強。禾魬(zhàn)·機遇·對策——山東省社會科學界2009年學術(shù)年會文集(4)[C];2009年
中國重要報紙全文數(shù)據(jù)庫 前10條
1 記者 周南焱;北京電影票房10個月破6億元[N];北京日報;2009年
2 記者 張景華;北京2012年電影票房首超16億[N];光明日報;2013年
3 記者 李晚成;去年電影票房2.7億元[N];江西日報;2013年
4 記者 周南焱 實習生 孫杰;北京電影票房去年進賬超16億元[N];北京日報;2013年
5 記者 龔雪 通訊員 于松業(yè);去年省電影票房突破8億元[N];湖北日報;2013年
6 記者 衛(wèi)小林;海南去年電影票房歷史性突破[N];海南日報;2013年
7 呂蓁;電影票房成新型炒股風向標[N];中國文化報;2013年
8 記者 龔雪 通訊員 姚海陸 于松業(yè);春節(jié)假期電影票房超4千萬[N];湖北日報;2013年
9 記者 吳園園;電影票房:5月一周頂過去一年[N];北京商報;2013年
10 北京商報記者 吳園園;全年電影票房仍將平穩(wěn)增長[N];北京商報;2013年
中國碩士學位論文全文數(shù)據(jù)庫 前4條
1 王雪娟;電影票房預測研究發(fā)展史簡論[D];重慶大學;2015年
2 王偉;基于微博數(shù)據(jù)的電影票房預測研究[D];重慶大學;2015年
3 楊威;基于微博數(shù)據(jù)的電影票房預測模型研究[D];安徽大學;2014年
4 聶鴻迪;中國電影票房的影響因素及其實證研究[D];北京交通大學;2015年
,本文編號:972042
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/972042.html