考慮競爭的電影首映日票房集成預(yù)測模型研究
發(fā)布時間:2021-07-05 23:07
電影首映日票房預(yù)測對該日排片、后續(xù)放映日票房及總票房有顯著影響。本文在構(gòu)建考慮競爭的電影首映日票房預(yù)測變量集的基礎(chǔ)上,建立首映日票房集成預(yù)測模型。首先使用多元線性回歸(multiple linear regression, MLR)、支持向量回歸(support vector regression, SVR)、套索回歸(Least absolute shrinkage and selection operator, Lasso)和極端梯度提升(Extreme Gradient Boosting, XGBoost)等算法建立基學(xué)習(xí)器,隨后使用XGBoost算法作為原學(xué)習(xí)器構(gòu)建堆棧集成預(yù)測模型,最后利用收集到的數(shù)據(jù)進(jìn)行對比實(shí)驗(yàn)。實(shí)驗(yàn)證明,加入競爭變量的電影首映日票房預(yù)測變量集適用于首映日票房預(yù)測;相比單一模型,該集成預(yù)測模型的準(zhǔn)確性、泛化性能和穩(wěn)定性均有提升,相比較傳統(tǒng)預(yù)測方法對首映日票房預(yù)測更準(zhǔn)確。提出的集成預(yù)測模型有助于提升首映日票房排片的有效性。
【文章來源】:科技促進(jìn)發(fā)展. 2020,16(10)CSCD
【文章頁數(shù)】:9 頁
【部分圖文】:
模型構(gòu)建流程
a.競爭環(huán)境。電影票房不僅與該電影口碑相關(guān),還與同檔期內(nèi)該電影與最高口碑電影的口碑差距有關(guān),差距越大,電影票房越低,并且檔期熱度和該檔期內(nèi)上映電影數(shù)對這種負(fù)向作用具有調(diào)節(jié)效應(yīng)[21]。本文對競爭環(huán)境的量化主要考慮兩個方面。(1)高票房競爭對手。由于市場總量在短時期內(nèi)基本固定,所以對高票房競爭對手的考量是有必要的。綜合考慮口碑效應(yīng)及可獲得數(shù)據(jù),本文選取預(yù)測電影上映前一周首要競爭對手的票房數(shù)據(jù)及前三名競爭對手的座位數(shù)等數(shù)據(jù),來度量高票房競爭對手;(2)同類型電影的競爭對手。考慮到不同類型的電影可能面向不同的目標(biāo)觀眾,本文選取同檔期內(nèi)的同類型電影上映數(shù)量、上映時長等作為競爭環(huán)境變量。b.觀眾期待。社交網(wǎng)絡(luò)數(shù)據(jù)被廣泛運(yùn)用于需求預(yù)測。相較于預(yù)告片評論量等社交網(wǎng)絡(luò)數(shù)據(jù),預(yù)告片在社交網(wǎng)絡(luò)的分享數(shù)對票房具有更顯著影響[22]。本文使用社交網(wǎng)站如微博和優(yōu)酷視頻網(wǎng)站的用戶對目標(biāo)電影預(yù)告片的轉(zhuǎn)發(fā)與評論數(shù),以及百度搜索指數(shù)和豆瓣“想看”的人數(shù)等變量來量化觀眾對電影的期待程度。
多元線性回歸是研究不確定性關(guān)系的有效統(tǒng)計方法,也是近二十年來票房預(yù)測中應(yīng)用最早與最廣的方法之一[24];Lasso是一種回歸分析方法,可同時實(shí)現(xiàn)變量選擇和正則化,廣泛應(yīng)用于統(tǒng)計學(xué)和機(jī)器學(xué)習(xí)領(lǐng)域。Lasso回歸能夠保持對高維變量的計算可行性,并且容易產(chǎn)生可解釋的稀疏解,是電影票房預(yù)測的一種常用方法[25];SVR是支持向量機(jī)在回歸問題上的應(yīng)用,方法較為成熟,可將SVR算法用于電影票房預(yù)測研究;XGBoost算法屬于集成方法中的同源集成,是Boosting方法的一種,同時也是一種靈活可擴(kuò)展的梯度提升方法。具有結(jié)果可解釋性強(qiáng),對缺失值不敏感,支持列抽樣等優(yōu)點(diǎn),在預(yù)測研究中具有良好的適用性[26];谏鲜鲈,本文擬選取MLR、Lasso回歸、SVR和XGBoost算法作為基學(xué)習(xí)器;诙褩7夯募赡P偷挠(xùn)練步驟如圖2所示。
【參考文獻(xiàn)】:
期刊論文
[1]電影類型片票房競合關(guān)系:以2015年中國市場為例[J]. 張倫,李晗,周雯. 全球傳媒學(xué)刊. 2017(01)
[2]電影首映日后票房預(yù)測模型研究[J]. 羅曉芃,齊佳音,田春華. 統(tǒng)計與信息論壇. 2016(11)
[3]從動態(tài)競爭理論的視角看電影口碑對票房的影響[J]. 賀凱彬,王銳,張涵. 營銷科學(xué)學(xué)報. 2016(03)
[4]基于微博情感分析的電影票房預(yù)測研究[J]. 史偉,王洪偉,何紹義. 華中師范大學(xué)學(xué)報(自然科學(xué)版). 2015(01)
碩士論文
[1]電影票房預(yù)測研究發(fā)展史簡論[D]. 王雪娟.重慶大學(xué) 2015
本文編號:3267006
【文章來源】:科技促進(jìn)發(fā)展. 2020,16(10)CSCD
【文章頁數(shù)】:9 頁
【部分圖文】:
模型構(gòu)建流程
a.競爭環(huán)境。電影票房不僅與該電影口碑相關(guān),還與同檔期內(nèi)該電影與最高口碑電影的口碑差距有關(guān),差距越大,電影票房越低,并且檔期熱度和該檔期內(nèi)上映電影數(shù)對這種負(fù)向作用具有調(diào)節(jié)效應(yīng)[21]。本文對競爭環(huán)境的量化主要考慮兩個方面。(1)高票房競爭對手。由于市場總量在短時期內(nèi)基本固定,所以對高票房競爭對手的考量是有必要的。綜合考慮口碑效應(yīng)及可獲得數(shù)據(jù),本文選取預(yù)測電影上映前一周首要競爭對手的票房數(shù)據(jù)及前三名競爭對手的座位數(shù)等數(shù)據(jù),來度量高票房競爭對手;(2)同類型電影的競爭對手。考慮到不同類型的電影可能面向不同的目標(biāo)觀眾,本文選取同檔期內(nèi)的同類型電影上映數(shù)量、上映時長等作為競爭環(huán)境變量。b.觀眾期待。社交網(wǎng)絡(luò)數(shù)據(jù)被廣泛運(yùn)用于需求預(yù)測。相較于預(yù)告片評論量等社交網(wǎng)絡(luò)數(shù)據(jù),預(yù)告片在社交網(wǎng)絡(luò)的分享數(shù)對票房具有更顯著影響[22]。本文使用社交網(wǎng)站如微博和優(yōu)酷視頻網(wǎng)站的用戶對目標(biāo)電影預(yù)告片的轉(zhuǎn)發(fā)與評論數(shù),以及百度搜索指數(shù)和豆瓣“想看”的人數(shù)等變量來量化觀眾對電影的期待程度。
多元線性回歸是研究不確定性關(guān)系的有效統(tǒng)計方法,也是近二十年來票房預(yù)測中應(yīng)用最早與最廣的方法之一[24];Lasso是一種回歸分析方法,可同時實(shí)現(xiàn)變量選擇和正則化,廣泛應(yīng)用于統(tǒng)計學(xué)和機(jī)器學(xué)習(xí)領(lǐng)域。Lasso回歸能夠保持對高維變量的計算可行性,并且容易產(chǎn)生可解釋的稀疏解,是電影票房預(yù)測的一種常用方法[25];SVR是支持向量機(jī)在回歸問題上的應(yīng)用,方法較為成熟,可將SVR算法用于電影票房預(yù)測研究;XGBoost算法屬于集成方法中的同源集成,是Boosting方法的一種,同時也是一種靈活可擴(kuò)展的梯度提升方法。具有結(jié)果可解釋性強(qiáng),對缺失值不敏感,支持列抽樣等優(yōu)點(diǎn),在預(yù)測研究中具有良好的適用性[26];谏鲜鲈,本文擬選取MLR、Lasso回歸、SVR和XGBoost算法作為基學(xué)習(xí)器;诙褩7夯募赡P偷挠(xùn)練步驟如圖2所示。
【參考文獻(xiàn)】:
期刊論文
[1]電影類型片票房競合關(guān)系:以2015年中國市場為例[J]. 張倫,李晗,周雯. 全球傳媒學(xué)刊. 2017(01)
[2]電影首映日后票房預(yù)測模型研究[J]. 羅曉芃,齊佳音,田春華. 統(tǒng)計與信息論壇. 2016(11)
[3]從動態(tài)競爭理論的視角看電影口碑對票房的影響[J]. 賀凱彬,王銳,張涵. 營銷科學(xué)學(xué)報. 2016(03)
[4]基于微博情感分析的電影票房預(yù)測研究[J]. 史偉,王洪偉,何紹義. 華中師范大學(xué)學(xué)報(自然科學(xué)版). 2015(01)
碩士論文
[1]電影票房預(yù)測研究發(fā)展史簡論[D]. 王雪娟.重慶大學(xué) 2015
本文編號:3267006
本文鏈接:http://sikaile.net/jingjilunwen/whjj/3267006.html
最近更新
教材專著