基于微博數(shù)據(jù)的電影票房預(yù)測(cè)模型研究
本文關(guān)鍵詞: 微博數(shù)據(jù) 神經(jīng)網(wǎng)絡(luò) 線性回歸 支持向量機(jī) 電影票房 出處:《安徽大學(xué)》2014年碩士論文 論文類型:學(xué)位論文
【摘要】:20世紀(jì)以來(lái),隨著社會(huì)的快速發(fā)展和人民生活水平的提高,人們追求生活多樣化的方式已經(jīng)不僅限于滿足物質(zhì)生活的要求,還有精神生活的需要。由于影視產(chǎn)業(yè)的迅猛發(fā)展,電影作為文化產(chǎn)業(yè)的重要組成部分,為人們的業(yè)務(wù)生活提供了樂(lè)趣,豐富了人們精神世界。越來(lái)越多的人在工作之余不是選擇待在家里看電視,而是出來(lái)看看電影,感受下新片上映帶來(lái)的視覺(jué)沖擊。 由于電腦的發(fā)明和快速普及,伴隨互聯(lián)網(wǎng)的飛速延伸為影視產(chǎn)業(yè)發(fā)展提供了強(qiáng)有力的技術(shù)支持,3D (Three Dimensions)電影通過(guò)配戴立體眼鏡,觀眾可以看到立體的虛擬人物,IMAX (Image Maxium)是一種能夠放映比傳統(tǒng)膠片更大和更高解像度的電影放映系統(tǒng)。電影的放映種類越來(lái)越多,票價(jià)也越來(lái)越貴,幾年間票價(jià)由原來(lái)的二十元左右漲到100元左右了,投資影視業(yè)的利潤(rùn)空間越來(lái)越大,如何追求更大的票房收入,成為電影投資者競(jìng)相追求的目標(biāo)。 因此,如何提前預(yù)測(cè)一部電影的票房收入,投資者如何進(jìn)行前期影視宣傳至關(guān)重要。電影作為一種生命周期短暫的特殊商品,對(duì)其收入的預(yù)測(cè)難度相對(duì)較大,關(guān)于電影票房的實(shí)證預(yù)測(cè)一直都很匱乏,也沒(méi)有一套通用的科學(xué)預(yù)測(cè)方法。如何設(shè)計(jì)、構(gòu)建一種科學(xué)、可行性強(qiáng)的預(yù)測(cè)模型,對(duì)電影票房進(jìn)行準(zhǔn)確預(yù)測(cè),使票房預(yù)測(cè)真正成為影視行業(yè)分析與投資的決定性依據(jù)?這些都是當(dāng)前國(guó)內(nèi)外研究學(xué)者們迫切需要解決的難題。 本文以新浪微博為研究平臺(tái),主要研究了基于微博數(shù)據(jù)的電影票房預(yù)測(cè)模型的構(gòu)建問(wèn)題。具體工作如下: 1.本文分析了數(shù)據(jù)挖掘中神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)和線性回歸技術(shù)的理論知識(shí),并提出按照數(shù)據(jù)挖掘標(biāo)準(zhǔn)流程CRISP-DM模型進(jìn)行票房預(yù)測(cè)。 2.詳細(xì)說(shuō)明了數(shù)據(jù)提取和準(zhǔn)備過(guò)程,并且提出分別建立神經(jīng)網(wǎng)絡(luò)模型、支持向量機(jī)、線性回歸模型對(duì)票房進(jìn)行預(yù)測(cè),然后進(jìn)行模型比較,選出最優(yōu)預(yù)測(cè)方案的思路。 3.神經(jīng)網(wǎng)絡(luò)是功能強(qiáng)大的一般函數(shù)預(yù)測(cè)器。一般而言,神經(jīng)網(wǎng)絡(luò)執(zhí)行預(yù)測(cè)任務(wù)的能力非但不遜于其他技術(shù),有時(shí)甚至還有顯著優(yōu)勢(shì)。還有,它們只需很少的統(tǒng)計(jì)或數(shù)學(xué)知識(shí)即可進(jìn)行訓(xùn)練或應(yīng)用。 實(shí)驗(yàn)結(jié)果顯示,利用神經(jīng)網(wǎng)絡(luò)模型在進(jìn)行票房預(yù)測(cè)時(shí),平均相對(duì)誤差很低,預(yù)測(cè)精度高達(dá)90%以上,這體現(xiàn)了神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)準(zhǔn)確性比其他三種模型高,因此在實(shí)際運(yùn)用中,具有很強(qiáng)的可依賴性,能夠?yàn)橛耙暺毙袠I(yè)提供一個(gè)穩(wěn)定的評(píng)估模型。
[Abstract]:Since 20th century, with the rapid development of society and the improvement of people's living standard, people's way of life diversification has been not limited to meet the requirements of material life. Due to the rapid development of the film and television industry, film, as an important part of the cultural industry, provides fun for people's business life. More and more people choose not to stay at home and watch TV after work, but to come out to watch movies and feel the visual impact of the release of new films. With the invention and rapid popularization of the computer, the rapid extension of the Internet has provided strong technical support for the development of the film and television industry. By wearing stereoscopic glasses, viewers can see stereoscopic virtual characters. IMAX Image Maxim is a film screening system capable of showing larger and higher resolution than traditional film. The variety of films is increasing and the price of tickets is increasing. In recent years, the ticket price has risen from 20 yuan to about 100 yuan, the profit space of the investment film and television industry is getting bigger and bigger, how to pursue the bigger box office income, becomes the target which the movie investor competes to pursue. Therefore, how to predict the box office income of a movie in advance, how to carry out the pre-stage film and television publicity is very important. As a special commodity with short life cycle, it is relatively difficult to predict the income of the film. The empirical prediction of film box office has been very scarce, and there is not a set of general scientific prediction methods. How to design, build a scientific, feasible prediction model to predict the film box office accurately. Making box-office prediction really become the decisive basis for film and television industry analysis and investment? These are the current domestic and foreign researchers urgently need to solve the problem. Based on the research platform of Sina Weibo, this paper mainly studies the construction of movie box office prediction model based on Weibo data. The specific work is as follows: 1. This paper analyzes the theoretical knowledge of neural network, support vector machine and linear regression technology in data mining, and puts forward the box-office prediction according to the standard flow of data mining CRISP-DM model. 2. The process of data extraction and preparation is explained in detail, and a neural network model, support vector machine and linear regression model are proposed to predict the box office, and then the model is compared. The idea of selecting the optimal forecasting scheme. 3. Neural networks are powerful general function predictors. Generally speaking, neural networks are not less capable than other techniques, and sometimes even have significant advantages. They require little statistical or mathematical knowledge to train or apply. The experimental results show that the average relative error is very low and the prediction accuracy is more than 90% when using the neural network model to predict the box office, which shows that the prediction accuracy of the neural network model is higher than that of the other three models. Therefore, it has strong dependability and can provide a stable evaluation model for film and television ticket industry.
【學(xué)位授予單位】:安徽大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2014
【分類號(hào)】:TP393.092;TP18
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 夏丹;;我國(guó)3D電影票房影響因素的實(shí)證分析[J];現(xiàn)代傳播(中國(guó)傳媒大學(xué)學(xué)報(bào));2012年09期
2 胡小莉;李波;吳正鵬;;電影票房的影響因素分析[J];中國(guó)傳媒大學(xué)學(xué)報(bào)(自然科學(xué)版);2013年01期
3 ;傳媒數(shù)字[J];現(xiàn)代視聽(tīng);2013年02期
4 ;每周熱門節(jié)點(diǎn)——1996年全美電影票房排行[J];每周電腦報(bào);1997年08期
5 ;中國(guó)電影票房破百億[J];青年記者;2011年03期
6 王文文;周澍民;;社會(huì)化媒體對(duì)電影票房的預(yù)測(cè)價(jià)值研究[J];新聞傳播;2013年12期
7 晉斌;張輝;;基于馬爾科夫鏈模型的中國(guó)3D電影票房研究[J];中國(guó)傳媒大學(xué)學(xué)報(bào)(自然科學(xué)版);2014年02期
8 笈藜;;電影票房分賬別讓觀眾買單[J];聲屏世界;2012年12期
9 ;傳媒數(shù)字[J];現(xiàn)代視聽(tīng);2013年07期
10 ;傳媒數(shù)字[J];現(xiàn)代視聽(tīng);2012年12期
相關(guān)會(huì)議論文 前1條
1 昝勝鋒;朱文雁;;嵌入式廣告、文化暗合與電影票房[A];建設(shè)經(jīng)濟(jì)文化強(qiáng)。禾魬(zhàn)·機(jī)遇·對(duì)策——山東省社會(huì)科學(xué)界2009年學(xué)術(shù)年會(huì)文集(4)[C];2009年
相關(guān)重要報(bào)紙文章 前10條
1 記者 周南焱;北京電影票房10個(gè)月破6億元[N];北京日?qǐng)?bào);2009年
2 記者 張景華;北京2012年電影票房首超16億[N];光明日?qǐng)?bào);2013年
3 記者 李晚成;去年電影票房2.7億元[N];江西日?qǐng)?bào);2013年
4 記者 周南焱 實(shí)習(xí)生 孫杰;北京電影票房去年進(jìn)賬超16億元[N];北京日?qǐng)?bào);2013年
5 記者 龔雪 通訊員 于松業(yè);去年省電影票房突破8億元[N];湖北日?qǐng)?bào);2013年
6 記者 衛(wèi)小林;海南去年電影票房歷史性突破[N];海南日?qǐng)?bào);2013年
7 記者 吳園園;電影票房:5月一周頂過(guò)去一年[N];北京商報(bào);2013年
8 北京商報(bào)記者 吳園園;全年電影票房仍將平穩(wěn)增長(zhǎng)[N];北京商報(bào);2013年
9 素淡;電影票房高,,網(wǎng)絡(luò)營(yíng)銷作用有多大?[N];中國(guó)文化報(bào);2013年
10 記者 董大汗;上半年全國(guó)電影票房突破百億元[N];中國(guó)藝術(shù)報(bào);2013年
相關(guān)碩士學(xué)位論文 前1條
1 楊威;基于微博數(shù)據(jù)的電影票房預(yù)測(cè)模型研究[D];安徽大學(xué);2014年
本文編號(hào):1489338
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/1489338.html