基于異常檢測的電影票房注水檢測
發(fā)布時間:2020-08-25 22:40
【摘要】:中國電影市場已發(fā)展成為世界第二大電影市場,電影票房作為衡量電影受歡迎程度的重要指標,也受到越來越多的關(guān)注。但是,為了謀取更多利益,近年來電影票房注水現(xiàn)象屢見不鮮,已經(jīng)成為阻礙中國電影市場發(fā)展的一大因素。票房注水檢測成為票房監(jiān)管的當務之急,但是目前卻沒有人對其進行系統(tǒng)的技術(shù)性研究。因此,本文從票房原始數(shù)據(jù)出發(fā),圍繞票房注水進行一系列研究,在票房注水檢測方面有開創(chuàng)性意義。了解數(shù)據(jù)本身的特征是開展所有工作的重要前提,鑒于此前沒有票房數(shù)據(jù)的先驗分析,因此分析電影票房數(shù)據(jù)成為首要工作。本文通過數(shù)據(jù)特征分析,得出了票房數(shù)據(jù)規(guī)律,同時為后文的注水檢測奠定了堅實基礎。電影票房數(shù)據(jù)的轉(zhuǎn)化標記是本文一個重要工作,尤其是如何只提取反映電影注水與否的有用信息并將其轉(zhuǎn)化為可分類數(shù)據(jù)形式。因為沒有可供借鑒的方法,本文依靠電影行業(yè)經(jīng)驗和其他數(shù)據(jù)的處理方式提出“數(shù)據(jù)打分”方法,將電影票房數(shù)據(jù)轉(zhuǎn)換成為數(shù)值型數(shù)據(jù),并制定規(guī)則進行注水票房標記。本文另一工作重點是提出了非核函數(shù)多分類QSSVM-OAA模型,此模型既保留了傳統(tǒng)支持向量機的優(yōu)點,又避免了核函數(shù)的選取,通過對公共數(shù)據(jù)集進行實驗比較,驗證了 QSSVM-OAA模型的優(yōu)異性能,即相較于傳統(tǒng)多分類方法,其在精確度和穩(wěn)定性上都有所提高,并且更適合小訓練集數(shù)據(jù),這也更契合電影票房的數(shù)據(jù)特征。最后,將轉(zhuǎn)化標記后的數(shù)據(jù)輸入QSSVM-OAA模型中進行分類,其結(jié)果達到了票房注水檢測的預期效果。本文在電影票房注水檢測方面做出的探索與實驗有理論與科學依據(jù),并且實驗結(jié)果也進一步說明方法的可行性。
【學位授予單位】:中國科學院大學(中國科學院人工智能學院)
【學位級別】:碩士
【學位授予年份】:2018
【分類號】:J943
【圖文】:
的樣本點之間的間隔稱為分離邊緣,用p表示。支持向最機學習的目的就是找到逡逑一個分類超平面,使得超平刖到樣本點的間隔M人化,此超平ifii就稱為M優(yōu)超平逡逑面,如圖1.1所示:逡逑X-,逡逑?邋/邋^逡逑媭。逡逑?y…逡逑閣i.i邋svmM優(yōu)超平面逡逑Figure邋1.1邋SVM邋Optimal邋Hyperphine逡逑7逡逑
圖1.3研宄步驟逡逑Figure邋1.3邋Research邋Steps逡逑本文的組織結(jié)構(gòu)如下:逡逑第?章緒論
圖2.1票房變化趨勢分析流程逡逑Figure邋2.1邋Box-office邋Clismge邋Trend邋Analysis邋Process逡逑電影《葉問3》首映日的票房數(shù)據(jù),利用R語言統(tǒng)計全房數(shù)量如表2.4所示。逡逑表2.4首映日票房貢獻逡逑Table2.4邋Opening邋Day邋Box-office邋Contribution逡逑票房(張)邐谷il丨名稱邐票29733邐湖北8723邐湖南19384邐廣東邐10652邐廣內(nèi)7968邐海南13208邐叫川
本文編號:2804298
【學位授予單位】:中國科學院大學(中國科學院人工智能學院)
【學位級別】:碩士
【學位授予年份】:2018
【分類號】:J943
【圖文】:
的樣本點之間的間隔稱為分離邊緣,用p表示。支持向最機學習的目的就是找到逡逑一個分類超平面,使得超平刖到樣本點的間隔M人化,此超平ifii就稱為M優(yōu)超平逡逑面,如圖1.1所示:逡逑X-,逡逑?邋/邋^逡逑媭。逡逑?y…逡逑閣i.i邋svmM優(yōu)超平面逡逑Figure邋1.1邋SVM邋Optimal邋Hyperphine逡逑7逡逑
圖1.3研宄步驟逡逑Figure邋1.3邋Research邋Steps逡逑本文的組織結(jié)構(gòu)如下:逡逑第?章緒論
圖2.1票房變化趨勢分析流程逡逑Figure邋2.1邋Box-office邋Clismge邋Trend邋Analysis邋Process逡逑電影《葉問3》首映日的票房數(shù)據(jù),利用R語言統(tǒng)計全房數(shù)量如表2.4所示。逡逑表2.4首映日票房貢獻逡逑Table2.4邋Opening邋Day邋Box-office邋Contribution逡逑票房(張)邐谷il丨名稱邐票29733邐湖北8723邐湖南19384邐廣東邐10652邐廣內(nèi)7968邐海南13208邐叫川
【參考文獻】
相關(guān)期刊論文 前4條
1 鄭堅;周尚波;;基于神經(jīng)網(wǎng)絡的電影票房預測建模[J];計算機應用;2014年03期
2 裴培;蔣垠蘢;;國內(nèi)外電影票房影響因素分析[J];合作經(jīng)濟與科技;2014年02期
3 崔凝凝;唐嘉庚;;基于回歸分析的中國電影票房影響因素研究[J];江蘇商論;2012年08期
4 賈小恒;;淺析Oracle數(shù)據(jù)庫的優(yōu)化[J];微計算機信息;2011年11期
本文編號:2804298
本文鏈接:http://sikaile.net/wenyilunwen/dianyingdianshilunwen/2804298.html