影視大數(shù)據(jù)研究
發(fā)布時間:2023-03-26 21:26
在當(dāng)今移動互聯(lián)網(wǎng)和物聯(lián)網(wǎng)飛速發(fā)展的時代,大量的信息化數(shù)據(jù)逐年遞增,如何有效的獲取有價值的信息,大數(shù)據(jù)挖掘技術(shù)成為了重中之重。國民經(jīng)濟(jì)支柱之一的文化影視產(chǎn)業(yè)備受各大廣電網(wǎng)絡(luò),投資人關(guān)注。票房和收視率作為影視行業(yè)的主要評測標(biāo)準(zhǔn),制片人、廣告代理機(jī)構(gòu)投資及收益的主要參考依據(jù),無形中體現(xiàn)了有效數(shù)據(jù)分析的價值。面對大數(shù)據(jù)大潮的來臨,影視大數(shù)據(jù)的存儲,預(yù)處理及分析將面臨巨大的挑戰(zhàn)。本文主要闡述了大數(shù)據(jù)的含義、特征及影視大數(shù)據(jù)的特點(diǎn),統(tǒng)計學(xué)在數(shù)據(jù)挖掘、分析過程中的作用及方法。最后利用python網(wǎng)絡(luò)爬蟲獲取互聯(lián)網(wǎng)上的影視數(shù)據(jù)作為全量數(shù)據(jù);通過hadoop大數(shù)據(jù)平臺對非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行數(shù)據(jù)預(yù)處理,數(shù)據(jù)清洗、數(shù)據(jù)去重、數(shù)據(jù)集成、數(shù)據(jù)標(biāo)準(zhǔn)化處理;處理完畢后基于數(shù)據(jù)挖掘技術(shù),利用關(guān)聯(lián)分析、聚類分析、因子分析法并建立k-means+關(guān)聯(lián)分析算法訓(xùn)練模型,對電影、電視劇全量數(shù)據(jù)進(jìn)行建模處理分析,根據(jù)影片類型、出品方、制片地區(qū)、投資額、票房、收視率、網(wǎng)絡(luò)評分、受眾群體等因素、對近年影視數(shù)據(jù)進(jìn)行了分析研究。研究顯示國內(nèi)電影票房數(shù)逐年提升;知名導(dǎo)演;明星效應(yīng)對于影片票房、收視率有很大影響;另外也可以看出,收視率與投資不...
【文章頁數(shù)】:74 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
符號對照表
縮略語對照表
第一章 緒論
1.1 研究背景
1.1.1 大數(shù)據(jù)背景
1.1.2 行業(yè)背景
1.1.3 影視大數(shù)據(jù)背景
1.2 研究意義
1.3 國內(nèi)外發(fā)展現(xiàn)狀
1.3.1 國外大數(shù)據(jù)發(fā)展?fàn)顩r
1.3.2 國內(nèi)發(fā)數(shù)據(jù)發(fā)展?fàn)顩r
1.3.3 影視大數(shù)據(jù)服務(wù)發(fā)展趨勢
1.4 論文研究主要內(nèi)容
1.4.1 本文主要內(nèi)容
1.4.2 本文章節(jié)安排
第二章 影視大數(shù)據(jù)特征及算法研究
2.1 大數(shù)據(jù)的含義及特征
2.1.1 大數(shù)據(jù)的含義
2.1.2 大數(shù)據(jù)的特征
2.1.3 影視大數(shù)據(jù)特征
2.2 關(guān)聯(lián)分析法
2.2.1 關(guān)聯(lián)分析法定義
2.2.2 關(guān)聯(lián)分析算法
2.2.3 關(guān)聯(lián)分析算法步驟
2.3 聚類分析法
2.3.1 聚類分析算法
2.3.2 聚類算法特征
2.3.3 聚類算法分類
2.3.4 聚類分析法步驟
2.4 因子分析法
2.4.1 因子分析法介紹
2.4.2 因子分析法原理
2.4.3 因子分析法步驟
第三章 大數(shù)據(jù)處理技術(shù)及平臺構(gòu)建
3.1 主要應(yīng)用技術(shù)手段
3.1.1 數(shù)據(jù)采集
3.1.2 大數(shù)據(jù)挖掘
3.1.3 自然語言理解
3.2 大數(shù)據(jù)處理技術(shù)
3.2.1 大數(shù)據(jù)采集
3.2.2 大數(shù)據(jù)存儲與管理
3.2.3 大數(shù)據(jù)挖掘與分析
3.2.4 大數(shù)據(jù)展示與應(yīng)用
3.3 大數(shù)據(jù)處理平臺
3.3.1 基于Hadoop平臺框架
3.3.2 影視大數(shù)據(jù)平臺構(gòu)建
第四章 影視大數(shù)據(jù)應(yīng)用技術(shù)研究
4.1 影視數(shù)據(jù)采集及預(yù)處理
4.1.1 網(wǎng)絡(luò)爬蟲數(shù)據(jù)采集
4.1.2 數(shù)據(jù)預(yù)處理
4.2 中國電影、電視劇趨勢研究
4.2.1 中國電影總票房收入分析
4.2.2 中國電視劇產(chǎn)量及集數(shù)分析
4.2.3 電影增長及高分電影類型、地域分布情況
4.3 電影數(shù)據(jù)研究
4.3.1 基于關(guān)聯(lián)分析的電影數(shù)據(jù)分析
4.3.2 基于聚類分析的電影數(shù)據(jù)分析
4.3.3 基于因子分析的電影數(shù)據(jù)分析
4.4 電視劇數(shù)據(jù)研究
4.4.1 基于關(guān)聯(lián)分析的電視劇數(shù)據(jù)分析
4.4.2 基于聚類分析的電視劇數(shù)據(jù)分析
4.4.3 基于因子分析的電視劇數(shù)據(jù)分析
第五章 結(jié)論與展望
5.1 結(jié)論
5.2 展望
參考文獻(xiàn)
致謝
作者簡介
本文編號:3771766
【文章頁數(shù)】:74 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
符號對照表
縮略語對照表
第一章 緒論
1.1 研究背景
1.1.1 大數(shù)據(jù)背景
1.1.2 行業(yè)背景
1.1.3 影視大數(shù)據(jù)背景
1.2 研究意義
1.3 國內(nèi)外發(fā)展現(xiàn)狀
1.3.1 國外大數(shù)據(jù)發(fā)展?fàn)顩r
1.3.2 國內(nèi)發(fā)數(shù)據(jù)發(fā)展?fàn)顩r
1.3.3 影視大數(shù)據(jù)服務(wù)發(fā)展趨勢
1.4 論文研究主要內(nèi)容
1.4.1 本文主要內(nèi)容
1.4.2 本文章節(jié)安排
第二章 影視大數(shù)據(jù)特征及算法研究
2.1 大數(shù)據(jù)的含義及特征
2.1.1 大數(shù)據(jù)的含義
2.1.2 大數(shù)據(jù)的特征
2.1.3 影視大數(shù)據(jù)特征
2.2 關(guān)聯(lián)分析法
2.2.1 關(guān)聯(lián)分析法定義
2.2.2 關(guān)聯(lián)分析算法
2.2.3 關(guān)聯(lián)分析算法步驟
2.3 聚類分析法
2.3.1 聚類分析算法
2.3.2 聚類算法特征
2.3.3 聚類算法分類
2.3.4 聚類分析法步驟
2.4 因子分析法
2.4.1 因子分析法介紹
2.4.2 因子分析法原理
2.4.3 因子分析法步驟
第三章 大數(shù)據(jù)處理技術(shù)及平臺構(gòu)建
3.1 主要應(yīng)用技術(shù)手段
3.1.1 數(shù)據(jù)采集
3.1.2 大數(shù)據(jù)挖掘
3.1.3 自然語言理解
3.2 大數(shù)據(jù)處理技術(shù)
3.2.1 大數(shù)據(jù)采集
3.2.2 大數(shù)據(jù)存儲與管理
3.2.3 大數(shù)據(jù)挖掘與分析
3.2.4 大數(shù)據(jù)展示與應(yīng)用
3.3 大數(shù)據(jù)處理平臺
3.3.1 基于Hadoop平臺框架
3.3.2 影視大數(shù)據(jù)平臺構(gòu)建
第四章 影視大數(shù)據(jù)應(yīng)用技術(shù)研究
4.1 影視數(shù)據(jù)采集及預(yù)處理
4.1.1 網(wǎng)絡(luò)爬蟲數(shù)據(jù)采集
4.1.2 數(shù)據(jù)預(yù)處理
4.2 中國電影、電視劇趨勢研究
4.2.1 中國電影總票房收入分析
4.2.2 中國電視劇產(chǎn)量及集數(shù)分析
4.2.3 電影增長及高分電影類型、地域分布情況
4.3 電影數(shù)據(jù)研究
4.3.1 基于關(guān)聯(lián)分析的電影數(shù)據(jù)分析
4.3.2 基于聚類分析的電影數(shù)據(jù)分析
4.3.3 基于因子分析的電影數(shù)據(jù)分析
4.4 電視劇數(shù)據(jù)研究
4.4.1 基于關(guān)聯(lián)分析的電視劇數(shù)據(jù)分析
4.4.2 基于聚類分析的電視劇數(shù)據(jù)分析
4.4.3 基于因子分析的電視劇數(shù)據(jù)分析
第五章 結(jié)論與展望
5.1 結(jié)論
5.2 展望
參考文獻(xiàn)
致謝
作者簡介
本文編號:3771766
本文鏈接:http://sikaile.net/wenyilunwen/dianyingdianshilunwen/3771766.html
教材專著