電影網(wǎng)站數(shù)據(jù)挖掘可視化系統(tǒng)設計與實現(xiàn)
發(fā)布時間:2021-05-12 12:21
隨著互聯(lián)網(wǎng)產(chǎn)業(yè)和電影產(chǎn)業(yè)的高速發(fā)展,二者的聯(lián)系也越來越緊密,許多的互聯(lián)網(wǎng)視頻網(wǎng)站也應運而生,傳統(tǒng)的互聯(lián)網(wǎng)視頻網(wǎng)站聚集了大量的電影資源,只為用戶提供觀看以及下載的渠道,而用戶想在海量的影視資源中尋求合適的電影觀看非常困難,為了給用戶在海量的電影資源中作出客觀合理的抉擇提供一定的參考,從電影網(wǎng)絡影評為切入點設計了電影數(shù)據(jù)挖掘的可視化系統(tǒng)。由于網(wǎng)絡上的影評包含了觀影用戶豐富的感情和傾向,也包含了在情感和語義層面上不同電影之間的關聯(lián)程度。該系統(tǒng)以電影影評文本為研究的切入點,在文本中挖掘出電影之間的聯(lián)系。首先基于Scrapy構(gòu)建了一套爬蟲系統(tǒng),用來采集的電影相關數(shù)據(jù),為整個可視化系統(tǒng)提供了廣泛而可靠的數(shù)據(jù)支持,在完成電影影評文本獲取的基礎之上,使用分詞,去停用詞,構(gòu)建電影相關領域的情感詞庫等文本預處理方法,并同時利用基于構(gòu)建好的情感詞典對影評文本進行情感分析,其次,對影評文本和電影簡介組成的文檔進行特征提取,然后利用基于距離的聚類算法K-Means對采集的電影進行歸類。由于需要以詞云的形式來展示影評的關鍵詞,所以采用了關鍵詞抽取的常用算法TF-IDF來抽取影評的關鍵詞。最后,除了對影評文本的一個...
【文章來源】:華中科技大學湖北省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:71 頁
【學位級別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 研究背景及意義
1.2 國內(nèi)外相關研究情況
1.3 本文的主要研究內(nèi)容
1.4 本文組織結(jié)構(gòu)
2 電影網(wǎng)站數(shù)據(jù)挖掘可視化系統(tǒng)的需求分析
2.1 業(yè)務流程分析
2.2 系統(tǒng)功能性需求
2.3 系統(tǒng)非功能性需求
2.4 本章小結(jié)
3 電影網(wǎng)站數(shù)據(jù)挖掘可視化系統(tǒng)設計
3.1 系統(tǒng)架構(gòu)設計
3.2 系統(tǒng)主要功能模塊設計
3.3 系統(tǒng)數(shù)據(jù)庫設計
3.4 本章小結(jié)
4 電影網(wǎng)站數(shù)據(jù)挖掘可視化系統(tǒng)的實現(xiàn)與測試
4.1 系統(tǒng)實現(xiàn)環(huán)境
4.2 系統(tǒng)功能實現(xiàn)
4.3 系統(tǒng)測試
4.4 本章小結(jié)
5 總結(jié)與展望
5.1 全文總結(jié)
5.2 展望
致謝
參考文獻
【參考文獻】:
期刊論文
[1]數(shù)據(jù)可視化技術的研究現(xiàn)狀探究——基于社會網(wǎng)絡分析視角[J]. 譚珅,楊亞楠. 價值工程. 2018(36)
[2]基于Python的反反爬蟲技術分析與應用[J]. 余豪士,匡芳君. 智能計算機與應用. 2018(04)
[3]基于Scrapy框架的分布式網(wǎng)絡爬蟲的研究與實現(xiàn)[J]. 華云彬,匡芳君. 智能計算機與應用. 2018(05)
[4]基于詞典和弱標注信息的電影評論情感分析[J]. 樊振,過弋,張振豪,韓美琪. 計算機應用. 2018(11)
[5]簡談國內(nèi)IPTV運營概況及發(fā)展方向[J]. 張壯壯. 傳播力研究. 2018(20)
[6]一種基于MapReduce高效K-means并行算法[J]. 王永貴,崔鵬. 遼寧工程技術大學學報(自然科學版). 2017(11)
[7]十分鐘解決爬蟲問題 超輕量級反爬蟲方案[J]. 陸文. 計算機與網(wǎng)絡. 2017(17)
[8]中國移動互聯(lián)網(wǎng)市場結(jié)構(gòu)現(xiàn)狀與發(fā)展態(tài)勢分析[J]. 武常岐,張竹. 管理現(xiàn)代化. 2015(05)
[9]基于微博情感分析的電影票房預測研究[J]. 史偉,王洪偉,何紹義. 華中師范大學學報(自然科學版). 2015(01)
[10]基于深度學習的微博情感分析[J]. 梁軍,柴玉梅,原慧斌,昝紅英,劉銘. 中文信息學報. 2014(05)
博士論文
[1]面向時間敏感對象的垂直搜索引擎關鍵技術研究[D]. 吳羽.浙江大學 2011
碩士論文
[1]基于網(wǎng)絡評論的情感分類技術的研究及應用[D]. 郭捷.電子科技大學 2018
[2]基于機器學習的情感分析方法研究[D]. 張磊.電子科技大學 2018
[3]微博數(shù)據(jù)挖掘可視化系統(tǒng)的設計與實現(xiàn)[D]. 王婧雅.吉林大學 2017
[4]核k-means優(yōu)化方法研究[D]. 樊淑炎.中國礦業(yè)大學 2017
[5]基于網(wǎng)絡影評文本的關系圖譜系統(tǒng)的設計與實現(xiàn)[D]. 陳傳俊.北京郵電大學 2017
[6]基于Web挖掘的視頻推薦系統(tǒng)分析與實現(xiàn)[D]. 徐璐.南京郵電大學 2016
[7]Hadoop中MapReduce的性能優(yōu)化及可視化工具開發(fā)[D]. 徐巖.北京交通大學 2016
[8]基于網(wǎng)絡爬蟲的網(wǎng)站信息采集技術研究[D]. 孫駿雄.大連海事大學 2014
[9]基于情境感知的個性化電影推薦[D]. 李晟.北京郵電大學 2012
本文編號:3183406
【文章來源】:華中科技大學湖北省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:71 頁
【學位級別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 研究背景及意義
1.2 國內(nèi)外相關研究情況
1.3 本文的主要研究內(nèi)容
1.4 本文組織結(jié)構(gòu)
2 電影網(wǎng)站數(shù)據(jù)挖掘可視化系統(tǒng)的需求分析
2.1 業(yè)務流程分析
2.2 系統(tǒng)功能性需求
2.3 系統(tǒng)非功能性需求
2.4 本章小結(jié)
3 電影網(wǎng)站數(shù)據(jù)挖掘可視化系統(tǒng)設計
3.1 系統(tǒng)架構(gòu)設計
3.2 系統(tǒng)主要功能模塊設計
3.3 系統(tǒng)數(shù)據(jù)庫設計
3.4 本章小結(jié)
4 電影網(wǎng)站數(shù)據(jù)挖掘可視化系統(tǒng)的實現(xiàn)與測試
4.1 系統(tǒng)實現(xiàn)環(huán)境
4.2 系統(tǒng)功能實現(xiàn)
4.3 系統(tǒng)測試
4.4 本章小結(jié)
5 總結(jié)與展望
5.1 全文總結(jié)
5.2 展望
致謝
參考文獻
【參考文獻】:
期刊論文
[1]數(shù)據(jù)可視化技術的研究現(xiàn)狀探究——基于社會網(wǎng)絡分析視角[J]. 譚珅,楊亞楠. 價值工程. 2018(36)
[2]基于Python的反反爬蟲技術分析與應用[J]. 余豪士,匡芳君. 智能計算機與應用. 2018(04)
[3]基于Scrapy框架的分布式網(wǎng)絡爬蟲的研究與實現(xiàn)[J]. 華云彬,匡芳君. 智能計算機與應用. 2018(05)
[4]基于詞典和弱標注信息的電影評論情感分析[J]. 樊振,過弋,張振豪,韓美琪. 計算機應用. 2018(11)
[5]簡談國內(nèi)IPTV運營概況及發(fā)展方向[J]. 張壯壯. 傳播力研究. 2018(20)
[6]一種基于MapReduce高效K-means并行算法[J]. 王永貴,崔鵬. 遼寧工程技術大學學報(自然科學版). 2017(11)
[7]十分鐘解決爬蟲問題 超輕量級反爬蟲方案[J]. 陸文. 計算機與網(wǎng)絡. 2017(17)
[8]中國移動互聯(lián)網(wǎng)市場結(jié)構(gòu)現(xiàn)狀與發(fā)展態(tài)勢分析[J]. 武常岐,張竹. 管理現(xiàn)代化. 2015(05)
[9]基于微博情感分析的電影票房預測研究[J]. 史偉,王洪偉,何紹義. 華中師范大學學報(自然科學版). 2015(01)
[10]基于深度學習的微博情感分析[J]. 梁軍,柴玉梅,原慧斌,昝紅英,劉銘. 中文信息學報. 2014(05)
博士論文
[1]面向時間敏感對象的垂直搜索引擎關鍵技術研究[D]. 吳羽.浙江大學 2011
碩士論文
[1]基于網(wǎng)絡評論的情感分類技術的研究及應用[D]. 郭捷.電子科技大學 2018
[2]基于機器學習的情感分析方法研究[D]. 張磊.電子科技大學 2018
[3]微博數(shù)據(jù)挖掘可視化系統(tǒng)的設計與實現(xiàn)[D]. 王婧雅.吉林大學 2017
[4]核k-means優(yōu)化方法研究[D]. 樊淑炎.中國礦業(yè)大學 2017
[5]基于網(wǎng)絡影評文本的關系圖譜系統(tǒng)的設計與實現(xiàn)[D]. 陳傳俊.北京郵電大學 2017
[6]基于Web挖掘的視頻推薦系統(tǒng)分析與實現(xiàn)[D]. 徐璐.南京郵電大學 2016
[7]Hadoop中MapReduce的性能優(yōu)化及可視化工具開發(fā)[D]. 徐巖.北京交通大學 2016
[8]基于網(wǎng)絡爬蟲的網(wǎng)站信息采集技術研究[D]. 孫駿雄.大連海事大學 2014
[9]基于情境感知的個性化電影推薦[D]. 李晟.北京郵電大學 2012
本文編號:3183406
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3183406.html
最近更新
教材專著