視頻分享網(wǎng)站熱門視頻快速挖掘預測模型
本文關(guān)鍵詞:視頻分享網(wǎng)站熱門視頻快速挖掘預測模型,由筆耕文化傳播整理發(fā)布。
【摘要】:隨著互聯(lián)網(wǎng)的蓬勃發(fā)展,網(wǎng)絡(luò)視頻已經(jīng)成為了互聯(lián)網(wǎng)重要的產(chǎn)業(yè)之一。目前,互聯(lián)網(wǎng)視頻已經(jīng)擁有了巨大用戶數(shù)量規(guī)模,其形態(tài)多樣和數(shù)據(jù)量大等特點使其傳播影響力已經(jīng)超越電視、紙媒等傳統(tǒng)媒體。在Web2.0的發(fā)展契機下,互聯(lián)網(wǎng)變得的更具有開放性、廣泛性,其中視頻分享網(wǎng)站以個人用戶為網(wǎng)絡(luò)視頻主要的發(fā)布源頭,使得節(jié)目內(nèi)容最大化的豐富,視頻數(shù)量也呈爆炸式的增長。視頻分享網(wǎng)站類似優(yōu)酷網(wǎng),youtube等網(wǎng)站在視頻網(wǎng)站加上了社交元素,使得視頻分享網(wǎng)站能體現(xiàn)更豐富的內(nèi)容元素,同時也為為實時熱點、網(wǎng)絡(luò)輿情等研究方向提供了更為豐富的元數(shù)據(jù)。熱門視頻能夠為網(wǎng)站帶來巨大流量,吸引更多用戶觀看,同時也能引發(fā)網(wǎng)友對視頻內(nèi)容發(fā)表評論,表達自己的觀點。因此,如何在視頻分享網(wǎng)站上快速發(fā)現(xiàn)潛在的熱門視頻資源,并跟蹤監(jiān)控視頻熱度變化,是一個亟需解決的問題。本文的研究重點是針對視頻分享網(wǎng)站的特點,結(jié)合灰色Verhurlst預測模型,建立了一個熱門視頻挖掘預測的模型,能夠快速發(fā)掘熱門視頻并預測視頻的發(fā)展趨勢。本文首先根據(jù)視頻分享網(wǎng)站的粉絲社交特點,分析了視頻分享網(wǎng)站對視頻熱度影響的幾個因素,提出了賬號質(zhì)量、粉絲數(shù)量級別、話題熱度是能夠影響視頻熱度的因素,在熱門視頻的挖掘上,我們將賬號質(zhì)量、話題熱度這兩個因素作為參數(shù)加入到熱度計算中,對比傳統(tǒng)的熱點視頻發(fā)掘方法,縮短了熱門視頻發(fā)掘的時間,提高了熱門視頻發(fā)掘的效率。其次本文通過比較現(xiàn)有的趨勢預測模型的優(yōu)缺點,最終選擇灰色Verhulst模型作為基礎(chǔ)模型,在模型中加入了我們的話題熱度參數(shù),然后對比兩種模型對視頻熱度進行預測,最終通過實驗證明我們的改進模型提高了預測精度,降低了誤差率。最后根據(jù)我們的理論模型研究設(shè)計了一個視頻網(wǎng)站熱點發(fā)掘和預測系統(tǒng),對我們的模型進行綜合實驗,測試了模型性能。驗證了我們的模型的可實現(xiàn)性、可靠性和高效性。
【關(guān)鍵詞】:熱門視頻 視頻網(wǎng)站 熱點發(fā)掘 灰色理論 趨勢預測
【學位授予單位】:杭州電子科技大學
【學位級別】:碩士
【學位授予年份】:2016
【分類號】:TP393.092;TP391.1
【目錄】:
- 摘要5-6
- ABSTRACT6-11
- 第一章 緒論11-15
- 1.1 研究背景和意義11-12
- 1.2 國內(nèi)外研究現(xiàn)狀及發(fā)展趨勢12-13
- 1.3 本文的研究內(nèi)容13
- 1.4 本文的組織13-15
- 第二章 相關(guān)理論知識15-22
- 2.1 熱門視頻的定義15
- 2.2 視頻熱度計算15-16
- 2.3 視頻分享網(wǎng)站16-17
- 2.4 網(wǎng)絡(luò)爬蟲技術(shù)17
- 2.4.1 網(wǎng)絡(luò)爬蟲原理17
- 2.4.2 網(wǎng)頁抓取策略17
- 2.5 話題檢測與跟蹤17-21
- 2.5.1 中文分詞18
- 2.5.2 中文分詞常見算法18-19
- 2.5.3 停用詞19
- 2.5.4 向量空間模型19-20
- 2.5.5 特征選擇20
- 2.5.6 文本相似性度量20-21
- 2.6 本章小結(jié)21-22
- 第三章 影響視頻熱度的因素22-35
- 3.1 數(shù)據(jù)來源22-23
- 3.2 賬號粉絲數(shù)量與播放數(shù)量的關(guān)系23-31
- 3.2.1 視頻類別范圍的確定23-24
- 3.2.2 熱度時間確定24-26
- 3.2.3 粉絲數(shù)量與總播放數(shù)量的關(guān)系26-29
- 3.2.4 優(yōu)質(zhì)帳號29-31
- 3.2.5 帳號質(zhì)量庫31
- 3.3 熱門話題31-33
- 3.4 熱門視頻發(fā)掘33
- 3.5 實驗33-34
- 3.5.1 實驗內(nèi)容33
- 3.5.2 實驗結(jié)果33-34
- 3.6 本章小結(jié)34-35
- 第四章 熱門視頻預測與追蹤35-52
- 4.1 視頻資源熱度的計算方法35-37
- 4.2 熱度計算方法37-38
- 4.2.1 初始階段37
- 4.2.2 跟蹤預測階段37-38
- 4.3 視頻熱度預測38-48
- 4.3.1 移動平均法38-39
- 4.3.2 指數(shù)平滑法39-41
- 4.3.3 ARIMA模型41
- 4.3.4 灰色理論41-43
- 4.3.5 灰色Verhuslt模型43-44
- 4.3.6 灰色Verhulst模型加入話題熱度參數(shù)后的改進方法44
- 4.3.7 誤差分析標準44-45
- 4.3.8 實驗45-48
- 4.4 熱度排序48-51
- 4.4.1 插入排序48-49
- 4.4.2 冒泡排序49
- 4.4.3 快速排序49
- 4.4.4 堆排序49-51
- 4.5 本章小結(jié)51-52
- 第五章 模型實現(xiàn)52-57
- 5.1 模型設(shè)計52
- 5.2 模塊介紹52-55
- 5.2.1 數(shù)據(jù)采集模塊52-54
- 5.2.2 話題計算54-55
- 5.2.3 熱點發(fā)掘55
- 5.2.4 跟蹤預測55
- 5.2.5 結(jié)果顯示55
- 5.3 性能測驗55-56
- 5.3.1 實驗環(huán)境56
- 5.3.2 實驗結(jié)果56
- 5.4 本章小結(jié)56-57
- 第六章 總結(jié)和展望57-58
- 致謝58-59
- 參考文獻59-62
- 附錄62-63
- 詳細摘要63-65
【參考文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 董日壯;郭曙超;;網(wǎng)絡(luò)爬蟲的設(shè)計與實現(xiàn)[J];電腦知識與技術(shù);2014年17期
2 羅小琴;;網(wǎng)絡(luò)輿情監(jiān)控在人口政策上的應(yīng)用[J];中國信息安全;2014年06期
3 趙宇翔;范哲;朱慶華;;用戶生成內(nèi)容(UGC)概念解析及研究進展[J];中國圖書館學報;2012年05期
4 袁曉峰;;《知網(wǎng)》義原相似度計算的研究[J];遼寧大學學報(自然科學版);2011年04期
5 李宏波;;詞典與統(tǒng)計相結(jié)合的中文分詞算法研究[J];武漢理工大學學報(信息與管理工程版);2010年06期
6 楊凱峰;張毅坤;李燕;;基于文檔頻率的特征選擇方法[J];計算機工程;2010年17期
7 孫立偉;何國輝;吳禮發(fā);;網(wǎng)絡(luò)爬蟲技術(shù)的研究[J];電腦知識與技術(shù);2010年15期
8 王正新;黨耀國;劉思峰;;無偏灰色Verhulst模型及其應(yīng)用[J];系統(tǒng)工程理論與實踐;2009年10期
9 喬良;;文本挖掘技術(shù)研究及其在信息檢索中的應(yīng)用[J];軟件導刊;2009年04期
10 熊德蘭;程菊明;田勝利;;基于HowNet的句子褒貶傾向性研究[J];計算機工程與應(yīng)用;2008年22期
本文關(guān)鍵詞:視頻分享網(wǎng)站熱門視頻快速挖掘預測模型,,由筆耕文化傳播整理發(fā)布。
本文編號:453379
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/453379.html