視頻分享網(wǎng)站熱門視頻快速挖掘預(yù)測(cè)模型
本文關(guān)鍵詞:視頻分享網(wǎng)站熱門視頻快速挖掘預(yù)測(cè)模型,由筆耕文化傳播整理發(fā)布。
【摘要】:隨著互聯(lián)網(wǎng)的蓬勃發(fā)展,網(wǎng)絡(luò)視頻已經(jīng)成為了互聯(lián)網(wǎng)重要的產(chǎn)業(yè)之一。目前,互聯(lián)網(wǎng)視頻已經(jīng)擁有了巨大用戶數(shù)量規(guī)模,其形態(tài)多樣和數(shù)據(jù)量大等特點(diǎn)使其傳播影響力已經(jīng)超越電視、紙媒等傳統(tǒng)媒體。在Web2.0的發(fā)展契機(jī)下,互聯(lián)網(wǎng)變得的更具有開放性、廣泛性,其中視頻分享網(wǎng)站以個(gè)人用戶為網(wǎng)絡(luò)視頻主要的發(fā)布源頭,使得節(jié)目內(nèi)容最大化的豐富,視頻數(shù)量也呈爆炸式的增長。視頻分享網(wǎng)站類似優(yōu)酷網(wǎng),youtube等網(wǎng)站在視頻網(wǎng)站加上了社交元素,使得視頻分享網(wǎng)站能體現(xiàn)更豐富的內(nèi)容元素,同時(shí)也為為實(shí)時(shí)熱點(diǎn)、網(wǎng)絡(luò)輿情等研究方向提供了更為豐富的元數(shù)據(jù)。熱門視頻能夠?yàn)榫W(wǎng)站帶來巨大流量,吸引更多用戶觀看,同時(shí)也能引發(fā)網(wǎng)友對(duì)視頻內(nèi)容發(fā)表評(píng)論,表達(dá)自己的觀點(diǎn)。因此,如何在視頻分享網(wǎng)站上快速發(fā)現(xiàn)潛在的熱門視頻資源,并跟蹤監(jiān)控視頻熱度變化,是一個(gè)亟需解決的問題。本文的研究重點(diǎn)是針對(duì)視頻分享網(wǎng)站的特點(diǎn),結(jié)合灰色Verhurlst預(yù)測(cè)模型,建立了一個(gè)熱門視頻挖掘預(yù)測(cè)的模型,能夠快速發(fā)掘熱門視頻并預(yù)測(cè)視頻的發(fā)展趨勢(shì)。本文首先根據(jù)視頻分享網(wǎng)站的粉絲社交特點(diǎn),分析了視頻分享網(wǎng)站對(duì)視頻熱度影響的幾個(gè)因素,提出了賬號(hào)質(zhì)量、粉絲數(shù)量級(jí)別、話題熱度是能夠影響視頻熱度的因素,在熱門視頻的挖掘上,我們將賬號(hào)質(zhì)量、話題熱度這兩個(gè)因素作為參數(shù)加入到熱度計(jì)算中,對(duì)比傳統(tǒng)的熱點(diǎn)視頻發(fā)掘方法,縮短了熱門視頻發(fā)掘的時(shí)間,提高了熱門視頻發(fā)掘的效率。其次本文通過比較現(xiàn)有的趨勢(shì)預(yù)測(cè)模型的優(yōu)缺點(diǎn),最終選擇灰色Verhulst模型作為基礎(chǔ)模型,在模型中加入了我們的話題熱度參數(shù),然后對(duì)比兩種模型對(duì)視頻熱度進(jìn)行預(yù)測(cè),最終通過實(shí)驗(yàn)證明我們的改進(jìn)模型提高了預(yù)測(cè)精度,降低了誤差率。最后根據(jù)我們的理論模型研究設(shè)計(jì)了一個(gè)視頻網(wǎng)站熱點(diǎn)發(fā)掘和預(yù)測(cè)系統(tǒng),對(duì)我們的模型進(jìn)行綜合實(shí)驗(yàn),測(cè)試了模型性能。驗(yàn)證了我們的模型的可實(shí)現(xiàn)性、可靠性和高效性。
【關(guān)鍵詞】:熱門視頻 視頻網(wǎng)站 熱點(diǎn)發(fā)掘 灰色理論 趨勢(shì)預(yù)測(cè)
【學(xué)位授予單位】:杭州電子科技大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:TP393.092;TP391.1
【目錄】:
- 摘要5-6
- ABSTRACT6-11
- 第一章 緒論11-15
- 1.1 研究背景和意義11-12
- 1.2 國內(nèi)外研究現(xiàn)狀及發(fā)展趨勢(shì)12-13
- 1.3 本文的研究內(nèi)容13
- 1.4 本文的組織13-15
- 第二章 相關(guān)理論知識(shí)15-22
- 2.1 熱門視頻的定義15
- 2.2 視頻熱度計(jì)算15-16
- 2.3 視頻分享網(wǎng)站16-17
- 2.4 網(wǎng)絡(luò)爬蟲技術(shù)17
- 2.4.1 網(wǎng)絡(luò)爬蟲原理17
- 2.4.2 網(wǎng)頁抓取策略17
- 2.5 話題檢測(cè)與跟蹤17-21
- 2.5.1 中文分詞18
- 2.5.2 中文分詞常見算法18-19
- 2.5.3 停用詞19
- 2.5.4 向量空間模型19-20
- 2.5.5 特征選擇20
- 2.5.6 文本相似性度量20-21
- 2.6 本章小結(jié)21-22
- 第三章 影響視頻熱度的因素22-35
- 3.1 數(shù)據(jù)來源22-23
- 3.2 賬號(hào)粉絲數(shù)量與播放數(shù)量的關(guān)系23-31
- 3.2.1 視頻類別范圍的確定23-24
- 3.2.2 熱度時(shí)間確定24-26
- 3.2.3 粉絲數(shù)量與總播放數(shù)量的關(guān)系26-29
- 3.2.4 優(yōu)質(zhì)帳號(hào)29-31
- 3.2.5 帳號(hào)質(zhì)量庫31
- 3.3 熱門話題31-33
- 3.4 熱門視頻發(fā)掘33
- 3.5 實(shí)驗(yàn)33-34
- 3.5.1 實(shí)驗(yàn)內(nèi)容33
- 3.5.2 實(shí)驗(yàn)結(jié)果33-34
- 3.6 本章小結(jié)34-35
- 第四章 熱門視頻預(yù)測(cè)與追蹤35-52
- 4.1 視頻資源熱度的計(jì)算方法35-37
- 4.2 熱度計(jì)算方法37-38
- 4.2.1 初始階段37
- 4.2.2 跟蹤預(yù)測(cè)階段37-38
- 4.3 視頻熱度預(yù)測(cè)38-48
- 4.3.1 移動(dòng)平均法38-39
- 4.3.2 指數(shù)平滑法39-41
- 4.3.3 ARIMA模型41
- 4.3.4 灰色理論41-43
- 4.3.5 灰色Verhuslt模型43-44
- 4.3.6 灰色Verhulst模型加入話題熱度參數(shù)后的改進(jìn)方法44
- 4.3.7 誤差分析標(biāo)準(zhǔn)44-45
- 4.3.8 實(shí)驗(yàn)45-48
- 4.4 熱度排序48-51
- 4.4.1 插入排序48-49
- 4.4.2 冒泡排序49
- 4.4.3 快速排序49
- 4.4.4 堆排序49-51
- 4.5 本章小結(jié)51-52
- 第五章 模型實(shí)現(xiàn)52-57
- 5.1 模型設(shè)計(jì)52
- 5.2 模塊介紹52-55
- 5.2.1 數(shù)據(jù)采集模塊52-54
- 5.2.2 話題計(jì)算54-55
- 5.2.3 熱點(diǎn)發(fā)掘55
- 5.2.4 跟蹤預(yù)測(cè)55
- 5.2.5 結(jié)果顯示55
- 5.3 性能測(cè)驗(yàn)55-56
- 5.3.1 實(shí)驗(yàn)環(huán)境56
- 5.3.2 實(shí)驗(yàn)結(jié)果56
- 5.4 本章小結(jié)56-57
- 第六章 總結(jié)和展望57-58
- 致謝58-59
- 參考文獻(xiàn)59-62
- 附錄62-63
- 詳細(xì)摘要63-65
【參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 董日壯;郭曙超;;網(wǎng)絡(luò)爬蟲的設(shè)計(jì)與實(shí)現(xiàn)[J];電腦知識(shí)與技術(shù);2014年17期
2 羅小琴;;網(wǎng)絡(luò)輿情監(jiān)控在人口政策上的應(yīng)用[J];中國信息安全;2014年06期
3 趙宇翔;范哲;朱慶華;;用戶生成內(nèi)容(UGC)概念解析及研究進(jìn)展[J];中國圖書館學(xué)報(bào);2012年05期
4 袁曉峰;;《知網(wǎng)》義原相似度計(jì)算的研究[J];遼寧大學(xué)學(xué)報(bào)(自然科學(xué)版);2011年04期
5 李宏波;;詞典與統(tǒng)計(jì)相結(jié)合的中文分詞算法研究[J];武漢理工大學(xué)學(xué)報(bào)(信息與管理工程版);2010年06期
6 楊凱峰;張毅坤;李燕;;基于文檔頻率的特征選擇方法[J];計(jì)算機(jī)工程;2010年17期
7 孫立偉;何國輝;吳禮發(fā);;網(wǎng)絡(luò)爬蟲技術(shù)的研究[J];電腦知識(shí)與技術(shù);2010年15期
8 王正新;黨耀國;劉思峰;;無偏灰色Verhulst模型及其應(yīng)用[J];系統(tǒng)工程理論與實(shí)踐;2009年10期
9 喬良;;文本挖掘技術(shù)研究及其在信息檢索中的應(yīng)用[J];軟件導(dǎo)刊;2009年04期
10 熊德蘭;程菊明;田勝利;;基于HowNet的句子褒貶傾向性研究[J];計(jì)算機(jī)工程與應(yīng)用;2008年22期
本文關(guān)鍵詞:視頻分享網(wǎng)站熱門視頻快速挖掘預(yù)測(cè)模型,,由筆耕文化傳播整理發(fā)布。
本文編號(hào):453379
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/453379.html