基于短視頻平臺(tái)的用戶分析模型研究與實(shí)現(xiàn)
發(fā)布時(shí)間:2021-08-02 10:50
互聯(lián)網(wǎng)和多媒體新聞行業(yè)迅猛發(fā)展,移動(dòng)端的短視頻平臺(tái)逐漸進(jìn)入大眾化時(shí)代,短視頻平臺(tái)逐漸成為大勢(shì)發(fā)展的風(fēng)口。由于時(shí)間簡(jiǎn)短、內(nèi)容豐富、隨時(shí)隨地可以觀看,從而逐漸占領(lǐng)了用戶的碎片化時(shí)間。用戶呈指數(shù)化增長(zhǎng)飆升,龐大的用戶流量引起了電商行業(yè)與廣告行業(yè)的興趣,通過(guò)視頻主播以合作代言的形式推廣產(chǎn)品,形成了一種新的盈利模式。但是過(guò)億級(jí)的用戶量,會(huì)給電商和廣告行業(yè)在尋找合作用戶時(shí)帶來(lái)困難,所以如果能夠在龐大基數(shù)的用戶中篩選出用戶影響力較大的用戶,或者能夠發(fā)掘出有可能的電商潛在合作用戶,就能夠節(jié)省一定量的時(shí)間或成本。本次論文旨在從這個(gè)角度出發(fā),對(duì)研究短視頻行業(yè)與電商行業(yè)的快速融合有著一定的實(shí)踐意義。本文首先闡述了社交網(wǎng)絡(luò)中用戶影響力計(jì)算的研究現(xiàn)狀,介紹了基于粉絲數(shù)量的In-Degree入度算法以及基于Page Rank思想的關(guān)聯(lián)算法,指出了他們所存在的一些不足,如Page Rank的關(guān)聯(lián)算法中粉絲將PR值均勻分給關(guān)注的用戶,存在不合理性。針對(duì)以上算法的不足之處,引出了基于微博網(wǎng)絡(luò)平臺(tái)的SF-UIR影響力算法,探討SF-UIR算法在短視頻平臺(tái)的應(yīng)用實(shí)現(xiàn)。通過(guò)實(shí)驗(yàn)將用戶得到的影響力排序名次與該用戶在因子分析得分...
【文章來(lái)源】:吉林大學(xué)吉林省 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:75 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
HackerNews得分時(shí)間對(duì)應(yīng)
第2章短視頻平臺(tái)的用戶影響力計(jì)算14主要考慮第一項(xiàng)影響因素,用戶自身的影響力計(jì)算。2.5實(shí)驗(yàn)及結(jié)果分析本節(jié)在短視頻平臺(tái)用戶數(shù)據(jù)集下應(yīng)用實(shí)現(xiàn)SF-UIR影響力算法和因子得分排序,對(duì)比分析兩種情況下的用戶排名順位,分析平臺(tái)的官方認(rèn)證以及時(shí)間周期內(nèi)的高質(zhì)量作品對(duì)影響力產(chǎn)生的作用,評(píng)估SF-UIR影響力算法在短視頻平臺(tái)環(huán)境下的可用性。2.5.1抖音短視頻平臺(tái)的用戶影響力計(jì)算基于微博網(wǎng)絡(luò)的SF-UIR算法通過(guò)用戶自身的影響力和用戶粉絲分配的影響力,通過(guò)這兩項(xiàng)指標(biāo)來(lái)計(jì)算該用戶在網(wǎng)絡(luò)環(huán)境中的影響力。在章節(jié)2.4中分析比較了微博網(wǎng)絡(luò)和短視頻平臺(tái)的交互方式和使用方式的差異性,考慮到粉絲的分配影響力在短視頻平臺(tái)的不適用性,所以本次實(shí)驗(yàn)主要考慮第一項(xiàng)因素,用戶自身的影響力計(jì)算。實(shí)驗(yàn)數(shù)據(jù)集為抖音短視頻平臺(tái)獲取的542位用戶,用戶類型包括:優(yōu)質(zhì)視頻作者、人氣視頻作者、專業(yè)領(lǐng)域的認(rèn)證用戶(優(yōu)質(zhì)籃球領(lǐng)域作者、抖音音樂(lè)人、優(yōu)質(zhì)美食自媒體等)、明星用戶、普通用戶。部分?jǐn)?shù)據(jù)集樣本如圖2.2所示,第2列為用戶的平臺(tái)ID、第5列為星座序號(hào)、第6列為用戶的位置、第7列為頭像的存儲(chǔ)地址、第8列為用戶的個(gè)性簽名、第9列為平臺(tái)的官方認(rèn)證,更具體的數(shù)據(jù)集信息會(huì)在章節(jié)4.1中說(shuō)明。圖2.2短視頻平臺(tái)的用戶數(shù)據(jù)集樣本
第3章基于短視頻平臺(tái)的多標(biāo)簽學(xué)習(xí)25主要來(lái)說(shuō)明本文實(shí)驗(yàn)應(yīng)用到的分類器模型。3.3.1ML-KNNCover和Hart在1968年提出KNN近鄰算法,KNN近鄰是數(shù)據(jù)挖掘中常用的分類算法之一。KNN通過(guò)使用某種度量測(cè)量與已經(jīng)標(biāo)注分類好的樣本實(shí)例最近的K個(gè)樣本,被選擇出的K個(gè)樣本判斷為與標(biāo)注樣本屬于同一類別。K為鄰近數(shù),取值若過(guò)小會(huì)被有噪聲的成分影響效果;取值若過(guò)大,會(huì)有近似誤差,與目標(biāo)較遠(yuǎn)的樣本也可能影響預(yù)測(cè)效果,K值增大會(huì)讓學(xué)習(xí)模型變得簡(jiǎn)單化。KNN算法示例如圖3.1所示,KNN鄰近算法過(guò)程簡(jiǎn)述如下:(1)根據(jù)度量規(guī)則計(jì)算出測(cè)試樣本與標(biāo)記好的樣本實(shí)例之間的距離,關(guān)于常用的選取的度量有:余弦值、歐幾里得距離、相關(guān)度、曼哈頓距離;(2)根據(jù)計(jì)算出的距離,按遞增排序;(3)在排序隊(duì)列中找出距離最小的K個(gè)點(diǎn);(4)根據(jù)K個(gè)點(diǎn)出現(xiàn)類別的頻率,統(tǒng)計(jì)出頻率最高的類別作為測(cè)試樣本的被預(yù)測(cè)分類。KNN算法簡(jiǎn)單有效易實(shí)現(xiàn),但是需要計(jì)算測(cè)試樣本和已標(biāo)注好的訓(xùn)練數(shù)據(jù)集中的所有樣本的距離,所以耗費(fèi)時(shí)間較多,若數(shù)據(jù)集隨機(jī)分布,分類效果會(huì)較差。圖3.1KNN算法示例[51]對(duì)于多標(biāo)簽學(xué)習(xí)問(wèn)題,Zhang、Zhou等人在2007年提出ML-KNN算法[36-38],
【參考文獻(xiàn)】:
期刊論文
[1]論短視頻對(duì)傳統(tǒng)媒體轉(zhuǎn)型的促進(jìn)作用[J]. 萬(wàn)勇. 中國(guó)報(bào)業(yè). 2019(24)
[2]國(guó)內(nèi)短視頻發(fā)展現(xiàn)狀及問(wèn)題思考[J]. 林文婧,畢秋敏. 視聽(tīng). 2018(11)
[3]基于PageRank的用戶影響力評(píng)價(jià)改進(jìn)算法[J]. 王頂,徐軍,段存玉,吳玥瑤,孫靜. 哈爾濱工業(yè)大學(xué)學(xué)報(bào). 2018(05)
[4]ML-kNN算法在大數(shù)據(jù)集上的高效應(yīng)用[J]. 陸凱,徐華. 計(jì)算機(jī)工程與應(yīng)用. 2019(01)
[5]一種改進(jìn)PageRank的微博用戶影響力計(jì)算方法[J]. 鄭遠(yuǎn)飛,陳曉升,王志文,陳堅(jiān)旋,陳珂. 廣東石油化工學(xué)院學(xué)報(bào). 2016(03)
[6]如何用SPSS快速計(jì)算主成分的結(jié)果[J]. 林海明. 統(tǒng)計(jì)與決策. 2011(12)
[7]支持向量機(jī)理論與算法研究綜述[J]. 丁世飛,齊丙娟,譚紅艷. 電子科技大學(xué)學(xué)報(bào). 2011(01)
[8]如何正確應(yīng)用SPSS軟件做主成分分析[J]. 李小勝,陳珍珍. 統(tǒng)計(jì)研究. 2010(08)
[9]統(tǒng)計(jì)分析在學(xué)生成績(jī)?cè)u(píng)估中的應(yīng)用[J]. 蘇斌,謝友芹. 系統(tǒng)工程理論與實(shí)踐. 2006(07)
[10]BP人工神經(jīng)網(wǎng)絡(luò)用于肺鱗癌預(yù)后預(yù)測(cè)[J]. 黃德生,周寶森,劉延齡,魏慶琤,李金榮. 中國(guó)衛(wèi)生統(tǒng)計(jì). 2000(06)
博士論文
[1]多標(biāo)簽數(shù)據(jù)分類技術(shù)研究[D]. 劉陽(yáng).西安電子科技大學(xué) 2018
[2]基于用戶行為的信任感知推薦方法研究[D]. 張亞楠.哈爾濱工程大學(xué) 2014
碩士論文
[1]基于標(biāo)簽特征和相關(guān)性的多標(biāo)簽分類研究[D]. 李鋒.西安電子科技大學(xué) 2019
[2]基于SVM的多示例多標(biāo)簽網(wǎng)頁(yè)分類[D]. 朱紅波.中國(guó)石油大學(xué)(華東) 2017
[3]基于標(biāo)簽相關(guān)性和三層BP神經(jīng)網(wǎng)絡(luò)的多標(biāo)簽分類算法研究[D]. 廖麗芳.廈門大學(xué) 2017
[4]基于主成分分析與因子分析數(shù)學(xué)模型的應(yīng)用研究[D]. 解素雯.山東理工大學(xué) 2016
[5]基于有效粉絲的用戶影響力計(jì)算的研究與實(shí)現(xiàn)[D]. 王焱楠.西安電子科技大學(xué) 2015
[6]基于社區(qū)熱度的開(kāi)源軟件排序關(guān)鍵技術(shù)研究[D]. 范強(qiáng).國(guó)防科學(xué)技術(shù)大學(xué) 2015
[7]微博社會(huì)網(wǎng)絡(luò)構(gòu)造與分析技術(shù)研究[D]. 陸毅.復(fù)旦大學(xué) 2011
[8]基于用戶行為及關(guān)系的社交網(wǎng)絡(luò)節(jié)點(diǎn)影響力評(píng)價(jià)[D]. 康書龍.北京郵電大學(xué) 2011
[9]BP神經(jīng)網(wǎng)絡(luò)在土地利用分類中的應(yīng)用分析[D]. 孟治國(guó).吉林大學(xué) 2004
本文編號(hào):3317430
【文章來(lái)源】:吉林大學(xué)吉林省 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:75 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
HackerNews得分時(shí)間對(duì)應(yīng)
第2章短視頻平臺(tái)的用戶影響力計(jì)算14主要考慮第一項(xiàng)影響因素,用戶自身的影響力計(jì)算。2.5實(shí)驗(yàn)及結(jié)果分析本節(jié)在短視頻平臺(tái)用戶數(shù)據(jù)集下應(yīng)用實(shí)現(xiàn)SF-UIR影響力算法和因子得分排序,對(duì)比分析兩種情況下的用戶排名順位,分析平臺(tái)的官方認(rèn)證以及時(shí)間周期內(nèi)的高質(zhì)量作品對(duì)影響力產(chǎn)生的作用,評(píng)估SF-UIR影響力算法在短視頻平臺(tái)環(huán)境下的可用性。2.5.1抖音短視頻平臺(tái)的用戶影響力計(jì)算基于微博網(wǎng)絡(luò)的SF-UIR算法通過(guò)用戶自身的影響力和用戶粉絲分配的影響力,通過(guò)這兩項(xiàng)指標(biāo)來(lái)計(jì)算該用戶在網(wǎng)絡(luò)環(huán)境中的影響力。在章節(jié)2.4中分析比較了微博網(wǎng)絡(luò)和短視頻平臺(tái)的交互方式和使用方式的差異性,考慮到粉絲的分配影響力在短視頻平臺(tái)的不適用性,所以本次實(shí)驗(yàn)主要考慮第一項(xiàng)因素,用戶自身的影響力計(jì)算。實(shí)驗(yàn)數(shù)據(jù)集為抖音短視頻平臺(tái)獲取的542位用戶,用戶類型包括:優(yōu)質(zhì)視頻作者、人氣視頻作者、專業(yè)領(lǐng)域的認(rèn)證用戶(優(yōu)質(zhì)籃球領(lǐng)域作者、抖音音樂(lè)人、優(yōu)質(zhì)美食自媒體等)、明星用戶、普通用戶。部分?jǐn)?shù)據(jù)集樣本如圖2.2所示,第2列為用戶的平臺(tái)ID、第5列為星座序號(hào)、第6列為用戶的位置、第7列為頭像的存儲(chǔ)地址、第8列為用戶的個(gè)性簽名、第9列為平臺(tái)的官方認(rèn)證,更具體的數(shù)據(jù)集信息會(huì)在章節(jié)4.1中說(shuō)明。圖2.2短視頻平臺(tái)的用戶數(shù)據(jù)集樣本
第3章基于短視頻平臺(tái)的多標(biāo)簽學(xué)習(xí)25主要來(lái)說(shuō)明本文實(shí)驗(yàn)應(yīng)用到的分類器模型。3.3.1ML-KNNCover和Hart在1968年提出KNN近鄰算法,KNN近鄰是數(shù)據(jù)挖掘中常用的分類算法之一。KNN通過(guò)使用某種度量測(cè)量與已經(jīng)標(biāo)注分類好的樣本實(shí)例最近的K個(gè)樣本,被選擇出的K個(gè)樣本判斷為與標(biāo)注樣本屬于同一類別。K為鄰近數(shù),取值若過(guò)小會(huì)被有噪聲的成分影響效果;取值若過(guò)大,會(huì)有近似誤差,與目標(biāo)較遠(yuǎn)的樣本也可能影響預(yù)測(cè)效果,K值增大會(huì)讓學(xué)習(xí)模型變得簡(jiǎn)單化。KNN算法示例如圖3.1所示,KNN鄰近算法過(guò)程簡(jiǎn)述如下:(1)根據(jù)度量規(guī)則計(jì)算出測(cè)試樣本與標(biāo)記好的樣本實(shí)例之間的距離,關(guān)于常用的選取的度量有:余弦值、歐幾里得距離、相關(guān)度、曼哈頓距離;(2)根據(jù)計(jì)算出的距離,按遞增排序;(3)在排序隊(duì)列中找出距離最小的K個(gè)點(diǎn);(4)根據(jù)K個(gè)點(diǎn)出現(xiàn)類別的頻率,統(tǒng)計(jì)出頻率最高的類別作為測(cè)試樣本的被預(yù)測(cè)分類。KNN算法簡(jiǎn)單有效易實(shí)現(xiàn),但是需要計(jì)算測(cè)試樣本和已標(biāo)注好的訓(xùn)練數(shù)據(jù)集中的所有樣本的距離,所以耗費(fèi)時(shí)間較多,若數(shù)據(jù)集隨機(jī)分布,分類效果會(huì)較差。圖3.1KNN算法示例[51]對(duì)于多標(biāo)簽學(xué)習(xí)問(wèn)題,Zhang、Zhou等人在2007年提出ML-KNN算法[36-38],
【參考文獻(xiàn)】:
期刊論文
[1]論短視頻對(duì)傳統(tǒng)媒體轉(zhuǎn)型的促進(jìn)作用[J]. 萬(wàn)勇. 中國(guó)報(bào)業(yè). 2019(24)
[2]國(guó)內(nèi)短視頻發(fā)展現(xiàn)狀及問(wèn)題思考[J]. 林文婧,畢秋敏. 視聽(tīng). 2018(11)
[3]基于PageRank的用戶影響力評(píng)價(jià)改進(jìn)算法[J]. 王頂,徐軍,段存玉,吳玥瑤,孫靜. 哈爾濱工業(yè)大學(xué)學(xué)報(bào). 2018(05)
[4]ML-kNN算法在大數(shù)據(jù)集上的高效應(yīng)用[J]. 陸凱,徐華. 計(jì)算機(jī)工程與應(yīng)用. 2019(01)
[5]一種改進(jìn)PageRank的微博用戶影響力計(jì)算方法[J]. 鄭遠(yuǎn)飛,陳曉升,王志文,陳堅(jiān)旋,陳珂. 廣東石油化工學(xué)院學(xué)報(bào). 2016(03)
[6]如何用SPSS快速計(jì)算主成分的結(jié)果[J]. 林海明. 統(tǒng)計(jì)與決策. 2011(12)
[7]支持向量機(jī)理論與算法研究綜述[J]. 丁世飛,齊丙娟,譚紅艷. 電子科技大學(xué)學(xué)報(bào). 2011(01)
[8]如何正確應(yīng)用SPSS軟件做主成分分析[J]. 李小勝,陳珍珍. 統(tǒng)計(jì)研究. 2010(08)
[9]統(tǒng)計(jì)分析在學(xué)生成績(jī)?cè)u(píng)估中的應(yīng)用[J]. 蘇斌,謝友芹. 系統(tǒng)工程理論與實(shí)踐. 2006(07)
[10]BP人工神經(jīng)網(wǎng)絡(luò)用于肺鱗癌預(yù)后預(yù)測(cè)[J]. 黃德生,周寶森,劉延齡,魏慶琤,李金榮. 中國(guó)衛(wèi)生統(tǒng)計(jì). 2000(06)
博士論文
[1]多標(biāo)簽數(shù)據(jù)分類技術(shù)研究[D]. 劉陽(yáng).西安電子科技大學(xué) 2018
[2]基于用戶行為的信任感知推薦方法研究[D]. 張亞楠.哈爾濱工程大學(xué) 2014
碩士論文
[1]基于標(biāo)簽特征和相關(guān)性的多標(biāo)簽分類研究[D]. 李鋒.西安電子科技大學(xué) 2019
[2]基于SVM的多示例多標(biāo)簽網(wǎng)頁(yè)分類[D]. 朱紅波.中國(guó)石油大學(xué)(華東) 2017
[3]基于標(biāo)簽相關(guān)性和三層BP神經(jīng)網(wǎng)絡(luò)的多標(biāo)簽分類算法研究[D]. 廖麗芳.廈門大學(xué) 2017
[4]基于主成分分析與因子分析數(shù)學(xué)模型的應(yīng)用研究[D]. 解素雯.山東理工大學(xué) 2016
[5]基于有效粉絲的用戶影響力計(jì)算的研究與實(shí)現(xiàn)[D]. 王焱楠.西安電子科技大學(xué) 2015
[6]基于社區(qū)熱度的開(kāi)源軟件排序關(guān)鍵技術(shù)研究[D]. 范強(qiáng).國(guó)防科學(xué)技術(shù)大學(xué) 2015
[7]微博社會(huì)網(wǎng)絡(luò)構(gòu)造與分析技術(shù)研究[D]. 陸毅.復(fù)旦大學(xué) 2011
[8]基于用戶行為及關(guān)系的社交網(wǎng)絡(luò)節(jié)點(diǎn)影響力評(píng)價(jià)[D]. 康書龍.北京郵電大學(xué) 2011
[9]BP神經(jīng)網(wǎng)絡(luò)在土地利用分類中的應(yīng)用分析[D]. 孟治國(guó).吉林大學(xué) 2004
本文編號(hào):3317430
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/3317430.html
最近更新
教材專著