基于移動(dòng)用戶觀影記錄的推薦系統(tǒng)研究
發(fā)布時(shí)間:2021-12-11 08:59
隨著移動(dòng)設(shè)備的廣泛使用以及視頻網(wǎng)站資源的海量增長,移動(dòng)端觀影越來越流行。移動(dòng)設(shè)備觀看影片具有受時(shí)間、地點(diǎn)影響小,成本低等優(yōu)點(diǎn),但是爆炸式增長的影片資源使得用戶難以快速做出有效、準(zhǔn)確的觀影選擇。因此,建立個(gè)性化視頻推薦系統(tǒng)給予用戶優(yōu)質(zhì)的觀影服務(wù)是提高用戶的滿意度和視頻網(wǎng)站的收入的關(guān)鍵。針對(duì)上述問題,本文基于運(yùn)營商提供的用戶觀影記錄和網(wǎng)絡(luò)影片內(nèi)容信息對(duì)于用戶移動(dòng)觀影行為進(jìn)行研究,取得以下創(chuàng)新性成果:提出一種基于影片客觀信息的電影評(píng)分類別預(yù)測方法。利用知識(shí)圖譜和自然語言處理領(lǐng)域方法處理影片結(jié)構(gòu)化信息和簡介信息,并使用深度神經(jīng)網(wǎng)絡(luò)自動(dòng)學(xué)習(xí)信息向量特征構(gòu)建評(píng)分類別預(yù)測模型。在電影評(píng)分三分類預(yù)測問題上取得62.1%的準(zhǔn)確率和63.9%的F1-micro值,性能優(yōu)于未改進(jìn)的Trans R方法和單一信息源模型。最后該模型成功實(shí)現(xiàn)“新影片”的評(píng)分預(yù)測,有效解決新影片評(píng)分“冷啟動(dòng)”問題。提出一種結(jié)合用戶觀影記錄和影片內(nèi)容信息的混合推薦模型。該模型在傳統(tǒng)協(xié)同過濾方法的基礎(chǔ)上,加入了影片結(jié)構(gòu)化信息、影片簡介信息和影片評(píng)論信息等輔助信息,并且利用注意力機(jī)制處理不同用戶評(píng)論。上述信息特征由神經(jīng)網(wǎng)絡(luò)自動(dòng)學(xué)習(xí),無需手...
【文章來源】:浙江大學(xué)浙江省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:67 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
《復(fù)仇者聯(lián)盟3》影片結(jié)構(gòu)化數(shù)據(jù)
浙江大學(xué)碩士學(xué)位論文數(shù)據(jù)獲取及數(shù)據(jù)集8圖2.2《復(fù)仇者聯(lián)盟3》影片結(jié)構(gòu)化數(shù)據(jù)2.2.2影片簡介數(shù)據(jù)影片的簡介通常表達(dá)了影片的主題。如果可以把影片看成講述一個(gè)故事,那么簡介內(nèi)容就是對(duì)于“故事性”的最精煉描述。以影片《復(fù)仇者聯(lián)盟3》為例,如圖2.3所示,簡介介紹了《復(fù)仇者聯(lián)盟3》的故事背景以及主要故事線,是對(duì)于影片內(nèi)容描述的重要語料來源。圖2.3《復(fù)仇者聯(lián)盟3》影片簡介2.2.3影片評(píng)論數(shù)據(jù)影片社區(qū)網(wǎng)站的每一部影片都有很多用戶關(guān)于這部影片的評(píng)價(jià)信息,分為長評(píng)和短評(píng),這個(gè)部分的信息可以作為用戶對(duì)于影片的情感分析的語料來源以及影片內(nèi)容的主觀描述。本文主要使用短評(píng),以《復(fù)仇者聯(lián)盟3》為例,如圖2.4所示,用戶的短評(píng)包含了用戶觀影的情感傾向,用以分析用戶的觀影行為從而可以
浙江大學(xué)碩士學(xué)位論文數(shù)據(jù)獲取及數(shù)據(jù)集9更精準(zhǔn)的進(jìn)行影片推薦。一共獲得了58萬部影片的評(píng)論條數(shù)總計(jì)2200萬條,部分熱門影片評(píng)論條數(shù)較多,也存在很多影片沒有評(píng)論的情況。圖2.4《復(fù)仇者聯(lián)盟3》影片短評(píng)數(shù)據(jù)2.3觀影數(shù)據(jù)集本文數(shù)據(jù)來源于運(yùn)營商用戶某一個(gè)月的觀影記錄,觀影人數(shù)共一千多萬,影片數(shù)目近三萬部,觀影交互記錄共五千余萬條。平均每個(gè)用戶的觀影記錄約為4條,這說明大多數(shù)人并不是每天都會(huì)進(jìn)行移動(dòng)端觀影行為。若研究全部數(shù)據(jù),其中很多不活躍的用戶和影片會(huì)造成推薦的“冷啟動(dòng)”問題,且生成的“用戶-影片”交互矩陣十分龐大和稀疏,計(jì)算量巨大。因此利用Spark計(jì)算框架[36]篩選出觀影最頻繁的5000名用戶和1000部電影生成觀影數(shù)據(jù)集。通過研究交互頻繁的用戶和影片來代表整體的觀影傾向并做出推薦。最終結(jié)合影片信息的觀影數(shù)據(jù)集統(tǒng)計(jì)于表2.1所示。
【參考文獻(xiàn)】:
期刊論文
[1]融媒體時(shí)代電影評(píng)分對(duì)電影傳播的影響[J]. 高路. 電影文學(xué). 2018(19)
[2]基于網(wǎng)絡(luò)用戶評(píng)論的評(píng)分預(yù)測模型研究[J]. 張紅麗,劉濟(jì)郢,楊斯楠,徐健. 數(shù)據(jù)分析與知識(shí)發(fā)現(xiàn). 2017(08)
本文編號(hào):3534389
【文章來源】:浙江大學(xué)浙江省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:67 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
《復(fù)仇者聯(lián)盟3》影片結(jié)構(gòu)化數(shù)據(jù)
浙江大學(xué)碩士學(xué)位論文數(shù)據(jù)獲取及數(shù)據(jù)集8圖2.2《復(fù)仇者聯(lián)盟3》影片結(jié)構(gòu)化數(shù)據(jù)2.2.2影片簡介數(shù)據(jù)影片的簡介通常表達(dá)了影片的主題。如果可以把影片看成講述一個(gè)故事,那么簡介內(nèi)容就是對(duì)于“故事性”的最精煉描述。以影片《復(fù)仇者聯(lián)盟3》為例,如圖2.3所示,簡介介紹了《復(fù)仇者聯(lián)盟3》的故事背景以及主要故事線,是對(duì)于影片內(nèi)容描述的重要語料來源。圖2.3《復(fù)仇者聯(lián)盟3》影片簡介2.2.3影片評(píng)論數(shù)據(jù)影片社區(qū)網(wǎng)站的每一部影片都有很多用戶關(guān)于這部影片的評(píng)價(jià)信息,分為長評(píng)和短評(píng),這個(gè)部分的信息可以作為用戶對(duì)于影片的情感分析的語料來源以及影片內(nèi)容的主觀描述。本文主要使用短評(píng),以《復(fù)仇者聯(lián)盟3》為例,如圖2.4所示,用戶的短評(píng)包含了用戶觀影的情感傾向,用以分析用戶的觀影行為從而可以
浙江大學(xué)碩士學(xué)位論文數(shù)據(jù)獲取及數(shù)據(jù)集9更精準(zhǔn)的進(jìn)行影片推薦。一共獲得了58萬部影片的評(píng)論條數(shù)總計(jì)2200萬條,部分熱門影片評(píng)論條數(shù)較多,也存在很多影片沒有評(píng)論的情況。圖2.4《復(fù)仇者聯(lián)盟3》影片短評(píng)數(shù)據(jù)2.3觀影數(shù)據(jù)集本文數(shù)據(jù)來源于運(yùn)營商用戶某一個(gè)月的觀影記錄,觀影人數(shù)共一千多萬,影片數(shù)目近三萬部,觀影交互記錄共五千余萬條。平均每個(gè)用戶的觀影記錄約為4條,這說明大多數(shù)人并不是每天都會(huì)進(jìn)行移動(dòng)端觀影行為。若研究全部數(shù)據(jù),其中很多不活躍的用戶和影片會(huì)造成推薦的“冷啟動(dòng)”問題,且生成的“用戶-影片”交互矩陣十分龐大和稀疏,計(jì)算量巨大。因此利用Spark計(jì)算框架[36]篩選出觀影最頻繁的5000名用戶和1000部電影生成觀影數(shù)據(jù)集。通過研究交互頻繁的用戶和影片來代表整體的觀影傾向并做出推薦。最終結(jié)合影片信息的觀影數(shù)據(jù)集統(tǒng)計(jì)于表2.1所示。
【參考文獻(xiàn)】:
期刊論文
[1]融媒體時(shí)代電影評(píng)分對(duì)電影傳播的影響[J]. 高路. 電影文學(xué). 2018(19)
[2]基于網(wǎng)絡(luò)用戶評(píng)論的評(píng)分預(yù)測模型研究[J]. 張紅麗,劉濟(jì)郢,楊斯楠,徐健. 數(shù)據(jù)分析與知識(shí)發(fā)現(xiàn). 2017(08)
本文編號(hào):3534389
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3534389.html
最近更新
教材專著