基于行為和視頻評論的移動用戶畫像
發(fā)布時間:2021-05-19 02:54
隨著移動互聯(lián)網(wǎng)的發(fā)展,越來越多的用戶通過移動終端,使用數(shù)據(jù)流量觀看視頻。用戶在觀看移動視頻的同時,產(chǎn)生了大量的行為數(shù)據(jù)。從用戶的行為數(shù)據(jù)中分析用戶的屬性信息,挖掘用戶的興趣和偏好,會幫助網(wǎng)絡運營商和視頻提供商改進服務質(zhì)量。本文提出了一種基于用戶行為數(shù)據(jù)和視頻評論文本的移動用戶畫像構(gòu)建方案。該方案不依賴特征工程準確預測用戶的個人屬性,并且設計了層次標簽體系描述用戶的興趣偏好。提出了一種共嵌入注意力網(wǎng)絡模型用于預測用戶的年齡和性別。該模型首先分別從用戶觀看記錄和視頻評論文檔中,學習視頻的觀看向量和評論向量;之后結(jié)合兩個向量作為視頻特征,并引入注意力機制,構(gòu)建共嵌入注意力網(wǎng)絡;最后將用戶的視頻觀看記錄輸入到網(wǎng)絡中預測用戶的屬性信息。在性別預測和年齡預測兩個任務中,共嵌入注意力網(wǎng)絡分別取得了91.6%和56.4%的F1-score。提出了一種視頻的粗粒度標簽獲取算法。該算法構(gòu)建了層次注意力網(wǎng)絡,學習評論文本中單詞和評論的權(quán)重;最后預測所有標簽的置信度并確定視頻的一級標簽。此外還提出了基于文檔重構(gòu)的樣本均衡法,解決樣本分布不均衡問題的同時利用了更多的文本信息。視頻粗粒度標簽獲取算法在標簽推薦任務...
【文章來源】:浙江大學浙江省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:76 頁
【學位級別】:碩士
【文章目錄】:
致謝
摘要
Abstract
第1章 緒論
1.1 研究背景
1.2 研究現(xiàn)狀
1.2.1 用戶屬性畫像的研究現(xiàn)狀
1.2.2 標簽推薦算法的研究現(xiàn)狀
1.3 論文的主要研究內(nèi)容
1.4 論文的組織結(jié)構(gòu)
第2章 數(shù)據(jù)集
2.1 移動視頻用戶數(shù)據(jù)
2.1.1 移動端用戶視頻觀看數(shù)據(jù)
2.1.2 移動端用戶屬性特征數(shù)據(jù)
2.2 視頻文本數(shù)據(jù)
第3章 移動視頻用戶屬性畫像
3.1 視頻特征向量訓練
3.1.1 基于skip-gram和用戶觀看序列的視頻嵌入
3.1.2 基于Doc2Vec和視頻評論文本的視頻嵌入
3.1.3 視頻特征向量生成
3.1.4 用戶特征畫像構(gòu)建
3.2 共嵌入注意力網(wǎng)絡
3.2.1 網(wǎng)絡模型框架
3.2.2 門控循環(huán)單元
3.2.3 注意力機制層
3.2.4 全連接輸出層
3.3 實驗設置和結(jié)果分析
3.3.1 實驗設置
3.3.2 實驗結(jié)果與分析
3.3.3 視頻嵌入對比實驗
3.3.4 注意力機制可視化
3.4 本章小結(jié)
第4章 移動視頻用戶興趣畫像
4.1 基于層次注意力網(wǎng)絡的視頻一級標簽分類
4.1.1 基于文檔重構(gòu)的樣本均衡
4.1.2 層次注意力網(wǎng)絡
4.1.3 基準模型介紹
4.1.4 實驗設置與結(jié)果分析
4.2 基于融合標簽抽取算法的視頻二級標簽提取
4.2.1 基于TF-IDF的關(guān)鍵詞提取
4.2.2 基于Text Rank的關(guān)鍵詞提取
4.2.3 基于融合標簽抽取算法的關(guān)鍵詞提取
4.3 基于視頻層次標簽體系的用戶興趣畫像構(gòu)建
4.4 本章小結(jié)
第5章 總結(jié)與展望
5.1 總結(jié)
5.2 展望
參考文獻
攻讀碩士學位期間主要的研究成果
作者簡歷
本文編號:3194974
【文章來源】:浙江大學浙江省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:76 頁
【學位級別】:碩士
【文章目錄】:
致謝
摘要
Abstract
第1章 緒論
1.1 研究背景
1.2 研究現(xiàn)狀
1.2.1 用戶屬性畫像的研究現(xiàn)狀
1.2.2 標簽推薦算法的研究現(xiàn)狀
1.3 論文的主要研究內(nèi)容
1.4 論文的組織結(jié)構(gòu)
第2章 數(shù)據(jù)集
2.1 移動視頻用戶數(shù)據(jù)
2.1.1 移動端用戶視頻觀看數(shù)據(jù)
2.1.2 移動端用戶屬性特征數(shù)據(jù)
2.2 視頻文本數(shù)據(jù)
第3章 移動視頻用戶屬性畫像
3.1 視頻特征向量訓練
3.1.1 基于skip-gram和用戶觀看序列的視頻嵌入
3.1.2 基于Doc2Vec和視頻評論文本的視頻嵌入
3.1.3 視頻特征向量生成
3.1.4 用戶特征畫像構(gòu)建
3.2 共嵌入注意力網(wǎng)絡
3.2.1 網(wǎng)絡模型框架
3.2.2 門控循環(huán)單元
3.2.3 注意力機制層
3.2.4 全連接輸出層
3.3 實驗設置和結(jié)果分析
3.3.1 實驗設置
3.3.2 實驗結(jié)果與分析
3.3.3 視頻嵌入對比實驗
3.3.4 注意力機制可視化
3.4 本章小結(jié)
第4章 移動視頻用戶興趣畫像
4.1 基于層次注意力網(wǎng)絡的視頻一級標簽分類
4.1.1 基于文檔重構(gòu)的樣本均衡
4.1.2 層次注意力網(wǎng)絡
4.1.3 基準模型介紹
4.1.4 實驗設置與結(jié)果分析
4.2 基于融合標簽抽取算法的視頻二級標簽提取
4.2.1 基于TF-IDF的關(guān)鍵詞提取
4.2.2 基于Text Rank的關(guān)鍵詞提取
4.2.3 基于融合標簽抽取算法的關(guān)鍵詞提取
4.3 基于視頻層次標簽體系的用戶興趣畫像構(gòu)建
4.4 本章小結(jié)
第5章 總結(jié)與展望
5.1 總結(jié)
5.2 展望
參考文獻
攻讀碩士學位期間主要的研究成果
作者簡歷
本文編號:3194974
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3194974.html
最近更新
教材專著