短視頻偏好率預(yù)測(cè)方法的研究與應(yīng)用
發(fā)布時(shí)間:2023-05-11 04:20
隨著無線通信技術(shù)的飛速發(fā)展,以智能手機(jī)、平板為代表的各類智能化移動(dòng)終端的不斷普及,移動(dòng)互聯(lián)網(wǎng)廣告行業(yè)得到了迅猛的發(fā)展,尤其是移動(dòng)短視頻廣告。短視頻偏好率(Like-Through Rate,LTR)是衡量企業(yè)移動(dòng)短視頻進(jìn)行廣告投放效果的重要指標(biāo)。通過對(duì)移動(dòng)短視頻廣告的分析和預(yù)測(cè),不僅能夠讓用戶瀏覽到自己喜歡的視頻,改善用戶體驗(yàn),還能輔助廣告主合理使用預(yù)算,將廣告精準(zhǔn)傳遞給目標(biāo)人群,同時(shí)提高移動(dòng)媒體的網(wǎng)站收益。近年來,點(diǎn)擊率和偏好率預(yù)測(cè)等相關(guān)問題的研究已取得很大的進(jìn)展。目前工業(yè)上應(yīng)用最廣泛的預(yù)測(cè)方法是邏輯回歸(Logistic Regression,LR)。LR具有簡(jiǎn)單、易于實(shí)現(xiàn)大規(guī)模實(shí)時(shí)并行處理等優(yōu)點(diǎn),然而,線性模型的學(xué)習(xí)能力有限,無法捕獲高階特征所攜帶的信息,從而限制了LR的預(yù)測(cè)性能。而短視頻用戶偏好率預(yù)測(cè)往往面臨數(shù)據(jù)量大,數(shù)據(jù)特征維度多,數(shù)據(jù)多主題等問題,如何從不同主題、不同特征維度及特征組合中獲取有價(jià)值的高階信息對(duì)于短視頻提升廣告平臺(tái)價(jià)值是非常重要的。基于上述問題,本文的主要研究?jī)?nèi)容如下:(1)對(duì)目前經(jīng)典點(diǎn)擊率預(yù)估模型LR、GBDT、FM及變體XGBoost、FFM進(jìn)行研究,通過...
【文章頁數(shù)】:64 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
ABSTRACT
第一章 緒論
1.1 研究背景及意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.3 主要的研究?jī)?nèi)容
1.4 本文的章節(jié)安排
第二章 相關(guān)理論研究
2.1 偏好率預(yù)估建模流程
2.2 特征工程
2.2.1 特征預(yù)處理
2.2.2 特征處理方法
2.2.3 特征選擇方法
2.3 集成學(xué)習(xí)的原理
2.3.1 Bagging算法
2.3.2 Boosting算法
2.3.3 Stacking算法
2.4 LDA主題模型
2.5 本章小結(jié)
第三章 基于特征組合的偏好率預(yù)估模型研究
3.1 基線偏好率預(yù)估模型研究
3.1.1 廣義線性回歸
3.1.2 因子分解機(jī)與域感知因子分解機(jī)
3.1.3 梯度提升樹與極限梯度提升機(jī)
3.2 基于融合模型的短視頻偏好率預(yù)測(cè)模型研究
3.3 基于主題模型的短視頻偏好率預(yù)測(cè)模型研究
3.3.1 LDA算法建模生成不同主題的子訓(xùn)練集
3.3.2 利用GBDT提取高影響力的特征
3.3.3 訓(xùn)練不同主題下的偏好率預(yù)測(cè)模型
3.3.4 短視頻偏好率預(yù)測(cè)
3.4 本章小結(jié)
第四章 實(shí)驗(yàn)結(jié)果及分析
4.1 實(shí)驗(yàn)環(huán)境及數(shù)據(jù)集介紹
4.1.1 實(shí)驗(yàn)環(huán)境
4.1.2 數(shù)據(jù)集介紹
4.2 數(shù)據(jù)預(yù)處理和特征提取的總流程
4.2.1 數(shù)據(jù)探索性分析
4.2.2 特征庫的設(shè)計(jì)
4.3 模型選擇及模型評(píng)價(jià)的介紹
4.3.1 模型選擇
4.3.2 評(píng)價(jià)指標(biāo)
4.4 對(duì)比實(shí)驗(yàn)
4.4.1 樹棵數(shù)和樹深度的設(shè)定
4.4.2 主題個(gè)數(shù)對(duì)偏好率預(yù)測(cè)的影響
4.4.3 LDA、XGBoost和 FFM融合前后的模型性能對(duì)比
4.5 本章小結(jié)
第五章 總結(jié)與展望
參考文獻(xiàn)
攻讀學(xué)位期間的研究成果
致謝
本文編號(hào):3814148
【文章頁數(shù)】:64 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
ABSTRACT
第一章 緒論
1.1 研究背景及意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.3 主要的研究?jī)?nèi)容
1.4 本文的章節(jié)安排
第二章 相關(guān)理論研究
2.1 偏好率預(yù)估建模流程
2.2 特征工程
2.2.1 特征預(yù)處理
2.2.2 特征處理方法
2.2.3 特征選擇方法
2.3 集成學(xué)習(xí)的原理
2.3.1 Bagging算法
2.3.2 Boosting算法
2.3.3 Stacking算法
2.4 LDA主題模型
2.5 本章小結(jié)
第三章 基于特征組合的偏好率預(yù)估模型研究
3.1 基線偏好率預(yù)估模型研究
3.1.1 廣義線性回歸
3.1.2 因子分解機(jī)與域感知因子分解機(jī)
3.1.3 梯度提升樹與極限梯度提升機(jī)
3.2 基于融合模型的短視頻偏好率預(yù)測(cè)模型研究
3.3 基于主題模型的短視頻偏好率預(yù)測(cè)模型研究
3.3.1 LDA算法建模生成不同主題的子訓(xùn)練集
3.3.2 利用GBDT提取高影響力的特征
3.3.3 訓(xùn)練不同主題下的偏好率預(yù)測(cè)模型
3.3.4 短視頻偏好率預(yù)測(cè)
3.4 本章小結(jié)
第四章 實(shí)驗(yàn)結(jié)果及分析
4.1 實(shí)驗(yàn)環(huán)境及數(shù)據(jù)集介紹
4.1.1 實(shí)驗(yàn)環(huán)境
4.1.2 數(shù)據(jù)集介紹
4.2 數(shù)據(jù)預(yù)處理和特征提取的總流程
4.2.1 數(shù)據(jù)探索性分析
4.2.2 特征庫的設(shè)計(jì)
4.3 模型選擇及模型評(píng)價(jià)的介紹
4.3.1 模型選擇
4.3.2 評(píng)價(jià)指標(biāo)
4.4 對(duì)比實(shí)驗(yàn)
4.4.1 樹棵數(shù)和樹深度的設(shè)定
4.4.2 主題個(gè)數(shù)對(duì)偏好率預(yù)測(cè)的影響
4.4.3 LDA、XGBoost和 FFM融合前后的模型性能對(duì)比
4.5 本章小結(jié)
第五章 總結(jié)與展望
參考文獻(xiàn)
攻讀學(xué)位期間的研究成果
致謝
本文編號(hào):3814148
本文鏈接:http://sikaile.net/xinwenchuanbolunwen/3814148.html
最近更新
教材專著