基于XGBoost與線性模型的在線廣告點(diǎn)擊率(CTR)預(yù)測
發(fā)布時間:2023-04-02 18:11
廣告點(diǎn)擊率預(yù)估是互聯(lián)網(wǎng)計算廣告中的關(guān)鍵環(huán)節(jié),點(diǎn)擊率預(yù)估的準(zhǔn)確性直接影響著互聯(lián)網(wǎng)公司的廣告收入。在廣告推薦系統(tǒng)中使用機(jī)器學(xué)習(xí)算法能有效提高廣告點(diǎn)擊轉(zhuǎn)化率,實(shí)現(xiàn)用戶的個性化廣告推薦,有效提高互聯(lián)網(wǎng)公司的收益,F(xiàn)在有部分互聯(lián)網(wǎng)公司還是以邏輯回歸作為他們的點(diǎn)擊率預(yù)估的主要工具,但邏輯回歸的非線性表達(dá)能力較弱,為了捕捉到數(shù)據(jù)之間的非線性關(guān)系,我們需要大量人工經(jīng)驗(yàn)特征,該過程需要花費(fèi)大量時間,但人工能力有限,很難對非線性關(guān)系完全挖掘充分。同樣的點(diǎn)擊率預(yù)估問題,換一個場景就很難推廣,并且依靠人工特征的方式也不夠智能,因此在業(yè)界出現(xiàn)了對模型改進(jìn)的嘗試。本文從邏輯回歸開始,依次介紹了XGBoost、因子分解機(jī)與場感知分解機(jī)。本文借鑒了Facebook在論文中提出的GBDT與邏輯回歸的融合模型的思路,利用GBDT的非線性擬合能力,來充分學(xué)習(xí)各個特征之間的非線性關(guān)系,將葉節(jié)點(diǎn)作為邏輯回歸的輸入來增強(qiáng)邏輯回歸的擬合能力。本文創(chuàng)新點(diǎn)在于對這一方法進(jìn)行進(jìn)一步改進(jìn),使用GBDT模型的改進(jìn)版本XGBoost,以增加模型的精度與運(yùn)算速度。同時本文使用邏輯回歸的改進(jìn)模型因子分解機(jī)與場感知分解機(jī)以進(jìn)一步加強(qiáng)模型的非線性擬合...
【文章頁數(shù)】:53 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 研究背景
1.2 國內(nèi)外發(fā)展現(xiàn)狀
1.3 本文主要研究的內(nèi)容與創(chuàng)新點(diǎn)
1.4 論文的內(nèi)容組織
第二章 基于統(tǒng)計的推薦算法
2.1 基于內(nèi)容的算法
2.2 基于領(lǐng)域的算法
2.2.1 基于用戶的協(xié)同過濾算法
2.2.2 基于物品的協(xié)同過濾算法
2.3 本章小結(jié)
第三章 基于統(tǒng)計學(xué)習(xí)的點(diǎn)擊預(yù)測
3.1 基于矩陣分解的推薦算法
3.2 邏輯回歸(Logisticregression)
3.3 XGBoost
3.4 因子分解機(jī)(FactorizationMachine)
3.5 場感知分解機(jī)(Field-awareFactorizationMachine)
3.6 基于XGBoost模型的自編碼與線性模型結(jié)合方法
3.7 本章小結(jié)
第四章 實(shí)驗(yàn)與分析
4.1 數(shù)據(jù)集基本面分析
4.2 統(tǒng)計類特征
4.2.1 用戶特征
4.2.2 商戶特征
4.3 交叉特征
4.4 個性化特征
4.5 ID類特征
4.6 評價指標(biāo)
4.6.1 ROC曲線與AUC
4.7 模型與效果分析
4.8 本章小結(jié)
第五章 總結(jié)與展望
參考文獻(xiàn)
致謝
本文編號:3779699
【文章頁數(shù)】:53 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 研究背景
1.2 國內(nèi)外發(fā)展現(xiàn)狀
1.3 本文主要研究的內(nèi)容與創(chuàng)新點(diǎn)
1.4 論文的內(nèi)容組織
第二章 基于統(tǒng)計的推薦算法
2.1 基于內(nèi)容的算法
2.2 基于領(lǐng)域的算法
2.2.1 基于用戶的協(xié)同過濾算法
2.2.2 基于物品的協(xié)同過濾算法
2.3 本章小結(jié)
第三章 基于統(tǒng)計學(xué)習(xí)的點(diǎn)擊預(yù)測
3.1 基于矩陣分解的推薦算法
3.2 邏輯回歸(Logisticregression)
3.3 XGBoost
3.4 因子分解機(jī)(FactorizationMachine)
3.5 場感知分解機(jī)(Field-awareFactorizationMachine)
3.6 基于XGBoost模型的自編碼與線性模型結(jié)合方法
3.7 本章小結(jié)
第四章 實(shí)驗(yàn)與分析
4.1 數(shù)據(jù)集基本面分析
4.2 統(tǒng)計類特征
4.2.1 用戶特征
4.2.2 商戶特征
4.3 交叉特征
4.4 個性化特征
4.5 ID類特征
4.6 評價指標(biāo)
4.6.1 ROC曲線與AUC
4.7 模型與效果分析
4.8 本章小結(jié)
第五章 總結(jié)與展望
參考文獻(xiàn)
致謝
本文編號:3779699
本文鏈接:http://sikaile.net/jingjilunwen/jingjiguanlilunwen/3779699.html
最近更新
教材專著