天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于多分類器融合模型的展示廣告點(diǎn)擊率預(yù)估研究

發(fā)布時(shí)間:2021-02-21 09:07
  當(dāng)今互聯(lián)網(wǎng)廣告的投放的主流趨勢(shì)為“精準(zhǔn)化”投放,智能營(yíng)銷平臺(tái)積累了海量的廣告數(shù)據(jù)和用戶數(shù)據(jù),如何有效利用這些數(shù)據(jù)去預(yù)測(cè)用戶的廣告點(diǎn)擊概率,是大數(shù)據(jù)應(yīng)用在精準(zhǔn)營(yíng)銷中的關(guān)鍵問題。本文主要基于特征工程和模型構(gòu)建兩個(gè)方面,構(gòu)建展示廣告點(diǎn)擊率預(yù)測(cè)模型,對(duì)廣告主實(shí)現(xiàn)精確投放、廣告媒介追求利益最大化及提高用戶上網(wǎng)體驗(yàn)具有重要的指導(dǎo)意義。特征工程階段。首先,對(duì)廣告數(shù)據(jù)進(jìn)行一系列可視化的探索性分析,具體通過餅圖、堆積圖、箱線圖和柱形圖等,直接觀察數(shù)據(jù)集結(jié)構(gòu)和特征,初步驗(yàn)證不同類別特征的點(diǎn)擊率分布存在顯著差異。接著,對(duì)不同類型特征進(jìn)行數(shù)據(jù)清洗、特征規(guī)約和特征變換等處理,有效降低數(shù)據(jù)噪音。最后,從特征選擇、特征提取和特征構(gòu)造三個(gè)方面,對(duì)廣告素材信息、用戶信息、上下文信息以及媒體信息等多源特征進(jìn)行融合提取,獲得大量有效的特征集數(shù)據(jù),為之后的機(jī)器學(xué)習(xí)算法能夠達(dá)到更佳的性能提供可靠的基礎(chǔ)。模型構(gòu)建階段。首先,分別使用原始數(shù)據(jù)集、通過特征工程處理得到的數(shù)據(jù)集,依次訓(xùn)練Logistic回歸、XGBoost模型和LightGBM模型這三個(gè)單一算法模型,通過比較LogLoss和AUC,得到基于特征工程的LightGBM模... 

【文章來(lái)源】:上海師范大學(xué)上海市

【文章頁(yè)數(shù)】:54 頁(yè)

【學(xué)位級(jí)別】:碩士

【部分圖文】:

基于多分類器融合模型的展示廣告點(diǎn)擊率預(yù)估研究


直方圖算法示意圖

生長(zhǎng)策略,葉子


范大學(xué)碩士學(xué)位論文 第 2 章 文獻(xiàn)綜述和相4)帶深度限制的葉子生長(zhǎng)策略。LightGBM 在迭代過程中采用 Leaf長(zhǎng)策略,每次從當(dāng)前所有葉子中,找到分裂增益最大的一個(gè)葉子,此循環(huán),如圖所示。因此同 Level-wise 相比,在分裂次數(shù)相同的情wise 可以降低更多的誤差,得到更好的精度。此外,LightGBM 增加度的限制,在保證高效率的同時(shí)防止過擬合。

餅圖,樣本分布,餅圖,數(shù)據(jù)集


圖 3.1 數(shù)據(jù)集正負(fù)樣本分布餅圖由圖 3.2,可以看到 1 到 6 號(hào)連續(xù)六天的展示廣告點(diǎn)擊量占曝光量比例無(wú)顯著差異,說明不存在異常日期數(shù)據(jù)。由圖 3.3,進(jìn)一步分析不同時(shí)刻的展示廣告點(diǎn)擊率變化,發(fā)現(xiàn)展示廣告的點(diǎn)擊量波動(dòng)趨勢(shì)和曝光量波動(dòng)趨勢(shì)近似保持一致且一天中的上午 6 點(diǎn)及之前的廣告點(diǎn)擊率較低,平均點(diǎn)擊率為 15%,而上午 點(diǎn)之后的廣告點(diǎn)擊率較高,平均點(diǎn)擊率近 28%。

【參考文獻(xiàn)】:
期刊論文
[1]基于特征降維和DBN的廣告點(diǎn)擊率預(yù)測(cè)[J]. 楊長(zhǎng)春,梅佳俊,吳云,顧寰.  計(jì)算機(jī)工程與設(shè)計(jì). 2018(12)
[2]一種基于多種特征融合的人臉識(shí)別算法[J]. 楊賽,趙春霞,劉凡,陳峰.  計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào). 2017(09)
[3]模式分類中的特征融合方法[J]. 劉渭濱,鄒智元,邢薇薇.  北京郵電大學(xué)學(xué)報(bào). 2017(04)
[4]基于特征融合與分類器在線學(xué)習(xí)的目標(biāo)跟蹤算法[J]. 胡秀華,郭雷,李暉暉.  控制與決策. 2017(09)
[5]基于用戶相似度和特征分化的廣告點(diǎn)擊率預(yù)測(cè)研究[J]. 潘書敏,顏娜,謝瑾奎.  計(jì)算機(jī)科學(xué). 2017(02)
[6]廣告點(diǎn)擊率預(yù)估技術(shù)綜述[J]. 陳巧紅,余仕敏,賈宇波.  浙江理工大學(xué)學(xué)報(bào). 2015(11)
[7]基于多特征融合的深度置信網(wǎng)絡(luò)圖像分類算法[J]. 許慶勇,江順亮,黃偉,李菁,徐少平,葉發(fā)茂.  計(jì)算機(jī)工程. 2015(11)
[8]泛化誤差的各種交叉驗(yàn)證估計(jì)方法綜述[J]. 楊柳,王鈺.  計(jì)算機(jī)應(yīng)用研究. 2015(05)
[9]不平衡數(shù)據(jù)的集成分類算法綜述[J]. 李勇,劉戰(zhàn)東,張海軍.  計(jì)算機(jī)應(yīng)用研究. 2014(05)
[10]廣告點(diǎn)擊率估算技術(shù)綜述[J]. 紀(jì)文迪,王曉玲,周傲英.  華東師范大學(xué)學(xué)報(bào)(自然科學(xué)版). 2013(03)

碩士論文
[1]基于非平衡數(shù)據(jù)的集成學(xué)習(xí)分類及其應(yīng)用[D]. 周賓賓.華南理工大學(xué) 2014



本文編號(hào):3044136

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/jingjilunwen/guojimaoyilunwen/3044136.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶cf62d***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com